No se conoce con precisión su origen, tan sólo que es una de las lenguas más antiguas de Europa. El euskera y la inteligencia artificial pueden representan las dos caras de una misma moneda; el pasado remoto y el futuro, otrora casi inimaginable, que ya se asienta en el presente. En las autoridades vascas hace años que los avances tecnológicos preocupan por el impacto negativo que pueden tener en el desarrollo y expansión del euskera.

Primero fue Internet, después las plataformas audiovisuales y ahora la inteligencia artificial. En esos ámbitos en los que el control y el impulso tecnológico está lejos de dar peso a las lenguas minoritarias y eleva el riesgo de que idiomas como el euskera puedan quedar enterrados. Por ello, el Gobierno vasco ha puesto en marcha una campaña para "enseñar a las máquinas a hablar euskera".

La iniciativa que estos días se difunde por los medios de comunicación en forma de campaña publicitaria llama a la ciudadanía a dejar registrada su voz en euskera y a aportar contenido lingüístico para ir construyendo una suerte de banco del euskera. Desde el Gobierno vasco se recuerda que la tecnología requiere de una gran masa de datos textuales y orales para garantizar la presencia de un idioma en el ámbito digital. Por ello, se llama a la ciudadanía a participar en la campaña 'Gaitu', bajo el lema "Unamos nuestras voces": "A más voces y grabaciones, más amplio será el banco de datos, el material con el que trabajarán las nuevas tecnologías", recuerdan desde el Gobierno.

Miles de voces y horas de grabación

El reto es lograr miles de voces, miles de horas de grabación en euskera. Se busca que la tecnología también pueda desarrollarse en euskera y que aplicaciones cotidianas en otros idiomas, como los mensajes dictados al móvil, las instrucciones al navegador del vehículo o las órdenes a dispositivos tecnológicos también puedan expresarse en euskera.

Este no es el único proyecto de estas características que está en marcha. La Administración vasca cuenta con un Plan de Acción de las Tecnologías de la Lengua, que fue aprobado el año pasado e incluye herramientas como un "traductor neuronal" o investigaciones y desarrollo con la Universidad de País Vasco para poder detectar de modo inmediato niveles de competencia lingüística de euskera gracias a la inteligencia artificial.

Actualmente la Universidad Pública Vasca (UPV) trabaja en el desarrollo de un modelo basado en la inteligencia artificial, conocido como 'Latxa' -en referencia a la oveja-, basado en técnicas de aprendizaje automático y que podría permitir "comprender y generar lenguaje humano" gracias a una base de datos masivos.

Inteligencia artificial

El rendimiento de las aplicaciones similares ahora existente en el caso del euskera es muy reducido por la falta de recursos y registros, lo que dificulta el uso de herramientas como ChatGPT en euskera. Esa insuficiente dotación de recursos lingüísticos a los que la tecnología puede acceder es la que se quiere poder mitigar registrando voces y textos.

El Centro Vasco de Tecnologías del Lenguaje de la UPV trabaja con un modelo basado en 1,7 millones de textos en euskera y 288 millones de palabras. Un material recabado a través de una treintena de páginas web con contenido de calidad en euskera.