El Cenid usa la inteligencia artificial para la supervivencia digital de las lenguas minoritarias en Europa

Expertos de los grupos de trabajo para el impulso en internet del valenciano, el catalán, el euskera y el gallego intercambian experiencias en la Universidad de Alicante

Un momento de la ponencia de Nuria Oliver durante las jornadas de trabajo que han empezado hoy.

Un momento de la ponencia de Nuria Oliver durante las jornadas de trabajo que han empezado hoy. / David Revenga

J. A. Martínez

J. A. Martínez

Un Google Maps que entienda el valenciano, un Chat GPT al que se le pueda hablar en gallego. Un mundo digital donde las lenguas minoritarias no queden arrinconadas. Éste es el objetivo del grupo de trabajo en el que se ha integrado el Centro de Inteligencia Digital de Alicante (Cenid), que trabaja por la pervivencia de las lenguas oficiales del Estado en el mundo digital, donde el inglés es hegemónico. Los distintos grupos que forman parte del equipo celebran esta semana una reunión de trabajo para coordinar estrategias en pro de este objetivo común.

El director del Cenid, Manuel Palomar, ha sido el encargado de darles la bienvenida esta mañana en la reunión celebrada en la Villa Universitaria. "Hemos alcanzado una velocidad de crucero impresionante y pronto instalaremos el super ordenador Marenostrum 5". Dijo. El Cenid trabaja en la implantación del valenciano en el mundo digital y que las máquinas lo entiendan cuando les hablan en ese idioma. Y para ello, se ha formado esta alianza con otras lenguas oficiales del Estado. Una estrategia que podrá ser utilizada por otras lenguas minoritarias en toda Europa, donde se hablan más de ochenta idiomas.

Enseñar estos idiomas a la inteligencia artificial para acometer la traducción de textos, reconocedores de voz que pasen a texto lo que escuchan y viceversa, usar una voz digitalizada que lea el texto que le han escrito. En los distintos grupos de trabajo se dan la mano el valenciano (proyecto Vives), el catalán (proyecto Ilena), el euskera (Gaite) y el gallego (Nós), pero sus responsables aseguran que el objetivo es que sus métodos de trabajo se puedan aplicar para cualquier idioma, desde el propio castellano a las lenguas minoritarias de la Unión Europea.

Marta Villegas, coordinadora del proyecto Ilenia y

Marta Villegas, coordinadora del proyecto Ilenia e investigadora del Barcelona Supercomputing Center. / David Revenga

"Se nos han acercado checos y galeses, interesados en conocer cómo nos estamos moviendo, para emular nuestra experiencia", aseguró a este diario Marta Villegas, coordinadora del proyecto Ilena y dotado con 6,5 millones para la persistencia del catalán en las redes. Villegas, investigadora del Barcelona Supercomputing Center, aseguró a este diario que aunque el catalán parte de una situación con mayor volumen de recursos que otras lenguas, pero "lo que hemos aprendido se puede aplicar al resto con mayor facilidad. Hemos aprendido en cuestiones tecnológicas y también legales, decisión de datos, y estrategias para llegar a grandes proveedores". 

"Si nos acostumbramos a que a las máquinas tengamos que hablarles en inglés habremos, perdido un rol importantísimo", señaló. El intenso trabajo realizado ya empieza a tener sus frutos, como una fuerte presencia del catalán en la Wikipedia y grandes proyectos de voz en internet cuentan con el catalán. "Hace dos años era impensable interactuar con Google Maps en catalán", señaló. A juicio de Villegas, "el multilingüismo es una realidad que tenemos que afrontar".

Senen Gallego, director del centro de investigación Citius de la Universidad de Santiago.

Senen Gallego, director del proyecto Nós y del centro de investigación Citius de la Universidad de Santiago. / David Revenga

Desde la Universidad de Santiago de Compostela, el director del Centro de Investigación Citius, Senen Barro, afirmó a este periódico que "cada vez más la interacción del lenguaje natural es con máquinas. Si nuestras lenguas no están ahí, si no se incorporan a la economía digital, tienen más riesgo de debilitarse y desaparecer". Sin embargo, señaló que este mundo digital que pende sobre ellas como una espada de Damocles, puede también servir para que tengamos recursos para hacer valer nuestras lenguas y proyectarlas al mundo". En estos momentos, recalcó que el gallego es una de las lenguas con menos recursos tecnológicos en Europa, "estamos en la parte de cola, con recursos fragmentados y escasos", aunque con su integración en este proyecto "empezamos a recibir recursos".

Aunque hay posibilidad de manejarse en Chat GPT en gallego, "sus respuestas son muy limitadas". Por este motivo, uno de los objetivos últimos de esta iniciativa es la de "no depender tecnológicamente de los oligopolios de grandes multinacionales. No queremos que nuestras lenguas estén vistas con la visión de otros, en vez de la nuestra, que no nos entiendan". Con este objetivo común, estas lenguas tratan de diseñar su estrategia digital.

Apertura de las jornadas

 La sesión de trabajo contó con dos ponencias de expertas en inteligencia artificial. Por un lado, la secretaria general de la UA y catedrática de Derecho Mercantil Nuria Fernández que incidió en que el Derecho no viene a poner problemas a la inteligencia artificial, sino que era un medio para que la finalidad de que los datos fluyan para alimentar los algoritmos se haga con garantías. Por su parte, la directora de la Fundación Ellis de Alicante, Nuria Oliver, subrayó el impacto de esta tecnología para el bien social y en cómo el uso de esos datos pueden tener un impacto positivo, aunque hizo un repaso sobre algunos de los riesgos, como los sesgos que introducen los propios algoritmos.