La Real Academia Española lleva años advirtiendo que el español vive una paradoja: es una de las lenguas más habladas del mundo, pero ocupa una ... posición marginal en el universo digital. Conscientes de esta brecha creciente, los académicos han intensificado su labor para que la lengua no quede rezagada en un entorno cada vez más dominado por algoritmos y modelos de inteligencia artificial.

Ese esfuerzo cristaliza en LEIA, un proyecto que busca modernizar las herramientas lingüísticas, dotarlas de capacidades tecnológicas y asegurar que el español tenga presencia real en las infraestructuras digitales del presente y del futuro. La presentación de sus nuevos desarrollos no es un gesto meramente cosmético, sino la respuesta a un cambio de época en el que la supervivencia cultural de un idioma ya no se decide en los diccionarios, sino en los sistemas que procesan, aprenden y generan texto de manera automática.

Y su preocupación es comprensible. Los grandes modelos de lenguaje que hoy definen la comunicación digital se entrenan mayoritariamente en inglés. Según datos de Common Crawl, casi la mitad del contenido usado para ese entrenamiento procede de la esfera anglosajona, mientras que el español apenas representa una fracción mínima.

Esa constatación ha obligado a instituciones tradicionalmente conservadoras a reformular su papel. La RAE, acompañada por la ASALE, quiere que el español sea visible en el corazón de los sistemas que traducen, corrigen o generan texto. El mensaje de su director, Santiago Muñoz Machado, fue nítido: la inteligencia artificial ya no es optativa.

LEIA no se limita a desarrollar un observatorio de neologismos o un verificador lingüístico avanzado. Aspira a que el español, con su diversidad interna, quede inscrito en los modelos que gobiernan la comunicación digital global.

El movimiento español forma parte de un fenómeno más amplio. En Francia, la Délégation générale à la langue française ha publicado el 'Vocabulaire de l'intelligence artificielle', un primer repertorio oficial con cincuenta términos clave de IA. Incluso la Academia Francesa, tradicionalmente prudente, admite que proteger la lengua exige intervenir en la tecnología que la procesa.

Oxford Languages, brazo lexicográfico de la Universidad de Oxford, suministra datasets multilingües a empresas tecnológicas que alimentan a millones de usuarios en el ámbito de la escritura asistida. No es casual: los diccionarios han dejado de ser libros y se han convertido en componentes de modelos computacionales.

Europa también ve el riesgo. La Unión Europea financia ALT-EDIC y OpenEuroLLM, proyectos destinados a desarrollar modelos lingüísticos propios que garanticen una representación justa de las lenguas del continente. No se trata solo de autonomía tecnológica. Es un intento de evitar que el patrimonio lingüístico europeo quede supeditado a prioridades geopolíticas ajenas.

La diversidad cultural de la región depende, en gran medida, de que sus lenguas tengan presencia efectiva en las herramientas que definirán la educación, la administración y la comunicación de las próximas décadas.

El interés por la soberanía lingüística se ha extendido más allá de Europa. En América Latina, LatamGPT, impulsado por el Centro Nacional de Inteligencia Artificial de Chile junto a instituciones brasileñas, representa un esfuerzo regional por crear un modelo entrenado con datos propios. El proyecto no busca una simple adaptación de tecnologías externas, sino un modelo que comprenda matices, modismos, expresiones culturales y particularidades locales imposibles de captar desde una perspectiva exclusivamente anglosajona.

La problemática afecta también a las lenguas minorizadas. En España, proyectos como ALIA incorporan el catalán, el gallego, el valenciano y el euskera en modelos abiertos diseñados para estas lenguas cooficiales. No es un gesto identitario, sino una medida de supervivencia digital.

Para lenguas como el bretón, ya clasificado como «severamente amenazado» por la Unesco, la falta de herramientas de traducción, aplicaciones educativas o sistemas de procesamiento automático es una sentencia silenciosa. Una lengua que no existe en la infraestructura digital deja de existir en la práctica social.

Otras instituciones apuntan en la misma dirección. La Accademia della Crusca italiana, uno de los organismos lingüísticos más antiguos del mundo, reconoce la importancia de esta transformación, aunque avanza con más cautela que sus homólogos españoles y franceses.

En Alemania, el Goethe-Institut organiza talleres sobre el uso de IA generativa en la enseñanza del alemán, consciente de que la pedagogía también debe adaptarse a un escenario en el que los modelos computacionales serán compañeros habituales de aprendizaje.

La conclusión que se desprende de todos estos movimientos es bastante clara: las instituciones lingüísticas ya no pueden limitarse a fijar normas. Deben participar activamente en el diseño de la tecnología que dará forma al lenguaje del futuro. Deben influir en los datos, colaborar con empresas tecnológicas y asegurar que sus lenguas no queden atrapadas en una versión reducida o artificial de sí mismas.

LEIA, con socios como Google, Microsoft, Amazon o Meta, encarna precisamente este giro estratégico: una academia que ya no observa desde el borde del camino, sino que interviene en su trazado.

La disputa por la lengua ya no se juega en las aulas ni en los congresos académicos. Hoy se decide en los algoritmos, en los corpus que alimentan a la inteligencia artificial y en los modelos que condicionan cómo producimos, interpretamos y distribuimos el conocimiento.