Ante el riesgo de desaparición de numerosas lenguas indígenas en México, especialistas de la Universidad Nacional Autónoma de México (UNAM) trabajan en el desarrollo de herramientas basadas en inteligencia artificial que permitan preservar digitalmente estos idiomas y generar registros que contribuyan a su conservación.
El proyecto es impulsado por investigadores del Departamento de Ciencias de la Computación del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS), quienes buscan crear repositorios digitales que mantengan “vivas”, al menos de forma virtual, lenguas que actualmente enfrentan un proceso acelerado de desaparición.
De acuerdo con el investigador Iván Vladimir Meza Ruiz, la inteligencia artificial puede ser una herramienta clave para documentar y preservar el patrimonio lingüístico del país, especialmente en los casos donde el número de hablantes es cada vez menor.
Según datos presentados por el especialista, en México existen 68 lenguas nacionales agrupadas en 11 familias lingüísticas y con alrededor de 364 variantes. No obstante, muchas de ellas están cayendo en desuso y enfrentan un alto riesgo de extinción.
La tendencia se refleja también en la disminución de hablantes. Mientras que en 1930 cerca del 15% de la población utilizaba alguna lengua indígena, para 2020 el porcentaje descendió a 6.2%. Además, la mayoría de quienes las hablan actualmente son personas adultas mayores, mientras que las generaciones jóvenes cada vez las emplean menos.
Meza Ruiz expuso estos datos durante la sexta sesión de la Cátedra Extraordinaria de Bioética, organizada por el Programa Universitario de Bioética (PUB), donde abordó el tema “Inteligencia artificial y lenguas originarias de México”.
El especialista explicó que, desde el punto de vista tecnológico, es posible crear versiones digitales paralelas de estas lenguas mediante sistemas de procesamiento del lenguaje natural. Sin embargo, uno de los principales obstáculos es la escasez de información disponible para entrenar los modelos de inteligencia artificial.
En internet, por ejemplo, existen apenas 4 mil 272 artículos en náhuatl clásico, mil 201 en maya yucateco, 224 en náhuatl central, 113 en mixteco, 90 en hñahñu, 12 en purépecha y solo 10 en mixe del norte.
Esta carencia de datos representa un desafío importante para el desarrollo de tecnologías lingüísticas, además de plantear dilemas éticos relacionados con la autoría y los derechos morales y patrimoniales de las obras escritas en lenguas originarias.
A pesar de ello, los especialistas consideran que una estrategia digital podría facilitar que las comunidades hablantes tengan mayor acceso a servicios como salud, justicia, educación y oportunidades económicas en sus propios idiomas.
El siguiente paso, señaló Meza Ruiz, será crear un ecosistema que permita recolectar y organizar grandes volúmenes de datos lingüísticos, con el objetivo de preservar digitalmente estas lenguas y fortalecer su presencia en el entorno tecnológico.