Ante las crecientes preocupaciones sobre la autenticidad de textos generados por inteligencia artificial (IA), Google DeepMind ha presentado una solución pionera: SynthID-Text, un sistema que emplea «marcas de agua» en el contenido generado por modelos de lenguaje avanzados. Este desarrollo busca facilitar la identificación de los textos creados por IA, protegiendo el ecosistema de información de la posible confusión sobre la autoría de los contenidos.
A diferencia de las marcas de agua en imágenes o videos, la implementación de una señal en el texto presenta desafíos, ya que cualquier cambio en las palabras puede alterar el sentido o la calidad del contenido. Sin embargo, el equipo de DeepMind, encabezado por los investigadores Sumanth Dathathri y Pushmeet Kohli, ha desarrollado un algoritmo de muestreo que introduce un patrón sutil en la selección de palabras, creando una firma detectable que no afecta el significado del texto.
Según los expertos, esta tecnología mejora significativamente la eficacia de detección en comparación con los métodos actuales y tiene un impacto mínimo en la potencia de cálculo requerida para ejecutar los modelos de lenguaje, facilitando su implementación a gran escala. Los investigadores de Google consideran que esta innovación es crucial, ya que los modelos de lenguaje han alcanzado una calidad tal que los textos generados suelen ser indistinguibles de los escritos por humanos.
Para Pablo Haya, del Laboratorio de Lingüística Informática de la Universidad Autónoma de Madrid, el desarrollo de SynthID-Text representa “una solución técnicamente robusta” que sigue patrones estadísticos rastreables sin comprometer la calidad del contenido. No obstante, Haya advierte que estas marcas de agua podrían ser vulnerables a manipulaciones, como la parafraseo o la edición del texto, lo cual reduce su eficacia en algunos casos.
La tecnología de marcas de agua responde a las demandas de transparencia en el uso de IA, como lo establece el reglamento europeo, que exige que los proveedores de IA identifiquen el contenido generado por estas tecnologías cuando representan ciertos riesgos. Sin embargo, a pesar de su avance, la adopción generalizada de esta solución enfrenta desafíos, especialmente en torno a la durabilidad y resistencia de la marca en contextos donde el texto puede ser alterado.
Con SynthID-Text, Google DeepMind da un paso importante hacia una regulación que promueve el uso ético y transparente de la inteligencia artificial en la producción de contenido, beneficiando tanto a los creadores de IA como a los usuarios y consumidores de información.