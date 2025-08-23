En julio, el gobierno español nombró a un «director del Gabinete del director del Gabinete». El título, digno de una comedia de los hermanos Marx, ... desató burlas y críticas: ¿realmente alguien necesitaba un director para dirigir al director que ya dirige?

Este cargo ilustra, de forma involuntaria, un problema inquietante de la inteligencia artificial: qué sucede cuando los sistemas comienzan a alimentarse de sí mismos en bucles interminables que, lejos de perfeccionarlos, terminan deteriorándolo todo.

Durante años, la IA aprendió de contenido humano: libros, artículos, fotos, vídeos. Pero hoy la situación está cambiando. La IA es capaz de crear textos, imágenes, música y conversaciones tan realistas que internet se ha llenado de ellos. Y aquí es donde aparece la alerta.

Los nuevos sistemas empiezan a entrenarse con este material sintético como si fuera auténtico. Este fenómeno, que los investigadores denominan colapso de modelo, ha sido descrito en varios estudios teóricos recientes como una degradación progresiva de la calidad de la información. Es como hacer fotocopias de fotocopias: cada generación pierde nitidez hasta que el original se vuelve irreconocible.

En cierto modo, estamos asistiendo a una versión tecnológica del mito de Saturno devorando a sus hijos: la IA consume el contenido generado por sus versiones anteriores sin darse cuenta de que, con cada bocado, destruye aquello que debería nutrirla.

Al principio, la degradación es casi imperceptible. Los sistemas parecen funcionar bien, pero empiezan a perder información sobre situaciones raras o poco comunes. Los teóricos llaman a esta fase colapso temprano: el rendimiento en tareas habituales sigue siendo aceptable, lo que hace que el problema pase desapercibido durante un tiempo.

Con el colapso tardío, descrito en varios modelos matemáticos, el deterioro se vuelve evidente. Las respuestas se vuelven genéricas, repetitivas y desconectadas de la realidad. Los sistemas olvidan la complejidad del mundo y ofrecen versiones simplificadas y empobrecidas de él.

Los investigadores han observado este fenómeno en múltiples contextos. Si un sistema aprende de fotos reales con objetos amarillos comunes y objetos azules raros, describirá ambos con precisión. Pero si genera nuevas imágenes priorizando los objetos amarillos y otro sistema aprende de estas, los objetos azules irán desapareciendo poco a poco hasta borrarse por completo. Con cada generación, la IA pierde matices y termina atrapada en su propio contenido artificial.

Las causas son diversas. Por un lado, cualquier conjunto de datos, por grande que sea, es limitado. Copiar copias implica siempre pérdida de detalle. Por otro, las redes neuronales tienen limitaciones estructurales para representar la realidad. Además, el propio proceso de aprendizaje introduce errores acumulativos que se van sumando con cada iteración, un efecto ya descrito en teorías de degradación de datos sintéticos.

El riesgo aumenta porque el contenido artificial se multiplica en internet. A medida que crece, también lo hace la probabilidad de que se use para entrenar nuevos sistemas. Algunos estudios estiman que, para 2030, la mayoría de los datos de entrenamiento serán sintéticos. Esto podría crear una espiral de poca confiabilidad donde cada generación de IA se aleje más de la realidad humana que la inspiró.

Las consecuencias van mucho más allá de simples fallos técnicos. Los sistemas afectados por el colapso tienden a producir respuestas cada vez más predecibles, seguras y, paradójicamente, más confiadas, aunque sean erróneas. Pueden repetir información obsoleta, ofrecer razonamientos débiles o fallar ante situaciones complejas o ambiguas. Preguntar a una IA sobre un tema poco común podría dar como resultado respuestas genéricas o incluso inútiles.

Sin embargo, en teoría, hay estrategias para frenar este deterioro. La más importante es preservar datos humanos originales de alta calidad: bibliotecas digitales con contenido auténtico para entrenar y reentrenar sistemas.

También se están desarrollando herramientas para identificar contenido generado por IA y filtrarlo antes del entrenamiento. Algunos, como Google, proponen sistemas de etiquetado que marquen claramente el contenido sintético, creando una especie de cadena de custodia digital.

Además, los datos artificiales pueden usarse de forma estratégica, no para reemplazar a los humanos sino para complementarlos. Por ejemplo, pueden generar ejemplos de situaciones raras que serían difíciles de conseguir en la realidad, siempre combinándolos con una base sólida de información auténtica.

La historia tecnológica muestra que cada revolución trae riesgos inesperados. La imprenta democratizó el conocimiento, pero también propagó falsedades. Internet conectó al mundo, pero creó nuevas formas de aislamiento y manipulación. La IA está transformando todos los ámbitos de la vida, pero el colapso de modelos nos recuerda que debemos actuar con cautela y aprender de estas teorías para anticipar sus efectos.

El desafío es mantener viva la conexión entre inteligencia artificial e inteligencia humana. La IA es poderosa porque amplifica nuestras capacidades, no porque las sustituya. Si pierde contacto con la riqueza y diversidad del mundo real, corre el riesgo de convertirse en una caricatura de sí misma.

Tal vez el nombramiento del «director del Gabinete del director del Gabinete» no fuera tan absurdo. Su redundancia cómica recuerda que, cuando los sistemas se vuelven demasiado autorreferenciales, pueden colapsar en un bucle inútil. La IA necesita mirar hacia afuera, hacia el mundo real, y no perderse en ecos infinitos de sí misma.