Se sabe que ChatGPT y otros generan alucinaciones, OpenAI explica por qué.

La evolución de los modelos de lenguaje: un vistazo crítico

La inteligencia artificial ha transformado significativamente la manera en que interactuamos con la tecnología. Desde las sugerencias de texto en los teléfonos móviles hasta los asistentes virtuales, los modelos de lenguaje están en el corazón de muchas de estas innovaciones. Sin embargo, a pesar de sus avances, estos modelos aún enfrentan desafíos críticos. Uno de estos desafíos es la generación de información incorrecta, también conocida como “alucinaciones”.

Comprendiendo las alucinaciones en IA

Los modelos de lenguaje, como GPT, generan texto mediante la predicción del siguiente palabra en una secuencia. Cada palabra es utilizada para anticipar la siguiente. Es importante notar que estos modelos no tienen acceso a etiquetas que indiquen la veracidad de la información. Esto significa que, en situaciones donde se requiere información menos común, como nombres o fechas poco conocidas, los modelos pueden producir respuestas que suenan plausibles, pero que son incorrectas.

A pesar de los avances en la tecnología, GPT-5, la última versión de estos modelos, aún presenta alucinaciones, aunque con menor frecuencia que sus predecesores. Estas alucinaciones no son sólo resultado de las datos de entrenamiento; también derivan del propio mecanismo de predicción, que promueve la generación de respuestas aunque no exista un modelo fiable que las respalde.

La diferencia entre modelos pequeños y grandes

Un aspecto sorprendente de esta situación es que los modelos más pequeños parecen tener una mayor capacidad para reconocer sus límites. Por ejemplo, cuando un modelo pequeño no sabe algo, puede sencillamente responder: “No sé”. En cambio, un modelo más grande intentará adivinar la respuesta, a menudo proporcionado información incorrecta. Esto plantea una interesante cuestión sobre la efectividad y la transparencia en la comunicación de estas inteligencias.

Datos sobre la precisión y la abstención

Las evaluaciones recientes han demostrado que abstenerse de ofrecer una respuesta puede ayudar a reducir significativamente las errores sin comprometer la precisión. En la evaluación SimpleQA, GPT-5 logró un asombroso 52% de abstención, comparado con apenas un 1% en el modelo o4-mini. Aunque la precisión se mantuvo similar, el tasa de error se redujo de un 75% a un 26%. Estos datos indican que un modelo que se abstiene de responder cuando no tiene información confiable es más efectivo en limitar las alucinaciones y, en última instancia, ofrece respuestas más precisas.

Propuestas para mejorar la generación de texto

OpenAI ha propuesto varios métodos para abordar estos problemas de generación de información errónea. Una de las recomendaciones más importantes es modificar los criterios de evaluación de los modelos. Se sugiere que se penalicen más severamente las respuestas incorrectas y se otorgue una puntuación parcial a respuestas que indiquen incertidumbre. Esta estrategia incentivaría a los modelos a admitir su ignorancia en lugar de intentar llenar los vacíos con conjeturas erróneas.

Es interesante notar que algunos pruebas estandarizadas ya implementan estos tipos de evaluaciones. Sin embargo, muchos modelos continúan siendo valorados únicamente en base a su precisión, lo que puede llevar a un aumento en las alucinaciones y errores.

El camino hacia adelante

A medida que avanzamos en el campo de la inteligencia artificial, es esencial adoptar un enfoque crítico hacia la evaluación y el desarrollo de estos modelos. A medida que la tecnología evoluciona, también lo hacen los desafíos relacionados con la fiabilidad y la exactitud de la información producida. La necesidad de rigor en la verificación y en la comunicación de las limitaciones de las IA es más evidente que nunca.

La correcta formación de los modelos de lenguaje puede llevar a la creación de herramientas más útiles y precisas. La clave radica en fomentar la honestidad y la humildad en la inteligencia artificial, lo que podría llevarnos a un futuro donde las alucinaciones se conviertan en una rareza y no en la norma.

General