DeepMind: una nueva IA capaz de realizar más de 600 tareas


Uno de los grandes desafíos en el campo de la IA es la realización de un sistema que integre una inteligencia artificial general, o AGI. Dicho sistema debe ser capaz de comprender y dominar cualquier tarea de la que sea capaz un ser humano. Sin embargo, esta semana, el laboratorio de investigación DeepMind acaba de anunciar el lanzamiento de Gato, una IA capaz de aprender y gestionar cientos de tareas, informa Techcrunch.

IA más versátil que nunca

En concreto, Gato es capaz de realizar 604 misiones muy distintas: subtitular una imagen, entablar un diálogo, apilar cajas con un brazo robótico, jugar a viejos juegos de Atari… El dispositivo sería capaz de realizar acciones muy diferentes, mientras que ejemplos recientes, como el de Ítaca, centrado en un tipo de tarea muy concreta.

En la misma categoría

Paquete de software de Microsoft

Microsoft acusado de favoritismo por Anticor

Aunque las inteligencias artificiales generales se han mantenido durante mucho tiempo como materia de ciencia ficción, Gato no es el primero de su tipo. Google ha comenzado a utilizar un modelo Unified Multitasking (o MUM) en su motor de búsqueda que puede interpretar tanto texto como imágenes y video para realizar una tarea de manera más eficiente. En este caso, para refinar o corregir un campo de búsqueda. Desde el punto de vista de la arquitectura de software, Gato no se diferencia mucho de sus predecesores.

La diferencia, como señala Jack Hessel, investigador del Allen AI Institute, está en la variedad de entradas que Gato puede interpretar y las tareas que puede realizar. Al igual que otros sistemas de inteligencia artificial anteriores, aprendió a partir de miles de millones de palabras, imágenes de entornos reales o simulados, pero también de pulsaciones de botones o incluso símbolos. Característica que ofrece una mayor versatilidad al sistema, multiplicando las interacciones entre estos diferentes tipos de entradas el número de servicios posibles.

Una inteligencia humana “probablemente no por ahora”

Según Jack Hessel, “Ya hemos visto evidencia de que los modelos individuales pueden manejar entradas sorprendentemente diversas. En mi opinión, la pregunta central en el aprendizaje de la multitarea es si estas tareas se complementan entre sí o no. »

Dicho esto, el sistema queda por perfeccionar, con errores garrafales. Durante una conversación, Gato aclara que la capital de Francia es Marsella. Las pilas de cajas no siempre son perfectas, al igual que los subtítulos de las imágenes. Sin embargo, DeepMind afirma que en 450 de esas tareas, Gato superaría a un experto más de la mitad de las veces.

Por su parte, el profesor asistente de información de la Universidad de Alberta, Matthew Guzdial, se mantiene escéptico. Para él, “Las personas que dicen que este es un paso importante hacia AGI lo exageran un poco, porque todavía no estamos en la inteligencia humana y probablemente no lleguemos allí de inmediato, en mi opinión. Personalmente, estoy más en el campo de muchos modelos más pequeños, pero definitivamente hay beneficios para estos modelos generales en términos de rendimiento en tareas fuera de sus datos de entrenamiento. »



ttn-es-4