Mientras espera GPT-4, OpenAI está desarrollando el modelo de lenguaje GPT-3.5


Más de dos años después del lanzamiento del modelo de lenguaje GPT-3, OpenAI planea lanzar su sucesor GPT-4 a mediano plazo. Mientras tanto, la compañía de inteligencia artificial ha desarrollado una serie de aplicaciones de IA, incluido un chatbot, basado en GPT-3.5, una versión mejorada de GPT-3.

text-davinci-003, ChatGPT: estas herramientas se basan en GPT-3.5 de OpenAI

A fines de noviembre, OpenAI anunció el lanzamiento de una nueva versión del modelo de lenguaje GPT-3 denominado text-davinci-003. Esta herramienta permite gestionar instrucciones más complejas y generar representaciones mucho más precisas que antes. El 1 de diciembre de 2022, como parte de de una manifestación públicaOpenAI presentó las funcionalidades que ofrece su última herramienta, el chatbot ChatGPT.

En la misma categoría

Google e iCAD se asocian para desarrollar herramientas de detección de cáncer de mama utilizando inteligencia artificial

Este tiene la particularidad de abordar una enorme lista de temas, incluyendo temas más técnicos como conceptos científicos complejos. A diferencia de GPT-3, que puede predecir qué texto sigue a una cadena de palabras proporcionada por una persona, ChatGPT intenta responder a las consultas de los usuarios de tal manera que su respuesta se aproxime a la que podría haber formulado un ser humano. El chatbot responde preguntas e incluso puede admitir errores si un usuario demuestra que están equivocados. Gracias al aprendizaje por refuerzo, recordará que cometió un error y evitará que lo vuelva a cometer.

¿Qué tienen en común text-davinci-003 y ChatGPT? Ambos explotan el mismo modelo de lenguaje desarrollado recientemente por OpenAI, destinado a ser superior a GPT-3.

¿GPT-3.5 antes de la llegada de un GPT-4 más eficiente en 2023?

GPT-3.5, como su nombre indica, actúa como intermediario entre GPT-3 y el futuro GPT-4. Fue entrenado usando un código que se desarrolló hace más de un año. El modelo aprendió los diversos significados de las palabras, para poder unirlas y formar oraciones coherentes evitando sesgos discriminatorios. Al igual que GPT-3, se ha entrenado utilizando cientos de miles de páginas web: artículos de Wikipedia, publicaciones en redes sociales, artículos de prensa, publicaciones de blogs, etc.

Para OpenAI, GPT-3.5 es una puerta de enlace para crear GPT-4. La firma no busca necesariamente construir un modelo con una gran cantidad de parámetros para superar redes neuronales como las utilizadas para Gopher (280 mil millones de parámetros) o el modelo chino PanGu-Alpha (200 mil millones).

Su objetivo será proponer en 2023 un modelo de lenguaje capaz de realizar búsquedas más precisas gracias a un proceso de análisis de datos más avanzado y lograr que la generación de texto sea tan creíble como la que proponen los mejores escritores. Finalmente, OpenAI trabajará en una mejor comprensión contextual para mantener la coherencia a lo largo del diálogo con un chatbot, por ejemplo.



ttn-es-4