
En una publicación de blog publicada el 6 de diciembre, Sundar Pichai, director ejecutivo de Alphabet, la empresa matriz de Google, y Demis Hassabis, director ejecutivo y cofundador de DeepMind, la rama dedicada a…
En una publicación de blog publicada el 6 de diciembre, Sundar Pichai, director ejecutivo de Alphabet, la empresa matriz de Google, y Demis Hassabis, director ejecutivo y cofundador de DeepMind, la rama de inteligencia artificial (IA) del gigante tecnológico, presentaron Gemini. Este nuevo modelo multimodal de lenguaje grande (LLM) será utilizado por la firma de Mountain View para potenciar sus herramientas de IA generativa, y competir con soluciones ofrecidas por otros actores del sector, como OpenAI.
Google ofrece tres versiones de Gemini para satisfacer una amplia gama de necesidades
“ Hacer que la IA sea más útil para todos » este es el objetivo de Google. Para responder a esto, el gigante tecnológico ha propuesto el modelo grande que ofrecerá en tres versiones. El primero, Gemini Ultra, constituye la versión más grande y eficiente del LLM. El segundo, Gemini Pro, se adapta a un amplio abanico de tareas según las expectativas y necesidades de sus usuarios. Finalmente, Gemini Nano se utilizará para tareas más específicas y para dispositivos móviles.
“ Desde el principio, Gemini fue diseñado para ser multimodal. Puede generalizar, comprender, operar y combinar sin problemas diferentes tipos de información, incluidos texto, código, audio, imagen y video. » subrayó Sundar Pichai. Según Google, Gemini Pro tendría un mejor rendimiento que GPT-3.5, pero la compañía no especificó si su nuevo modelo es tan potente como GPT-4. En cuanto a la versión Ultra, la firma de Mountain View publicó un libro blanco explicando que al realizar sus pruebas, su LLM habría superado al GPT-4 en determinados aspectos.
Los equipos de DeepMind trabajaron durante meses para perfeccionar su nuevo modelo. Incluso se barajó retrasar el lanzamiento de Gemini para el próximo enero, dadas sus dificultades para responder a determinadas solicitudes de habla no inglesa. Al final, los equipos de desarrollo del modelo fueron más eficientes de lo esperado.
A partir del 13 de diciembre, los clientes empresariales podrán acceder a Gemini Pro a través de la aplicación Gemini en Google AI Studio y Google Cloud Vertex AI. Esta versión también se incluirá en su buscador, así como en el robot conversacional Bard, que hasta entonces utilizaba una versión modificada de LaMDA además de PaLM 2, otro modelo de lenguaje que el grupo diseñó durante el año.
Los desarrolladores de Android podrán utilizar Gemini Nano para diseñar sus herramientas para dispositivos conectados. El modelo Nano también se incluirá en sus últimos teléfonos inteligentes Pixel 8 Pro para ofrecer nuevas funciones en torno a la IA generativa. Finalmente, Gemini Ultra servirá para impulsar una versión mejorada de su chatbot, denominada para la ocasión Bard Advanced. Esta nueva herramienta estará disponible el próximo año y será de pago.



