Google presentó oficialmente Gemini, su modelo de lenguaje multimodal

En una publicación de blog publicada el 6 de diciembre, Sundar Pichai, director ejecutivo de Alphabet, la empresa matriz de Google, y Demis Hassabis, director ejecutivo y cofundador de DeepMind, la rama de inteligencia artificial (IA) del gigante tecnológico, presentaron Gemini. Este nuevo modelo multimodal de lenguaje grande (LLM) será utilizado por la firma de Mountain View para potenciar sus herramientas de IA generativa, y competir con soluciones ofrecidas por otros actores del sector, como OpenAI.

Google ofrece tres versiones de Gemini para satisfacer una amplia gama de necesidades

“ Hacer que la IA sea más útil para todos » este es el objetivo de Google. Para responder a esto, el gigante tecnológico ha propuesto el modelo grande que ofrecerá en tres versiones. El primero, Gemini Ultra, constituye la versión más grande y eficiente del LLM. El segundo, Gemini Pro, se adapta a un amplio abanico de tareas según las expectativas y necesidades de sus usuarios. Finalmente, Gemini Nano se utilizará para tareas más específicas y para dispositivos móviles.

“ Desde el principio, Gemini fue diseñado para ser multimodal. Puede generalizar, comprender, operar y combinar sin problemas diferentes tipos de información, incluidos texto, código, audio, imagen y video. » subrayó Sundar Pichai. Según Google, Gemini Pro tendría un mejor rendimiento que GPT-3.5, pero la compañía no especificó si su nuevo modelo es tan potente como GPT-4. En cuanto a la versión Ultra, la firma de Mountain View publicó un libro blanco explicando que al realizar sus pruebas, su LLM habría superado al GPT-4 en determinados aspectos.

Los equipos de DeepMind trabajaron durante meses para perfeccionar su nuevo modelo. Incluso se barajó retrasar el lanzamiento de Gemini para el próximo enero, dadas sus dificultades para responder a determinadas solicitudes de habla no inglesa. Al final, los equipos de desarrollo del modelo fueron más eficientes de lo esperado.

A partir del 13 de diciembre, los clientes empresariales podrán acceder a Gemini Pro a través de la aplicación Gemini en Google AI Studio y Google Cloud Vertex AI. Esta versión también se incluirá en su buscador, así como en el robot conversacional Bard, que hasta entonces utilizaba una versión modificada de LaMDA además de PaLM 2, otro modelo de lenguaje que el grupo diseñó durante el año.

Los desarrolladores de Android podrán utilizar Gemini Nano para diseñar sus herramientas para dispositivos conectados. El modelo Nano también se incluirá en sus últimos teléfonos inteligentes Pixel 8 Pro para ofrecer nuevas funciones en torno a la IA generativa. Finalmente, Gemini Ultra servirá para impulsar una versión mejorada de su chatbot, denominada para la ocasión Bard Advanced. Esta nueva herramienta estará disponible el próximo año y será de pago.

ttn-es-4

teknomers

Administrator

Visit Website View All Posts

Related Stories

Los medios estatales de Irán informan que la explosión en la provincia oriental de Teherán fue una disposición controlada de municiones.

Japón lanza y aterriza con éxito un cohete reutilizable

Japón lanza y aterriza con éxito un cohete reutilizable

You May Have Missed

Copa del Mundo 2026: Jordan Pickford – Es momento de darle al portero inglés el reconocimiento que merece

Los medios estatales de Irán informan que la explosión en la provincia oriental de Teherán fue una disposición controlada de municiones.

Stocks de agua, ceniceros desechables, mantas de supervivencia: las autopistas se preparan para un fin de semana de alta tensión

Noruega-Inglaterra: las predicciones de la redacción de Teknomers para este cuarto de final de la Copa del Mundo

Google ofrece tres versiones de Gemini para satisfacer una amplia gama de necesidades

About the Author

Related Stories

You May Have Missed