Google había planeado varios eventos en Estados Unidos durante diciembre para anunciar públicamente el lanzamiento de su nuevo modelo de lenguaje grande (LLM), pero finalmente los canceló. La empresa prefirió…
Google había planeado varios eventos en Estados Unidos durante diciembre para anunciar públicamente el lanzamiento de su nuevo modelo de lenguaje grande (LLM), pero finalmente los canceló. La empresa prefirió esperar unas semanas antes de presentar Gemini, su inteligencia artificial (IA) equipada con “ impresionantes capacidades multimodales » según sus palabras.
Google no quiere apresurar las cosas con Gemini
Cuando se lanzó ChatGPT en noviembre de 2022, Sundar Pichai, director ejecutivo del grupo, consciente de que faltaba algo en términos de IA generativa, dio la alarma. El gerente había ordenado a sus colegas que trabajaran en un LLM de vanguardia para impulsar un chatbot similar. Así nació Bard, basado en el modelo de lenguaje LaMDA. Durante el Google I/O 2023 de mayo, el gigante tecnológico presentó una versión más avanzada de su gran modelo de inteligencia artificial, llamado PaLM 2, que rápidamente movilizó para potenciar su robot conversacional.
Con motivo de su cumbre anual, la compañía fue más allá y presentó las premisas de lo que sería Gemini, un modelo de lenguaje más avanzado, capaz de competir con el de su competidor OpenAI, GPT-4. El pasado mes de septiembre, la compañía decidió lanzar un programa de pruebas ofreciendo este LLM avanzado a un pequeño grupo de empresas, con el objetivo de corregir posibles errores y lanzarlo a finales de año.
Esta fase experimental puso de relieve una preocupación importante. De acuerdo a La información, Géminis tuvo dificultades para responder consultas que no utilizaban el idioma inglés. Ante esta dificultad, Sundar Pichai, director general del grupo, no corrió ningún riesgo y decidió posponer su lanzamiento para el mes de enero, mientras los equipos de DeepMind, la filial de la empresa especializada en IA, pueden solucionar este problema.
Para Demis Hassabis, cofundador y director de DeepMind, Gemini es totalmente capaz de superar a GPT-4. Cuando se lance, este LLM podrá manejar una amplia gama de aplicaciones y usos, combinando diferentes tipos de datos como texto, imágenes o videos. “ Una vez refinado y rigurosamente probado en cuanto a seguridad, Gemini estará disponible en diferentes tamaños y capacidades, » especificó la firma de Mountain View la pasada primavera. El modelo se utilizará en Bard, Google Assistant y su motor de búsqueda, pero no hasta dentro de varios meses.