Google pone sus esperanzas en Gemini para superar GPT-4


Desbloquea el Editor’s Digest gratis

Ha tardado un año, pero Google finalmente ha dado una respuesta coherente al desafío sorpresa a su dominio en inteligencia artificial que llegó con el lanzamiento de ChatGPT.

El lanzamiento de esta semana de Gemini, una familia de grandes modelos de lenguaje, le brindará una plataforma más sólida para luchar contra OpenAI, la compañía detrás de ChatGPT, y Microsoft, que ha utilizado los modelos de OpenAI para potenciar todo su software y servicios en la nube este año.

La pregunta ahora es si Gemini puede marcar una diferencia significativa en los servicios existentes de Google y, quizás aún más importante, si puede convertirse en la base para una nueva gama de servicios que lleven la IA mucho más profundamente a la vida cotidiana.

Con los tres “sabores” de Gemini anunciados esta semana, Google finalmente está dejando su huella en una tecnología en la que sus propios investigadores hicieron mucho para ser pionera, pero que ChatGPT de OpenAI llevó a la corriente principal. La versión Pro, por ejemplo, se posiciona directamente frente al GPT-3.5 de OpenAI, el modelo detrás de la versión gratuita de ChatGPT y el caballo de batalla para muchas de las primeras aplicaciones de IA generativa de otras compañías que llegaron al mercado este año.

El Gemini Nano más pequeño se compara con sistemas como la versión más pequeña de LLaMa 2, el modelo de código abierto de Facebook, lo que lo hace capaz de ejecutarse en un dispositivo móvil. Apple, como siempre, está adoptando un enfoque reflexivo antes de llevar la IA generativa al iPhone, pero la aparición de Gemini en el último teléfono Pixel de Google es una señal de que no puede darse el lujo de esperar demasiado.

Es el Gemini Ultra de gama alta, que saldrá a principios del próximo año, el que alberga las principales esperanzas de Google de igualar o superar al GPT-4 de OpenAI en la carrera por convertir la IA generativa en una herramienta cotidiana más útil. La compañía se quedó atrás este año, pero tiene algunas ventajas claras que podrían ayudar a llevar a Gemini a un gran mercado en 2024.

Uno es la distribución. Google dijo esta semana, por ejemplo, que Gemini se agregará a Chrome, que tiene más del 60 por ciento del mercado de navegadores, brindando a miles de millones de usuarios de la web acceso instantáneo a herramientas que pueden hacer cosas como analizar el contenido de la web. páginas.

A medida que Google utilice su actual poder de mercado de esta manera para impulsar sus ambiciones en materia de IA, los reguladores de la competencia estarán observando de cerca.

Otra ventaja para Google es la incertidumbre en torno a OpenAI. Después del impactante despido y reinstalación del director ejecutivo Sam Altman el mes pasado, las muchas empresas que han construido sus propios planes de IA generativa sobre los modelos de OpenAI buscarán cubrir sus apuestas.

La empresa de búsqueda también espera que su chatbot Bard haga un mejor trabajo para rivalizar con ChatGPT ahora que tiene un mejor modelo de lenguaje detrás. Pero su mejor esperanza de recuperar una ventaja puede radicar en ser el primero en crear los próximos servicios innovadores impulsados ​​por la IA generativa. Algunas de las capacidades afirmadas para Gemini apuntan a dónde Google cree que podrían estar.

Por ejemplo, se ha dado mucha importancia al hecho de que Gemini fue diseñado desde el principio para ser “multimodal”, es decir, capaz de comprender no sólo texto sino también imágenes, vídeo y audio. Según Google, eso lo hace más adecuado que modelos como el GPT-4 para hacer frente al tipo de situaciones cotidianas que dependen de sentidos como la vista y el oído.

Esto puede ser un paso hacia sistemas de IA que sean más capaces de operar en el mundo real. Pero es demasiado pronto para decir qué aplicaciones esto podría hacer posible, o si Google realmente ha logrado la superioridad técnica que afirma.

Otra vía de desarrollo radica en lo que Google afirma que son las capacidades de razonamiento y planificación de Gemini. Este es el tipo de habilidades que podrían preparar el terreno para que los asistentes personales puedan abordar problemas complejos y establecer un plan de acción.

Si dichos asistentes están vinculados a otros servicios de Internet, también podrían convertirse en agentes y actuar en nombre de sus usuarios. Imagine un agente de compras, por ejemplo, que no sólo busca los productos que desea, sino que también los paga.

Esta ya se perfila como una de las batallas clave de IA de 2024 y más allá. OpenAI dio un primer paso en esta dirección el mes pasado cuando dijo que sus usuarios podrían construir agentes rudimentarios sobre sus modelos y luego ofrecerlos a la venta en una tienda de aplicaciones OpenAI. Esto podría indicar el próximo gran avance de la IA más allá de ChatGPT, y esta vez Google no tiene intención de quedarse atrás.

[email protected]



ttn-es-56