Desbloquea el Editor’s Digest gratis
Roula Khalaf, editora del FT, selecciona sus historias favoritas en este boletín semanal.
Google ha lanzado un nuevo conjunto de modelos de inteligencia artificial generativa que se ejecutarán directamente en teléfonos móviles por primera vez, un gran avance en los esfuerzos de la compañía de tecnología para enfrentarse a rivales como OpenAI, fabricante de ChatGPT.
La compañía describió a “Gemini” como su sistema de inteligencia artificial “más grande, más capaz y más general”, que puede analizar información a partir de imágenes y audio y tiene capacidades sofisticadas de razonamiento y “planificación”. Impulsará el chatbot Bard de Google a partir del miércoles y se lanzará más ampliamente en su motor de búsqueda a partir del próximo año.
Una versión de Gemini, conocida como “nano”, fue diseñada específicamente para ejecutarse en dispositivos móviles y se integraría en los últimos teléfonos Pixel de Google. Google le dijo al Financial Times que esto se “ejecutaría de forma nativa” en el dispositivo y que el modelo “nano” estaba “optimizado para dispositivos móviles, de modo que los desarrolladores de Android puedan crear fácilmente aplicaciones y funciones de inteligencia artificial que funcionen sin conexión o utilicen dispositivos personales”. [information] Es mejor mantener la privacidad en el dispositivo”.
Este avance podría ayudar a responder a un problema económico con la tecnología. Ejecutar IA generativa con la potencia informática disponible en los teléfonos móviles, en lugar de hacerlo a través de la nube en servidores operados por grandes grupos tecnológicos, reduciría enormemente los costos de operar dichos sistemas. Esto también proporciona una capa de seguridad para quienes desean mantener los datos privados restringidos a un dispositivo.
“Creo que la transición que estamos viendo ahora con la IA será la más profunda de nuestras vidas, mucho mayor que el paso anterior a los dispositivos móviles o a la web”, dijo el director ejecutivo de Google y Alphabet, Sundar Pichai, en una publicación de blog. “Esta nueva era de modelos representa uno de los mayores esfuerzos de ciencia e ingeniería que hemos emprendido como empresa”.
La IA generativa ha abierto un nuevo frente en la batalla por el dominio de las grandes tecnologías en Silicon Valley. El último sistema de IA generativa de Google sigue una serie de modelos lanzados por empresas, incluidas OpenAI, Meta y empresas emergentes como Anthropic y Mistral, respaldadas por Microsoft, que son capaces de producir respuestas plausibles a preguntas en lenguaje natural: en texto, código, imagen y audio.
El mes pasado, el gigante empresarial Microsoft lanzó un asistente de inteligencia artificial generativo, denominado Copilot, en su ampliamente utilizado conjunto de aplicaciones de productividad Microsoft 365, que incluye Word, PowerPoint y Excel.
Google dijo que Gemini obtuvo una puntuación superior al 90 por ciento en un punto de referencia “estándar de la industria” que evalúa los llamados modelos de lenguaje grande, la tecnología subyacente a los productos de IA generativa.
La compañía agregó que Gemini fue el primer modelo de IA que superó a los expertos humanos en ciertas tareas, superando al modelo GPT3.5 de OpenAI en múltiples pruebas. En particular, puede resolver problemas de razonamiento matemático, analizar datos científicos y realizar codificación avanzada. Google no hizo una comparación con el último modelo GPT4 de OpenAI.
Gemini también se integrará en Bard, el chatbot impulsado por inteligencia artificial de Google, a partir del miércoles en idioma inglés, disponible en más de 170 territorios, incluidos EE. UU., Asia y África, con planes de actualizarlo con un software más potente el próximo año.
Sin embargo, aún no estará disponible en Europa o el Reino Unido, lo que, según Google, se debe a obstáculos regulatorios.
“Definitivamente estamos trabajando en eso y claramente trabajando con los reguladores locales. . . “Para asegurarnos de que estamos comprometidos con esas personas antes de lanzarnos en cualquier área en particular”, dijo Sissie Hsiao, vicepresidenta de Google y directora general de Bard.
Hsiao dijo que la integración mejoraría las habilidades de Bard para “comprender y resumir contenidos, razonar, generar ideas, escribir y planificar”.
Los ejemplos de usos de Gemini demostrados por Google incluyeron escanear una hoja de cálculo escrita a mano con fórmulas matemáticas, marcar errores y explicarlos.
Otra demostración del YouTuber Mark Rober utilizó a Bard integrado con Gemini para dirigir un video en el que probó cómo crear el avión de papel más aerodinámico. La IA sugirió experimentos y mejoras en los diseños y formas de probar su precisión, incluido dispararlo a través de un anillo de fuego.
Las versiones de Gemini estarán disponibles para algunos desarrolladores y clientes empresariales a lo largo de diciembre, y el acceso se extenderá más ampliamente el próximo año.
