Le « Gemini » de Google fait une percée mobile pour l’IA générative


Débloquez gratuitement Editor’s Digest

Google a lancé un nouvel ensemble de modèles d’intelligence artificielle générative qui fonctionneront pour la première fois directement sur les téléphones mobiles, une avancée décisive dans les efforts de l’entreprise technologique pour affronter des concurrents tels que le créateur de ChatGPT, OpenAI.

La société a décrit « Gemini » comme son système d’IA « le plus grand, le plus performant et le plus général », capable d’analyser les informations à partir d’images et d’audio et doté de capacités sophistiquées de raisonnement et de « planification ». Il équipera dès mercredi le chatbot Bard de Google et sera lancé plus largement dans son moteur de recherche à partir de l’année prochaine.

Une version de Gemini, connue sous le nom de « nano », a été conçue spécifiquement pour fonctionner sur les appareils mobiles et serait intégrée aux derniers téléphones Pixel de Google. Google a déclaré au Financial Times que cela « fonctionnerait de manière native » sur l’appareil et que le modèle « nano » était « optimisé pour les mobiles – afin que les développeurs Android puissent facilement créer des applications et des fonctionnalités d’IA qui fonctionnent hors ligne, ou utiliser des applications personnelles. [information] mieux gardé privé sur l’appareil ».

Cette avancée pourrait aider à répondre à un problème économique lié à la technologie. Faire fonctionner l’IA générative avec la puissance de calcul disponible sur les téléphones mobiles, plutôt que via le cloud sur des serveurs exploités par de grands groupes technologiques, réduirait considérablement les coûts d’exploitation de tels systèmes. Cela fournit également une couche d’assurance pour ceux qui souhaitent conserver leurs données privées limitées à un appareil.

« Je crois que la transition que nous observons actuellement avec l’IA sera la plus profonde de notre vie, bien plus importante que le passage au mobile ou au Web qui l’a précédé », a déclaré Sundar Pichai, directeur général de Google et d’Alphabet, dans un article de blog. « Cette nouvelle ère de modèles représente l’un des plus grands efforts scientifiques et techniques que nous ayons entrepris en tant qu’entreprise. »

L’IA générative a ouvert un nouveau front dans la bataille pour la domination des grandes technologies dans la Silicon Valley. Le dernier système d’IA générative de Google suit un certain nombre de modèles lancés par des entreprises, notamment OpenAI, Meta, soutenu par Microsoft, et des start-ups comme Anthropic et Mistral, qui sont tous capables de produire des réponses plausibles à des questions en langage naturel : en texte, en code, image et son.

Le mois dernier, le géant de l’entreprise Microsoft a déployé un assistant d’IA générative, baptisé Copilot, dans sa suite d’applications de productivité Microsoft 365 largement utilisée, qui comprend Word, PowerPoint et Excel.

Google a déclaré que Gemini avait obtenu un score de plus de 90 % sur une référence « norme de l’industrie » qui évalue les soi-disant grands modèles de langage, la technologie qui sous-tend les produits d’IA générative.

La société a ajouté que Gemini était le premier modèle d’IA à surpasser les experts humains sur certaines tâches, surpassant le modèle GPT3.5 d’OpenAI dans plusieurs tests. Il peut notamment résoudre des problèmes de raisonnement mathématique, analyser des données scientifiques et effectuer du codage avancé. Google n’a pas fait de comparaison avec le dernier modèle GPT4 d’OpenAI.

Gemini sera également intégré à Bard, le chatbot alimenté par l’IA de Google, à partir de mercredi en langue anglaise, disponible dans plus de 170 territoires, notamment aux États-Unis, en Asie et en Afrique, et il est prévu de le mettre à jour avec un logiciel plus puissant l’année prochaine.

Cependant, il ne sera pas encore disponible en Europe ou au Royaume-Uni, ce qui, selon Google, était dû à des obstacles réglementaires.

«Nous travaillons définitivement là-dessus et travaillons clairement avec les régulateurs locaux. . . pour nous assurer que nous travaillons avec ces personnes avant de nous lancer dans un domaine particulier », a déclaré Sissie Hsiao, vice-présidente de Google et directrice générale de Bard.

Hsiao a déclaré que l’intégration améliorerait les capacités de Bard à « comprendre et résumer le contenu, le raisonnement, le brainstorming, l’écriture et la planification ».

Des exemples d’utilisations de Gemini démontrés par Google comprenaient la numérisation d’une feuille de calcul manuscrite de formules mathématiques, le marquage des erreurs et leur explication.

Une autre démonstration du YouTuber Mark Rober a utilisé Bard intégré à Gemini pour réaliser une vidéo dans laquelle il a testé comment fabriquer l’avion en papier le plus aérodynamique. L’IA a suggéré des expériences et des améliorations des conceptions et des moyens de tester sa précision, notamment en le tirant à travers un anneau de feu.

Des versions de Gemini seront mises à la disposition de certains développeurs et entreprises clientes tout au long du mois de décembre, avec un accès plus large l’année prochaine.



ttn-fr-56