Les start-up européennes de l’IA font la course pour améliorer les compétences linguistiques des chatbots


Les start-up européennes font la course pour résoudre un problème avec les chatbots d’intelligence artificielle populaires : la qualité des réponses dans des langues autres que l’anglais.

Silo AI, basé à Helsinki, s’apprête à lancer mercredi une initiative visant à contribuer à la création de nouveaux grands modèles linguistiques, qui sous-tendent les produits d’IA génératifs tels que ChatGPT d’OpenAI et Bard de Google, dans des langues européennes telles que le suédois, l’islandais, le norvégien et le danois.

La société finlandaise rejoint d’autres groupes travaillant à l’amélioration de la technologie derrière les chatbots, qui donnent des réponses réalistes aux invites écrites, avec des langues telles que l’allemand, l’hébreu et l’arabe.

Ces changements interviennent alors que des entreprises du monde entier commencent à adopter des logiciels d’IA construits par OpenAI et Google, soutenus par Microsoft, ce qui amène les critiques à s’inquiéter d’une dépendance excessive à une technologie puissante et fermée construite par un petit groupe de participants principalement américains.

« Une initiative européenne doit . . . capturer les connaissances d’un point de vue européen et nous pouvons contrôler le type de données qui y sont introduites », a déclaré Peter Sarlin, directeur général de Silo AI.

Google’s Bard ne fonctionne actuellement qu’en anglais. ChatGPT d’OpenAI prend en charge des dizaines de langues, y compris les langues européennes, l’hindi, le farsi et d’autres. Cependant, il n’est pas aussi précis dans toutes les langues, selon ceux qui l’ont testé de manière approfondie.

Silo AI tente de résoudre le problème en réunissant une équipe d’universitaires expérimentés en IA de toute l’Europe. Ils construiront, entraîneront et exploiteront des modèles en langue scandinave sur le supercalculateur le plus puissant du continent LUMIqui est situé en Finlande et a été modifié pour exécuter un logiciel d’IA générative.

L’initiative de la nouvelle équipe, connue sous le nom de SiloGen, prévoit de s’étendre à d’autres langues au fil du temps.

La question n’est cependant pas purement linguistique. La création de modèles en Europe peut garantir que la qualité des données utilisées pour la formation est représentative de la culture et de l’éthique des pays en dehors des États-Unis, y compris en matière de confidentialité, a déclaré Sarlin.

Le modèle de Silo AI sera également open-source, ce qui signifie qu’il pourra être analysé et adapté par toute personne souhaitant le déployer. Cela contraste avec les modèles fermés d’OpenAI et de Google, avec lesquels les entreprises peuvent être réticentes à partager leurs données confidentielles ou propriétaires.

D’autres efforts européens incluent OpenGPT-X et LEAM, qui sont deux initiatives dirigées par l’Allemagne pour développer des modèles de langage open source. Les modèles d’OpenGPT-X sont construits en collaboration avec la start-up allemande d’IA Aleph Alpha.

Lors de son lancement l’année dernière, le groupe à l’origine d’OpenGPT-X a averti que le manque d’accès aux détails de modèles tels que GPT-4 menaçait la « souveraineté numérique et l’indépendance du marché » de l’Europe en matière d’IA, ce qui pourrait entraver la croissance des entreprises et de la recherche européennes.

Marco Trombetti, directeur général de la société italienne de traduction numérique Translated, a déclaré que les principaux chatbots avaient été programmés pour fournir leurs meilleurs résultats en anglais, ce qui n’était « pas juste pour le reste du monde ».

Pour contrer cela, son entreprise a créé un outil de traduction en direct pour ChatGPT qui fonctionne dans 60 langues et vise à améliorer les réponses de l’outil.

« C’est comme un saut de cinq ans en arrière, en termes de technologie, pour le monde non anglophone, ce qui crée effectivement un monde à deux vitesses », a déclaré Trombetti à propos des outils d’IA générative actuels.

De telles inquiétudes ne s’expriment pas seulement en Europe. L’Autorité israélienne de l’innovation a dépensé 7,5 millions de Shk (environ 2,1 millions de dollars) pour créer l’Association of Natural Language Processing. Le groupe tente d’inverser la « qualité médiocre et insuffisante de la reconnaissance de la parole en hébreu et en arabe dans divers types de systèmes informatisés », a déclaré Dror Bin, son directeur général.

Bin a déclaré qu’avec un financement limité pour la recherche sur l’IA dans les pays arabophones et relativement peu de locuteurs d’hébreu dans le monde, la crainte est qu’ils soient laissés pour compte car les produits d’IA sont intégrés dans des applications commerciales telles que Microsoft Office et Google Workspace.

« La qualité de la compréhension et de la reconnaissance de la parole humaine en hébreu et en arabe est inférieure et constitue un obstacle à la réalisation et à l’application de services avancés », a-t-il ajouté.

Reportage supplémentaire de John Thornhill



ttn-fr-56