Pourquoi Google est trop politiquement correct


Le logo Google Gemini est visible sur l’écran d’un téléphone portable. (07.12.2023)

Source : alliance photo / ZUMAPRESS.com


Il devrait concurrencer les chatbots comme ChatGPT et en même temps les générateurs d’images comme Dall-E de Microsoft ou Midjourney : Gemini est le nom de la nouvelle intelligence artificielle que Google a présentée à la fin de l’année dernière. Quelle est la particularité du modèle de langage : Gemini peut traiter non seulement du texte, mais également des images, des vidéos, de l’audio et du code informatique et peut également créer lui-même des images.

Pour Google, cependant, Gemini a été un fiasco cette semaine : l’IA a agi de manière absurdement « réveillée » et a exagéré avec la diversité. Lors de la création d’images, elle générait généralement des personnes ayant des couleurs de peau, des sexes et des ethnies différents – même pour les entrées pour lesquelles cela semblait totalement inapproprié. Les résultats étaient si étranges que Google a tiré sur la cordelette ; Les Gémeaux ne peuvent actuellement plus créer d’images de personnes.

ZDFheute n’était donc plus en mesure de reproduire de telles images. Mais sur les réseaux sociaux, des exemples particulièrement flagrants, vraisemblablement authentiques, suscitent enthousiasme et discussions.

C’est apparemment ainsi que Gemini imagine un soldat de la Wehrmacht

Un clic pour la protection des données

Ce n’est que lorsque vous cliquez ici que les images et autres données de Twitter seront rechargées. Votre adresse IP sera transmise à des serveurs Twitter externes. Vous pouvez en savoir plus sur la protection des données de ce fournisseur de médias sociaux sur le site Twitter. Pour faciliter vos futures visites, nous stockons votre consentement dans les paramètres de confidentialité. Vous pouvez révoquer votre consentement à tout moment dans la zone « Mes Actualités ».

Les Gémeaux ont livré des images absurdes

  • En réponse à l’invite « créer une image d’un soldat allemand en 1943 », Gemini crée apparemment, entre autres, une femme asiatique dans une sorte d’uniforme de la Wehrmacht ;
  • Lorsqu’on lui a demandé de « créer une image d’un Viking », les Gémeaux ont probablement proposé, entre autres, un Viking noir et une femme Viking, tous deux avec des dreadlocks ;
  • à l’invite « créer l’image d’un pape », le résultat montre une femme à la peau foncée et un homme noir ;
  • Même les fondateurs de Google eux-mêmes, les Américains Larry Page et Sergey Brin, sont originaires des Gémeaux avec des traits du visage asiatiques montré.
Capture d'écran Google Gemini : Pourriez-vous générer une image d'un couple dans l'Allemagne de 1820 ?

« Pouvez-vous créer une image d’un couple en Allemagne en 1820 ? » – Certaines des images créées par Gemini ne semblent pas très appropriées.

Source : Capture d’écran de Google Gemini


Les Gémeaux ont partiellement refusé de créer des images de Blancs

Les Gémeaux ont même parfois refusé de générer explicitement l’image d’une personne blanche pendant Des images de Noirs ont été créées sans aucune réserve. Cela ressort des publications sur X, et les journalistes ont pu le confirmer dans certains cas lors d’expériences avec Gemini. Sans la demande explicite de créer des images de personnes blanches, Gemini fournissait apparemment encore fréquemment des images de personnes blanches avec d’autres invites.

Mais comment se produisent ces échecs ? Qu’est-ce qui pousse les Gémeaux à créer des images si diverses ? Pour ce faire, vous devez savoir comment fonctionne l’intelligence artificielle qui se cache derrière.

Lors du sommet numérique d’Iéna, les milieux politiques et économiques ont discuté du tournant numérique en Allemagne. Le besoin de rattraper l’IA est particulièrement grand.21 novembre 2023 | 1:37 minutes


Les modèles d’IA apprennent à partir de photos Internet

Pour que les modèles d’IA puissent créer des images, ils reçoivent des données d’entraînement, par exemple des masses de photos provenant de bases de données ou d’Internet. En fin de compte, ils reflètent principalement ce qu’ils ont appris grâce aux données de formation. Le problème : ces données sont souvent déformées, explique Björn Ommer, responsable du Computer Vision & Learning Group à l’Université Ludwig Maximilians de Munich.

Un exemple : le mot « nurse » non sexiste signifie infirmière ou infirmière auxiliaire en anglais. Cependant, sur les photos publiées sur Internet, les « infirmières » sont presque exclusivement représentées par des femmes, ce que chacun peut constater par lui-même en effectuant une recherche d’images sur Google. Une IA apprendrait d’abord que « infirmière » est un métier exclusivement féminin. Dans d’autres professions, les femmes sont sous-représentées, voire inexistantes.

Le 30 novembre 2022, la version bêta d’un outil de chat qui répond grâce à l’IA a été mise en ligne. En une semaine, ChatGPT comptait un million d’utilisateurs. 30 novembre 2023 | 4:32 minutes


L’intention des développeurs d’IA : ne pas reproduire les clichés

Les développeurs d’IA ne souhaitent généralement pas représenter le monde exactement tel qu’il a été créé sur Internet, car cela reviendrait à reproduire des clichés. On pourrait donc essayer de contrecarrer activement de telles distorsions, explique Ommer : « Si les développeurs observent une sous-représentation des femmes ou des peaux foncées dans les données d’entraînement ou s’y attendent dans les invites des utilisateurs, certaines approches contrecarrent cela en faussant délibérément la probabilité. »

Mais comment cela affecte-t-il finalement les images générées ?

Les développeurs de ChatGPT ont publié un générateur de films. Son nom est Sora et il peut créer des vidéos réalistes à partir de courtes spécifications de texte.16/02/2024 | 1:31 minutes


Les générateurs d’images doivent inventer les détails des images

Les invites de l’utilisateur – c’est-à-dire les ordres adressés à l’IA – ne contiennent généralement que quelques mots et ne sont donc pas très détaillées. L’IA devrait quand même générer une image complexe avec des millions de pixels. La tâche ne peut être accomplie que si la description est plus détaillée.

La solution : des détails supplémentaires sont ajoutés aux invites avant le début de la génération de l’image. «Cette description plus détaillée peut désormais également être inventée automatiquement par une autre partie de l’IA», explique Björn Ommer, responsable du groupe Computer Vision & Learning à l’université Ludwig Maximilians de Munich.

Dans tous les cas, il faut générer quelque chose que les utilisateurs n’ont pas saisi. Sinon, l’image resterait partiellement vide.

Björn Ommer, expert en IA à l’Université Ludwig Maximilians de Munich

Images d’intelligence artificielle

:Pourquoi les horloges IA indiquent presque toujours 10h10

Un court texte suffit et les images sont créées selon vos envies. Les générateurs d’images IA sont déjà utilisés dans le marketing et pour concevoir des sites Web, mais ils posent certains problèmes.

par David Metzmacher

Trois horloges, générées par l'IA, indiquant l'heure vers 10h10

Déclaration de Google : « Objectif manqué »

Le Radio bavaroise a fait un test avec Gemini et donne un exemple concret : l’ordre « un couple en Allemagne dans les années 1820 » a été étendu par Gemini à une nouvelle invite – « une peinture détaillée d’une femme amérindienne dans une robe fluide et d’un homme blanc dans un frac, qui dansent lors d’un bal dans un château allemand. La nouvelle image a ensuite été générée.
C’est exactement là que la faiblesse des Gémeaux apparaît : l’IA – selon son développement – y écrit une « Femme amérindienne », même s’il s’agit de l’Allemagne en 1820. Les développeurs ont essayé de faire en sorte que Gemini génère « un large éventail de personnes », comme Google en un seul. Déclaration à X a écrit. C’est « généralement une bonne chose » car Google compte des utilisateurs partout dans le monde. « Mais ici, on rate la cible. »

Les frontières entre bien intentionné, politiquement trop correct et erreur grossière sont ici fluides.

Björn Ommer, expert en IA à l’Université Ludwig Maximilians de Munich

Le ministre de l’Intérieur Faeser a inauguré un nouveau centre de situation informatique à Bonn. Il vise à mieux protéger les infrastructures critiques contre les cyberattaques.02/06/2024 | 1:47 minutes


Choc culturel aux États-Unis

Aux États-Unis en particulier, il y a d’âpres discussions sur les distorsions dans un sens ou dans l’autre, explique Ommer. Gemini est au milieu d’une véritable guerre culturelle : les conservateurs accusent les entreprises technologiques d’utiliser des outils d’IA comme ChatGPT pour obtenir des réponses libérales, et les plateformes de médias sociaux préfèrent les points de vue libéraux.

Voici à quoi ressemblent les résultats de l’image de Dall-E (Microsoft) :

« Un couple en Allemagne 1820 »

Ici, l’invite était « créer une image d’un couple en Allemagne en 1820 » – Dall-E crée des images de personnes blanches.

Source: Dall-E (Microsoft)


Cependant, d’autres générateurs d’images tels que Midjourney ou Dall-E ne commettent pas les erreurs Gemini. Et certains semblent – ​​à leur manière – reproduire des clichés. Un test réalisé par ZDFheute le montre : à la demande « créer une image d’un PDG au bureau », Dall-E affiche principalement des hommes blancs, même si PDG est un mot neutre en termes de genre. Sur les 16 images créées, 13 montraient un jeune homme dynamique en tenue professionnelle avec une chevelure abondante. Une femme n’est visible que sur trois des photos.





ttn-fr-39