Le logo Google Gemini est visible sur l’écran d’un téléphone portable. (07.12.2023)
Source : alliance photo / ZUMAPRESS.com
Pour Google, cependant, Gemini a été un fiasco cette semaine : l’IA a agi de manière absurdement « réveillée » et a exagéré avec la diversité. Lors de la création d’images, elle générait généralement des personnes ayant des couleurs de peau, des sexes et des ethnies différents – même pour les entrées pour lesquelles cela semblait totalement inapproprié. Les résultats étaient si étranges que Google a tiré sur la cordelette ; Les Gémeaux ne peuvent actuellement plus créer d’images de personnes.
ZDFheute n’était donc plus en mesure de reproduire de telles images. Mais sur les réseaux sociaux, des exemples particulièrement flagrants, vraisemblablement authentiques, suscitent enthousiasme et discussions.
Un clic pour la protection des données
Les Gémeaux ont livré des images absurdes
- En réponse à l’invite « créer une image d’un soldat allemand en 1943 », Gemini crée apparemment, entre autres, une femme asiatique dans une sorte d’uniforme de la Wehrmacht ;
- Lorsqu’on lui a demandé de « créer une image d’un Viking », les Gémeaux ont probablement proposé, entre autres, un Viking noir et une femme Viking, tous deux avec des dreadlocks ;
- à l’invite « créer l’image d’un pape », le résultat montre une femme à la peau foncée et un homme noir ;
- Même les fondateurs de Google eux-mêmes, les Américains Larry Page et Sergey Brin, sont originaires des Gémeaux avec des traits du visage asiatiques montré.
« Pouvez-vous créer une image d’un couple en Allemagne en 1820 ? » – Certaines des images créées par Gemini ne semblent pas très appropriées.
Source : Capture d’écran de Google Gemini
Les Gémeaux ont partiellement refusé de créer des images de Blancs
Mais comment se produisent ces échecs ? Qu’est-ce qui pousse les Gémeaux à créer des images si diverses ? Pour ce faire, vous devez savoir comment fonctionne l’intelligence artificielle qui se cache derrière.
Lors du sommet numérique d’Iéna, les milieux politiques et économiques ont discuté du tournant numérique en Allemagne. Le besoin de rattraper l’IA est particulièrement grand.21 novembre 2023 | 1:37 minutes
Les modèles d’IA apprennent à partir de photos Internet
Pour que les modèles d’IA puissent créer des images, ils reçoivent des données d’entraînement, par exemple des masses de photos provenant de bases de données ou d’Internet. En fin de compte, ils reflètent principalement ce qu’ils ont appris grâce aux données de formation. Le problème : ces données sont souvent déformées, explique Björn Ommer, responsable du Computer Vision & Learning Group à l’Université Ludwig Maximilians de Munich.
Un exemple : le mot « nurse » non sexiste signifie infirmière ou infirmière auxiliaire en anglais. Cependant, sur les photos publiées sur Internet, les « infirmières » sont presque exclusivement représentées par des femmes, ce que chacun peut constater par lui-même en effectuant une recherche d’images sur Google. Une IA apprendrait d’abord que « infirmière » est un métier exclusivement féminin. Dans d’autres professions, les femmes sont sous-représentées, voire inexistantes.
Le 30 novembre 2022, la version bêta d’un outil de chat qui répond grâce à l’IA a été mise en ligne. En une semaine, ChatGPT comptait un million d’utilisateurs. 30 novembre 2023 | 4:32 minutes
L’intention des développeurs d’IA : ne pas reproduire les clichés
Les développeurs d’IA ne souhaitent généralement pas représenter le monde exactement tel qu’il a été créé sur Internet, car cela reviendrait à reproduire des clichés. On pourrait donc essayer de contrecarrer activement de telles distorsions, explique Ommer : « Si les développeurs observent une sous-représentation des femmes ou des peaux foncées dans les données d’entraînement ou s’y attendent dans les invites des utilisateurs, certaines approches contrecarrent cela en faussant délibérément la probabilité. »
Mais comment cela affecte-t-il finalement les images générées ?
Les développeurs de ChatGPT ont publié un générateur de films. Son nom est Sora et il peut créer des vidéos réalistes à partir de courtes spécifications de texte.16/02/2024 | 1:31 minutes
Les générateurs d’images doivent inventer les détails des images
Les invites de l’utilisateur – c’est-à-dire les ordres adressés à l’IA – ne contiennent généralement que quelques mots et ne sont donc pas très détaillées. L’IA devrait quand même générer une image complexe avec des millions de pixels. La tâche ne peut être accomplie que si la description est plus détaillée.
La solution : des détails supplémentaires sont ajoutés aux invites avant le début de la génération de l’image. «Cette description plus détaillée peut désormais également être inventée automatiquement par une autre partie de l’IA», explique Björn Ommer, responsable du groupe Computer Vision & Learning à l’université Ludwig Maximilians de Munich.
Images d’intelligence artificielle
:Pourquoi les horloges IA indiquent presque toujours 10h10
Un court texte suffit et les images sont créées selon vos envies. Les générateurs d’images IA sont déjà utilisés dans le marketing et pour concevoir des sites Web, mais ils posent certains problèmes.
par David Metzmacher
Déclaration de Google : « Objectif manqué »
Le ministre de l’Intérieur Faeser a inauguré un nouveau centre de situation informatique à Bonn. Il vise à mieux protéger les infrastructures critiques contre les cyberattaques.02/06/2024 | 1:47 minutes
Choc culturel aux États-Unis
Voici à quoi ressemblent les résultats de l’image de Dall-E (Microsoft) :
« Un couple en Allemagne 1820 »
Ici, l’invite était « créer une image d’un couple en Allemagne en 1820 » – Dall-E crée des images de personnes blanches.
Source: Dall-E (Microsoft)
Cependant, d’autres générateurs d’images tels que Midjourney ou Dall-E ne commettent pas les erreurs Gemini. Et certains semblent – à leur manière – reproduire des clichés. Un test réalisé par ZDFheute le montre : à la demande « créer une image d’un PDG au bureau », Dall-E affiche principalement des hommes blancs, même si PDG est un mot neutre en termes de genre. Sur les 16 images créées, 13 montraient un jeune homme dynamique en tenue professionnelle avec une chevelure abondante. Une femme n’est visible que sur trois des photos.