Lancement décevant de GPT-5 : analyse de ses performances

Le lancement de GPT-5 par OpenAI ne s’est pas déroulé comme prévu. Au lieu de susciter l’enthousiasme pour ce nouveau modèle, les utilisateurs semblent déçus par les performances perçues de GPT-5, considérées comme inférieures à celles de son prédécesseur, GPT-4. Sam Altman, le CEO d’OpenAI, avait pourtant annoncé une évolution spectaculaire, mais de nombreux utilisateurs ressentent une absence de cette magie qui avait marqué le lancement de GPT-4, notamment grâce à sa capacité à générer des images, qui avait littéralement “fait fondre” les serveurs de l’entreprise.

Le concept de *router* : une promesse inachevée

Le problème majeur réside dans le concept de router introduit par OpenAI. Ce dernier est censé déterminer quel modèle de GPT-5 utiliser en fonction de la complexité de la conversation et des besoins des utilisateurs. Cependant, dans les premières phases, le router a tendance à opter pour le modèle le plus basique, ce qui a contraint l’expérience des utilisateurs. Cela a conduit à des évaluations excessivement négatives du modèle Thinking, qui est censé être un modèle de raisonnement plus avancé. Ainsi, les utilisateurs ont souvent l’impression que GPT-5 est moins intelligent que GPT-4.

Transparence et coût : un débat houleux

Cette problématique de performance soulève des interrogations sur le choix des modèles effectué par OpenAI. Les utilisateurs avancent l’hypothèse que ces choix ne seraient pas basés uniquement sur l’efficacité technologique, mais aussi sur l’argent que cela rapporterait à l’entreprise. Ce manque de transparence a alimenté des théories conspirationnistes, accusant OpenAI de privilégier un modèle moins coûteux pour des raisons financières, au détriment de la qualité du service.

Aidan McLaughlin, membre d’OpenAI, a tenté de défendre cette approche lors de commentaires publics. Selon lui, le router n’est pas un outil de réduction des coûts, mais un moyen de maximiser l’efficacité en fonction des demandes des utilisateurs. Toutefois, cela n’a pas suffi à apaiser les critiques face aux performances jugées insatisfaisantes.

Reconnaissance des échecs et ajustements

Lors d’une session de questions-réponses sur Reddit, Sam Altman a reconnu que de nombreux utilisateurs estimaient que GPT-5 ne fonctionnait pas aussi bien que son prédécesseur. Il a admis que le router ne fonctionnait pas idéalement au moment du lancement, ce qui justifie certaines des déceptions ressenties.

En réponse à ces critiques, OpenAI a décidé de réintroduire la possibilité pour les abonnés de la formule Plus de revenir à GPT-4, tout en ajustant le router pour améliorer son efficacité dans le choix des modèles adaptés à chaque demande. Cependant, des questions subsistent concernant la méthodologie derrière ces sélections.

Le recours à des astuces par les utilisateurs

Face aux limitations du router, de nombreux utilisateurs ont commencé à développer des stratégies pour inciter GPT-5 à utiliser le modèle de raisonnement. Par exemple, en intégrant des phrases telles que “réfléchis profondément à ta réponse”, ils parviendraient à activer le modèle Thinking plus efficacement. Cette astuce a été dénoncée comme étant révélatrice des faiblesses du système actuel, mais elle témoigne d’un besoin d’adaptation rapide face aux défaillances perçues du router.

Évolutions et fonctionnalités gratuites

OpenAI a aussi commencé à intégrer de nouvelles options pour l’usage gratuit de GPT-5, comme un bouton de raisonnement qui permettrait aux utilisateurs de tirer profit du modèle Thinking. Selon Altman, ce bouton, bien qu’encore subtil, vise à offrir une forme d’accès élargi aux capacités de raisonnement, mais sans nécessairement révéler toutes les fonctionnalités.

Cette dynamique a eu pour effet d’augmenter de manière significative le nombre d’utilisateurs recourant à cette fonctionnalité de raisonnement, ce qui est un développement positif.

Conclusion

Le lancement de GPT-5 par OpenAI a suscité plus de questions que de réponses. Les attentes étaient élevées, mais la cybersécurité, les impacts financiers et les choix technologiques ont tous joué un rôle dans une introduction qui ne semble pas répondre aux espoirs des utilisateurs. Alors qu’OpenAI s’efforce de corriger ces problèmes, les retours d’expérience des utilisateurs restent cruciaux pour la pérennité et l’amélioration des futures versions du modèle.



F1-ES