L’intelligence artificielle a dépassé les limites des connaissances scientifiques en prédisant la forme de presque toutes les protéines connues, une percée qui accélérera considérablement le temps nécessaire pour faire des découvertes biologiques.
La recherche a été effectuée par la société d’intelligence artificielle basée à Londres DeepMind – détenue par la société mère de Google Alphabet – qui a utilisé son algorithme AlphaFold pour créer la base de données la plus complète et la plus précise à ce jour sur les plus de 200 millions de protéines connues.
La prédiction de la structure d’une protéine à partir de sa seule séquence d’ADN a été l’un des plus grands défis de la biologie. Les méthodes expérimentales actuelles pour déterminer la forme d’une seule protéine prennent des mois ou des années dans un laboratoire, c’est pourquoi seulement environ 190 000, soit 0,01 % des structures protéiques connues, ont été résolues.
Le directeur général de DeepMind, Demis Hassabis, a déclaré que l’IA avait “fourni aux biologistes structurels ce nouvel outil puissant maintenant, où vous pouvez rechercher une structure 3D d’une protéine presque aussi facilement qu’en faisant une recherche par mot-clé sur Google”.
“[It’s] ouvrant d’énormes opportunités pour AlphaFold d’avoir un impact sur . . . durabilité, insécurité alimentaire et maladies négligées », a-t-il ajouté.
En juillet 2021, DeepMind a annoncé qu’il avait prédit la forme de toutes les protéines humaines, aidant à mieux comprendre la santé et la maladie humaines. Cette base de données a été multipliée par 200 et contient désormais plus de 200 millions de structures protéiques prédites, couvrant presque tous les organismes sur Terre dont le génome a été séquencé – du parasite du paludisme à l’abeille.
Ces structures sont désormais disponibles via une base de données publique hébergée par l’Institut européen de bioinformatique du Laboratoire européen de biologie moléculaire (EMBL-EBI). Au cours de l’année qui a suivi son lancement, plus de 500 000 chercheurs du monde entier ont accédé à la base de données AlphaFold pour afficher plus de 2 millions de structures, a indiqué la société.
“Presque tous les médicaments qui sont arrivés sur le marché au cours des dernières années ont été en partie conçus grâce à la connaissance des structures des protéines”, a déclaré Janet Thornton, scientifique principale et directrice émérite à l’EMBL-EBI. « Avoir accès à toutes ces nouvelles structures, notamment pour . . . organismes inhabituels pour lesquels nous n’avions pas de données structurelles, il y a là une réelle opportunité non seulement pour concevoir de nouveaux médicaments . . . mais pour s’assurer que ces médicaments n’atteignent pas les protéines humaines et ne provoquent pas de réactions croisées.
Les protéines sont souvent désignées comme les éléments constitutifs de la vie. Leurs structures sont importantes car elles dictent la façon dont les protéines font leur travail. Connaître la forme d’une protéine, par exemple un anticorps en forme de Y, en dit plus aux scientifiques sur le rôle de cette protéine.
Être capable de prédire facilement la forme d’une protéine pourrait permettre aux scientifiques de la contrôler et de la modifier, afin d’améliorer sa fonction en modifiant sa séquence d’ADN ou de cibler des médicaments qui pourraient s’y attacher. Par exemple, l’étude des protéines de surface sur un parasite du paludisme peut aider à comprendre comment les anticorps s’y lient, et donc comment lutter efficacement contre l’agent pathogène.
“L’utilisation d’AlphaFold a été vraiment transformationnelle, nous donnant une vision précise de [a] protéine de surface du paludisme », a déclaré Matthew Higgins, professeur de biochimie à l’université d’Oxford qui étudie le paludisme. Son équipe utilise ces connaissances pour développer un nouveau vaccin contre le paludisme, a-t-il déclaré.
Alors que les scientifiques devront encore confirmer la structure d’une protéine par des expériences, ces prédictions fourniront une longueur d’avance massive et accéléreront le temps nécessaire pour terminer le processus.
DeepMind a déclaré avoir exclu les virus de la base de données pour éviter que ces données ne soient potentiellement militarisées par de mauvais acteurs ou des bioterroristes.
En novembre 2021, DeepMind a annoncé une société dérivée, Isomorphic Labs, qui, selon elle, appliquerait AlphaFold et d’autres outils d’IA pour accélérer la découverte de médicaments. Il a annoncé jeudi qu’il ouvrirait un laboratoire humide traditionnel à l’Institut Francis Crick pour atteindre cet objectif.
« Nous pouvons commencer à réfléchir à la conception de médicaments de bout en bout. Ce serait mon rêve, où vous accélérez l’ensemble du processus, pas seulement les parties de la structure. . . pour de nouveaux médicaments et remèdes », a déclaré Hassabis. “Ça vient.”