AlphaFold — Wikipédia

AlphaFold est un logiciel d'intelligence artificielle développé par Google DeepMind qui fournit une prédiction de la structure des protéines à partir de leur séquence en acides aminés. En 2018, sa première version se classe en tête du concours Critical Assessment of Protein Structure Prediction (CASP (en)). En 2020, sa seconde version remporte à nouveau le concours avec un niveau de précision salué par le monde scientifique, étant parfois même qualifié de révolutionnaire. Des centaines de milliers de prédiction de structures ainsi que la version AlphaFold 2 du logiciel sont mis en accès libre à partir de 2021.

Description[modifier | modifier le code]

Principe[modifier | modifier le code]

AlphaFold est un logiciel d'intelligence artificielle qui fait appel à l'apprentissage profond[1].

En 2020, selon John Jumper (chef du développement d'AlphaFold chez DeepMind), interviewé dans la revue Science : AlphaFold associe l'apprentissage profond à un « algorithme d'attention » qui en quelque sorte copie la manière dont un humain assemble les pièces d'un puzzle quand il connecte entre eux de petits amas de pièces préalablement réalisés (un amas représentant ici un petit assemblage d'acides aminés[2].

Le système AlphaFold utilise 128 processeurs d'apprentissage automatique qui ont entraîné cet algorithme sur environ 170 000 structures protéiques déjà connues [2].

L'IA peut ensuite modéliser des protéines constituées de dizaines à centaines d'acides aminés en tenant compte de ce qu'elle a appris sur la manière dont l'ordre de ces acides aminés dicte la façon très complexe dont « la myriade de poussées et de tractions entre eux donne naissance aux formes 3D complexes des protéines, qui, à leur tour, déterminent leur fonctionnement. La connaissance de ces formes aide les chercheurs à concevoir des médicaments qui peuvent se loger dans les poches et les crevasses des protéines. Il devient alors possible de synthétiser des protéines avec la structure souhaitée, ce qui pourrait ainsi accélérer le développement d'enzymes fabricant des biocarburants ou dégradant les déchets plastiques »[2].

Base de données[modifier | modifier le code]

En 2021, AlphaFold/DeepMind a ouvert une base de données (publique) de modèles de structure prédits par l'IA, pour plus de 365 000 protéines humaines, et de 20 organismes modèles ; prévoyant d'y ajouter plus de 100 millions de protéines issues de diverses espèces. En 2024, cette base contient « des prédictions de structure pour presque toutes les protéines connues ». Elle pourrait révolutionner la chimie et la biochimie computationnelles[3].

Perspectives[modifier | modifier le code]

DeepMind travaille à une version plus avancée d'AlphaFold permettant de modéliser des complexes protéiques avec des acides nucléiques, de petits ligands, des ions et des résidus modifiés.

DeepMind a aussi créé Isomorphic Labs, une société dotée d'une nouvelle version d'AlphaFold ayant vocation à créer plus rapidement de nouveaux médicaments[3].

Historique[modifier | modifier le code]

AlphaFold 1[modifier | modifier le code]

Fin 2018, la première version du logiciel AlphaFold a permis à une équipe de chercheurs de se classer première lors du 13e concours Critical Assessment of Protein Structure Prediction (CASP (en)). Cette version utilise un réseau neuronal profond pour estimer une carte de distance entre les résidus et un potentiel statistique pour optimiser la structure. Elle a particulièrement bien réussi à prédire la structure la plus précise de cibles classées parmi les plus difficiles par les organisateurs du concours, et pour lesquelles aucune structure modèle existante n'était disponible.

AlphaFold 2[modifier | modifier le code]

En novembre 2020, avec AlphaFold 2, l'équipe a gagné une seconde fois le concours du CASP[4],[5], atteignant un niveau de précision inégalé pour la prédiction de structures protéiques[6],[7],[Note 1]. Ces résultats ont été décrits comme révolutionnaires[8],[9],[10],[11],[12],[13], et pouvant faire gagner des décennies aux laboratoires de recherche[2]. Cette version du logiciel utilise alors un système de sous-réseaux couplés basés sur des transformers, lui permettant d'affiner progressivement les informations sur les relations entre les résidus et les séquences, pour prédire la structure finale[6]. Ces résultats ont été qualifiés de « stupéfiants » et « transformationnels » et cette IA a été saluée comme une avancée majeure pour la biologie et l'accélération de la recherche en santé, chimie et pharmacochimie[14]. Selon Science, cette IA « a résolu l'un des grands défis de la biologie : prédire comment les protéines s'enroulent à partir d'une chaîne linéaire d'acides aminés en formes 3D qui leur permettent d'effectuer les tâches de la vie », et semble déjà assez précis pour prédire les effets d'une unique mutation[2].

La précision reste cependant insuffisante pour un tiers des prédictions de l'IA, et le calcul ne révèle pas le mécanisme ou les règles du repliement des protéines, faisant que ce problème ne peut être considéré comme complètement résolu[15],[16]. Elle ne prend pas non plus en compte les interactions entre les protéines et d'autres molécules, ni les modifications post-traductionnelles qui peuvent affecter la structure et la fonction des protéines[2]. Les méthodes traditionnelles expérimentales (cristallographie aux rayons X, cryo-microscopie électronique (cryo-EM) ne donnent pas toujours de bons résultats non plus[2].

En juillet 2021, AlphaFold 2 est décrit dans un article publié dans Nature[17]. Le logiciel est libre, de même qu'une base de données regroupant les structures de la plupart des protéines de plusieurs espèces, dont 20 000 protéines humaines[18],[19]. La même année, un groupe de recherche d'Harvard met en ligne un outil « notebook » permettant de tester AlphaFold 2 sans voir à l'installer sur son ordinateur[7],[20],[21].

En septembre 2022, grâce aux résultats d'AlphaFold, il est annoncé que Demis Hassabis, directeur général de DeepMind, et John Jumper (en) reçoivent le prix des avancées capitales dans les sciences de la vie « pour avoir développé une méthode d'apprentissage (pour intelligence artificielle) en profondeur qui prédit rapidement et avec précision la structure tridimensionnelle des protéines à partir de leur séquence d'acides aminés »[22].

Liens externes[modifier | modifier le code]

Notes et références[modifier | modifier le code]

Notes[modifier | modifier le code]

  1. Le test compare la prédiction à un travail similaire qui serait fait en laboratoire. AlphaFold a atteint ou dépassé la note de 90/100 dans deux tiers des cas.

Références[modifier | modifier le code]

  1. « Comment fonctionne AlphaFold, le programme d'intelligence artificielle qui dessine les protéines ? », Le Monde.fr,‎ (lire en ligne, consulté le ).
  2. a b c d e f et g (en) Robert Service, « ‘The game has changed.' AI triumphs at solving protein structures », Science,‎ (ISSN 0036-8075 et 1095-9203, DOI 10.1126/science.abf9367, lire en ligne, consulté le ).
  3. a et b (en) Ewen Callaway, « AlphaFold found thousands of possible psychedelics. Will its predictions help drug discovery? », Nature,‎ (DOI 10.1038/d41586-024-00130-8, lire en ligne, consulté le ).
  4. (en) « DeepMind's AI makes gigantic leap in solving protein structures », sur Nature, (consulté le ).
  5. (en) Sam Shead, « DeepMind solves 50-year-old ‘grand challenge' with protein folding A.I. », sur CNBC, (consulté le )
  6. a et b (en) « DeepMind's protein-folding AI has solved a 50-year-old grand challenge of biology », sur MIT Technology Review (consulté le )
  7. a et b « L'intelligence artificielle, génie de la biologie moléculaire », Le Monde.fr,‎ (lire en ligne, consulté le )
  8. Maurice Mashaal, « Repliement des protéines : la percée de l'IA », sur Pourlascience.fr, (consulté le )
  9. « AlphaFold, l'intelligence artificielle en protéomique », sur Sciences et Avenir (consulté le )
  10. Science-et-vie.com, « Intelligence artificielle : la biologie moléculaire entre... - Science & Vie », sur www.science-et-vie.com, (consulté le )
  11. (en) Ewen Callaway, « ‘It will change everything': DeepMind's AI makes gigantic leap in solving protein structures », Nature, vol. 588, no 7837,‎ , p. 203–204 (DOI 10.1038/d41586-020-03348-4, lire en ligne, consulté le )
  12. (en) « ‘The game has changed.' AI triumphs at solving protein structures », sur www.science.org (consulté le )
  13. (en) « DeepMind AI cracks 50-year-old problem of protein folding », sur the Guardian, (consulté le )
  14. (en) Sam Shead, « DeepMind solves 50-year-old ‘grand challenge' with protein folding A.I. », sur CNBC, (consulté le ).
  15. (en) Philip Ball, « Behind the screens of AlphaFold », sur Chemistry World, (consulté le )
  16. (en-US) Stephen, « No, DeepMind has not solved protein folding », sur Reciprocal Space (consulté le )
  17. (en) Ewen Callaway, « DeepMind's AI predicts structures for a vast trove of proteins », Nature, vol. 595, no 7869,‎ , p. 635–635 (DOI 10.1038/d41586-021-02025-4, lire en ligne, consulté le )
  18. (en) « AI firm DeepMind puts database of the building blocks of life online », sur the Guardian, (consulté le )
  19. (en-GB) « AI breakthrough could spark medical revolution », BBC News,‎ (lire en ligne, consulté le )
  20. (en) Michael Eisenstein, « Artificial intelligence powers protein-folding predictions », Nature, vol. 599, no 7886,‎ , p. 706–708 (DOI 10.1038/d41586-021-03499-y, lire en ligne, consulté le )
  21. (en) Milot Mirdita, Sergey Ovchinnikov et Martin Steinegger, « ColabFold - Making protein folding accessible to all », bioRxiv,‎ , p. 2021.08.15.456425 (DOI 10.1101/2021.08.15.456425, lire en ligne, consulté le )
  22. « For developing a deep learning AI method that rapidly and accurately predicts the three-dimensional structure of proteins from their amino acid sequence. » sur (en) Winners Of The 2023 Breakthrough Prizes In Life Sciences, Mathematics And Fundamental Physics Announced.