Tout ce que l’IA a déjà révolutionné dans la recherche scientifique
Réflexion, planification stratégique, analyse des données, génération d’hypothèses de travail, enseignement universitaire… La montée en puissance des outils d’intelligence artificielle, en particulier des « modèles de fondation », bouleverse le travail des chercheurs. Focus sur la biochimie, la météorologie et les mathématiques.
Lorsque vous aurez fini la lecture de cet article, beaucoup des exemples donnés seront sans doute dépassés. Ainsi vont les progrès des techniques d’intelligence artificielle (IA) appliquées aux sciences. Car, avec moins de bruit que dans d’autres secteurs (informatique, traduction, cinéma, journalisme…), l’IA bouscule aussi la manière dont les scientifiques travaillent au quotidien en maths, en chimie, en biologie, en physique, en archéologie ou encore en médecine.
Et encore, on ne parle pas ici de la vague qui submerge littéralement les jurys des conférences ou les demandes de financement de projet, avec des articles entièrement ou partiellement rédigés par des chatbots. Ni de la « parade », si l’on peut dire, qui consiste à évaluer cette masse surnuméraire par… d’autres IA.
Non, il s’agit de changements plus profonds qui touchent au cœur du métier. Ses méthodes de production, mais aussi ses étapes de réflexion, de planification stratégique, d’analyse des données, de génération et d’évaluation d’hypothèses de travail… En amont de ces processus aussi, les conséquences se font sentir sur la manière d’enseigner, voire sur le déroulement d’une thèse : certains s’interrogent sur la pertinence d’une durée de trois-quatre ans à l’heure où des outils trouvent de bons résultats en quelques heures ou jours. Si nous ne sommes qu’aux prémices de ces bouleversements, le sujet est déjà sur toutes les lèvres, y compris, peut-être de façon surprenante, chez la « reine des sciences », les mathématiques.
A vrai dire, l’IA est dans les laboratoires depuis longtemps. L’une de ses premières générations, l’apprentissage statistique, ou machine learning, est indispensable à l’analyse de données. La nouveauté vient de la deuxième vague, celle de l’apprentissage dit « profond », ou deep learning, dont sont issus notamment les générateurs de textes ou d’images connus du grand public.
Plusieurs points communs expliquent les succès à venir. Il y a d’abord les données, cette matière indispensable pour la mise au point des systèmes d’IA, leur apprentissage. En science, la particularité est que ces bases de données ont patiemment été constituées et partagées par les universités, pour être finalement utilisées par les IA développées par les grandes entreprises, Google, Meta, OpenAI, Nvidia ou leurs équivalents chinois. Ainsi, des structures tridimensionnelles de protéines, des informations météo sur plusieurs décennies, des calculs d’interactions chimiques entre molécules, des articles scientifiques, des images astrophysiques ont servi à développer de grands modèles comme AlphaFold, de Google, en biologie, ou bien FourCastNet, de Nvidia, pour la météo…
L’autre clé est que la magie rendue visible avec le lancement, en novembre 2022, de ChatGPT opère aussi en science. Il s’agit du concept de « modèle de fondation ». Autrement dit, un logiciel mis au point grâce à l’ingurgitation massive de tâches simples, comme compléter le mot suivant dans une phrase, s’avère capable de tâches plus complexes et multiples : traduire, résumer, reformuler, analyser, coder, voire « raisonner »… Avec les atomes, les molécules ou les températures, ce principe fonctionne aussi et permet de rêver à des accélérations de calculs et de découvertes.
Fixons donc, pour l’histoire, quelques instantanés de ces révolutions en cours dans les laboratoires de biochimie, de météorologie et de mathématiques.
En biochimie, un vocabulaire avec des règles
« L’IA change tout ! », dit souvent, lors de ses conférences, Alessandra Carbone, professeure à Sorbonne Université au Laboratoire de biologie computationnelle, quantitative et synthétique. A son bureau, cette mathématicienne passée à la modélisation des interactions entre molécules explique en quoi « l’IA a changé [sa] vie ». Son but est de comprendre les fonctions des dizaines de milliers de protéines du corps humain (hémoglobine, collagène, insuline, enzymes…) ou des autres organismes, et comment elles interagissent entre elles. L’un des intérêts est que ces molécules plus ou moins grosses peuvent être autant de cibles pour des thérapies.
Dans sa vie « d’avant », elle avait participé à un programme international soutenu par IBM et ses superordinateurs. Après des années de travail, en 2013, l’équipe avait publié un réseau d’interactions entre 168 protéines. « Aujourd’hui, on fait mille fois plus et mieux ! On peut créer ce réseau en trois jours de calcul pour 20 000 protéines », poursuit la chercheuse, anticipant la parution d’un article démontrant ses affirmations. Mais elle a déjà publié les principes de la méthode, qui passe par le fait d’apprendre à un programme le langage des protéines, tout comme un chatbot apprend à parler l’humain.
Pour les biochimistes, les « lettres » sont les acides aminés ; les « phrases », des protéines faites de plusieurs acides aminés ; les « pages », les formes tridimensionnelles de ces molécules en partie responsables de leur activité… Et, avec ce vocabulaire, tout n’est pas possible, il existe des règles : telle protéine interagit avec certaines et pas d’autres, telle mutation change tout ou, au contraire, presque rien…
L’un des premiers modèles de ce genre, AlphaFold, dont les auteurs, Demis Hassabis et John Jumper, ont été couronnés du prix Nobel de chimie en 2024, traduisait une séquence génétique en forme tridimensionnelle de protéine. Depuis, des modèles comme ESM (Meta) ou Ankh (université technique de Munich et université Columbia) se passent de la séquence génétique et partent directement de la succession d’acides aminés. Le propre de ces modèles est que, à partir d’un entraînement assez rustique – prévoir l’acide aminé suivant dans une séquence –, ils construisent une représentation abstraite de la manière dont des acides aminés s’assemblent. Cela sert de base, ensuite, à des modèles ayant d’autres fonctions : prédire la structure ou l’effet d’une mutation, ou une fonction, ou bien encore construire le réseau des protéines en interaction…
Alessandra Carbone promet ainsi plusieurs résultats à paraître. Avec des neuroscientifiques, elle a, à partir de deux protéines connues, prédit que d’autres devraient intervenir. Elle a aussi mis au point une méthode pour identifier automatiquement la fonction de centaines de protéines en les agrégeant par affinités. Elle pense également avoir compris un mystère de ces modèles qui prévoient des interactions entre molécules, sans pouvoir dire exactement quelles parties sont impliquées.
« La chimie se numérise, comme d’autres secteurs avant elle », souligne Jean-Philip Piquemal, qui, lui aussi, avec sa double casquette de professeur à Sorbonne Université et de cofondateur de Qubit Pharmaceuticals, développe un modèle de fondation, FeNNix-Bio1. Il sera bientôt publié après évaluation par des pairs, mais a été décrit en prépublication en décembre 2025. Ce modèle sert à prédire l’interaction de peptides (des petites chaînes d’acides aminés), qui peuvent être des médicaments, avec de plus grosses molécules, en tenant compte du milieu liquide. « En matière d’échelle, c’est comme prédire la meilleure zone d’atterrissage d’une sonde sur Mars. On cherche à savoir où un peptide interagit », observe le spécialiste.
Lui a travaillé sur sa propre base de données, qui stocke des millions de calculs de force entre des atomes et des molécules, réalisés par des méthodes classiques, coûteuses en calcul intensif. Cela sert de base à l’entraînement et fait qu’ensuite le modèle peut s’attaquer à des configurations nouvelles et complexes. « Avant, il nous fallait quatre-cinq mois pour évaluer une interaction entre deux molécules d’intérêt. Maintenant, une nuit suffit », apprécie Jean-Philip Piquemal. C’est le temps qu’il faut pour adapter le gros modèle au contexte particulier, en lui fournissant beaucoup moins de données. Qubit Pharmaceuticals a publié, en avril, son premier brevet pour un candidat anticancer.
Dans la chimie non biologique, la satisfaction et les promesses sont aussi de mise chez Marco Saitta, professeur à Sorbonne Université et au Laboratoire de physique de l’Ecole normale supérieure. « Toute ma carrière, j’ai cherché des méthodes pour calculer des interactions, en simplifiant les modèles pour arriver à simuler des problèmes complexes. Et j’étais frustré de ne pas pouvoir attaquer de grosses molécules. Avec l’IA, on peut désormais », salue-t-il, en donnant pour exemple une publication d’août 2025 qui a permis de comprendre pourquoi certaines électrodes poreuses permettent à des supercondensateurs de se recharger trois fois plus vite (des batteries avec peu d’énergie mais déchargeables rapidement). L’équipe a utilisé un autre modèle de fondation, MACE, qui, comme FeNNix-Bio1, a été entraîné en bénéficiant des calculs effectués depuis plusieurs années pour évaluer les forces entre atomes. « Dans ce domaine, l’Europe a une carte à jouer pour rester dans les leaders », estime Marco Saitta.
Pour la météo, des prédictions rapides… et des défauts
La révolution est déjà en cours dans la prévision météorologique et les sciences du climat. Entre février 2022 et janvier 2023, plusieurs modèles de prévisions globales sont sortis, battant les meilleures simulations de l’époque, et surtout accélérant de 1 000 à 10 000 fois les temps de calcul. Nouveauté, ces progrès viennent d’acteurs inattendus. Le fabricant de cartes graphiques Nvidia, avec FourCastNet, le géant chinois de l’électronique Huawei, avec Pangu-Weather, ou Microsoft, avec ClimaX, et, un peu moins surprenant, l’inévitable Google, avec GraphCast. Aussitôt, le Centre européen pour les prévisions météorologiques à moyen terme (ECMWF) a réagi et également sorti son modèle, AIFS, intégré depuis février 2025 à ses flux de prévisions, qui nourrissent la plupart des centres nationaux pour réaliser leurs bulletins locaux.
La technique d’apprentissage est simple, ou en tout cas classique. La mise au point consiste à prédire les valeurs de l’atmosphère au jour J + 1, à partir de celle du jour J, en puisant dans la base de données ERA5 de l’ECMWF, qui contient des informations atmosphériques depuis 1940. Cette phase de mise au point est longue, mais la prédiction est ensuite très rapide.
Les prévisions sont aussi parfois meilleures que les simulations tenant compte de la physique. La force de ces systèmes est en effet d’avoir appris des informations cachées dans les données, qui échappent aux simulations classiques.
Cependant, des défauts persistent. Le 29 avril, dans Science Advances, une équipe internationale pointait une fois de plus la difficulté à prédire des événements extrêmes (vents violents, vagues de chaleur ou de froid). L’autre faiblesse est que, pour l’instant, les calculs portent sur de grandes échelles et pas sur des prévisions locales. Cela est dû au fait qu’ERA5 a une maille assez lâche d’environ 30 × 30 kilomètres. L’arrivée prochaine d’ERA6, avec une maille deux fois plus petite, devrait changer la donne. Résultat, pour Météo-France, le passage à l’IA « est en cours de développement », selon Laure Raynaud, responsable de l’équipe chargée du projet, qui souligne clairement qu’« un nouveau paradigme a émergé ».
Pour faciliter la prédiction d’événements extrêmes, des parades existent. Comme ajouter des données hors norme dans l’entraînement. Ou bien utiliser des méthodes statistiques « classiques » pour sélectionner des trajectoires atypiques et les prolonger dans le temps grâce à l’IA. Pour des temps plus longs, à l’échelle de l’étude d’un climat, l’équipe de Freddy Bouchet, du Laboratoire de météorologie dynamique, a procédé ainsi pour estimer la probabilité de températures extrêmes qui n’arriveraient qu’une fois tous les mille ans.
Autre tendance, passer des modèles dits « déterministes » de la première génération, qui pour une même condition initiale donnent toujours la même réponse, à des modèles probabilistes, qui proposent plusieurs scénarios enrichis de probabilité d’advenir. Cette nouvelle génération appartient à la famille des modèles génératifs, comme ChatGPT, c’est-à-dire que les IA répondent aux questions par des cartes de températures, de pressions, d’humidité… Cela est plus utile aux prévisionnistes, mais ces techniques sont encore un peu lentes. En avril, une équipe de l’Institut national de recherche en sciences et technologies du numérique a proposé ArchesWeatherGen, qui entre dans cette catégorie et réduit d’environ dix fois les temps d’entraînement des modèles, donc les consommations d’énergie.
En mathématiques, une crise se profile
Les maths sont déjà passées par tous les stades en matière de relation avec l’IA. La moquerie, devant les grosses erreurs des premiers chatbots en calcul ou en logique. Puis le scepticisme, avec des performances marquantes mais pas fondamentales, comme des succès aux Olympiades de maths. Puis la sidération, quand de « vrais » problèmes difficiles sont « tombés ». Tel le problème 1196 d’Erdös, en théorie des nombres, résolu par un quasi-amateur à l’aide de ChatGPT, en avril. Ou surtout, le 20 mai, quand OpenAI a annoncé avoir invalidé une conjecture du même Erdös faite en 1946, en géométrie combinatoire. Et, enfin, une sorte de ruée vers ces outils pour les plus entreprenants.
« Ça change vite. La période est un peu folle. Les gens s’en emparent et ça devient un collaborateur avec qui on discute. C’est vertigineux », témoigne Gérard Biau, ancien directeur de Sorbonne Cluster for AI, mathématicien à Sorbonne Université, lui-même utilisateur. « Ce qui m’aurait pris quelques semaines d’exploration ne me prend plus que quelques minutes, avec des séquences de travail avec le chatbot, comme je le ferais avec un collaborateur ou un étudiant au tableau », poursuit-il, louant la « grosse culture » mathématique des derniers modèles d’Anthropic ou d’OpenAI.
« Ces progrès sont devenus vraiment difficiles à ignorer, même pour les mathématiciens les plus conservateurs, estime Amaury Hayat, professeur à l’Ecole nationale des ponts et chaussées. Toutes les semaines, on entend parler d’un collègue qui n’avait pas réussi à résoudre un problème par lui-même pendant un bon moment. Et une IA y est parvenue. » Lui-même est dans ce cas avec la démonstration, en mai, d’un problème sur lequel il travaillait depuis une dizaine d’années.
Timothy Gowers, médaillé Fields 1998 et professeur au Collège de France, a aussi crié victoire, le 8 mai, sur son compte X : ChatGPT « a trouvé le résultat, qui selon moi aurait parfaitement constitué un chapitre de thèse, en quelques heures ».
En juin, la deuxième édition du défi First Proof, qui propose à la sagacité des IA dix problèmes inédits rédigés par des professionnels, donnera son verdict. Lors de la première édition, en février, Google, avec son système Aletheia, ou OpenAI avaient résolu respectivement six et cinq de ces problèmes.
D’autres progrès importants sont enregistrés sur une tâche un peu absconse mais fort utile pour les professionnels : la formalisation et la vérification des preuves. L’un des avantages des maths, très adapté aux progrès des machines, est que les affirmations produites sont vérifiables par l’application de règles logiques et de définitions. Des langages ont même été développés – Lean, Coq, Isabelle… – pour prouver automatiquement que des énoncés ou des logiciels entiers sont corrects. Pour cela, il faut traduire des énoncés écrits en langage mathématique dans ces nouveaux langages. C’est la formalisation, et désormais l’autoformalisation, c’est-à-dire que la tâche est effectuée par des machines. En février, une première réussite marquante a été obtenue. La démonstration qui a valu à l’Ukrainienne Maryna Viazovska sa médaille Fields en 2022 a été formalisée à l’aide de Gauss, une IA de la société Math, Inc., créée pour développer ce nouveau marché.
« Ces systèmes d’IA vont devenir très forts. Plus forts que la majorité des professionnels. On ne peut plus l’ignorer, mais cela aura des conséquences », prévient Amaury Hayat. La formation est d’ores et déjà chamboulée, avec le retour d’examens « papier-crayon » et la fin de projets menés hors classe. « La situation est compliquée avec nos étudiants. Il faut continuer à leur enseigner les concepts pour qu’ils bénéficient d’une culture solide, tout en leur faisant aussi manipuler ces nouveaux outils », insiste Gérard Biau, pour qui « le patron reste l’humain, pour les idées originelles, les directions… La machine travaille pour nous. Donc ça demande d’être fort dans son domaine ».
Cette mise à disposition des outils pose la question des moyens et de l’équité. En effet, les versions les plus efficaces coûtent cher et sont donc inabordables pour certains chercheurs en poste ou des étudiants. Gérard Biau se demande aussi si des entreprises continueront à cofinancer des thèses alors que les réponses qu’elles attendent de ce travail au long cours pourraient désormais être obtenues plus rapidement. « Nous allons très bientôt être confrontés à une crise, et les départements de mathématiques, qui ont un devoir de diligence envers leurs étudiants, devraient s’y préparer de toute urgence », prévient Timothy Gowers dans son tweet du 8 mai.
« Il faut rester optimiste. Ces outils font progresser les maths. C’est très stimulant, car on voit les choses bouger en temps réel. Mais c’est vertigineux de se demander ce que sera notre métier demain », conclut Amaury Hayat.
Une autre vedette du domaine, Terence Tao, Médaille Fields 2006, déclarait, le 27 avril, au journal Nature : « Cela nous oblige à repenser des questions fondamentales. Qu’est-ce qu’une preuve ? Qu’est-ce qu’un article ? Quel est le but de notre profession ? Si nous ne nous les posons pas, alors les réponses viendront d’entreprises ou seront décidées par des intérêts financiers. Nous devons prendre les devants. »
[Source : Le Monde]