
L’essentiel
- GPT-5.4 (OpenAI) et la plateforme Maria AI (Molecule.one) ont conduit un projet de chimie médicinale de la revue de littérature jusqu’à un résultat validé en laboratoire.
- Le système a évalué 10 080 réactions ; dans les conditions optimisées, les rendements progressent pour 88 % des acides boriques et 83 % des sulfonamides testés.
- Le cycle a duré environ 2,5 mois, plus un demi-mois pour que des chimistes humains valident des résultats représentatifs et rédigent l’article.
Le message qui circule depuis hier est limpide : l’intelligence artificielle accélère désormais la découverte scientifique. OpenAI et la société Molecule.one ont fait collaborer leur modèle GPT-5.4 et leur plateforme Maria AI sur un problème ouvert de chimie médicinale, de la lecture des publications jusqu’à un résultat confirmé en laboratoire. Sauf qu’un détail change toute la lecture : dans cette boucle, le chimiste humain n’est plus intervenu que pour valider quelques mesures et rédiger le compte rendu.
Une boucle de recherche presque entièrement déléguée
Jusqu’ici, l’IA en chimie jouait les assistants. Elle suggérait des molécules, triait des candidats, prédisait des propriétés, et un chercheur gardait la main sur chaque étape clé. Le cas décrit par OpenAI et Molecule.one inverse ce partage des rôles. Selon leur présentation, le système a choisi lui-même le terrain de recherche, formulé des propositions, les a notées, puis a lancé les expériences dans le Maria Lab, un laboratoire à l’échelle du microlitre piloté par l’IA. Le contraste avec les autres assistants de recherche est net : l’AI co-scientist de Google DeepMind, bâti sur Gemini, génère et met en compétition des milliers d’hypothèses, mais s’arrête au seuil de la paillasse ; ici, la boucle descend jusqu’à l’expérience réelle.
Concrètement, GPT-5.4 et Maria AI ont travaillé sur une synthèse dite de Chan-Lam, une réaction utile mais capricieuse en chimie médicinale. Le système a proposé une méthode inattendue pour en améliorer le rendement, puis l’a éprouvée à grande échelle. Ce n’est pas un coup de pouce ponctuel : c’est la chaîne complète, de l’hypothèse au verdict expérimental, qui a tourné en quasi-autonomie.
L’humain a fini scribe
Voilà le point que l’emballement général escamote. Le rôle laissé aux chimistes tient en deux mots : contrôle et rédaction. Ils ont validé manuellement des résultats représentatifs parmi les 10 080 réactions testées, puis ils ont mis le tout en forme pour le préprint. La phase d’écriture a d’ailleurs sa propre ligne dans le calendrier : un demi-mois ajouté aux deux mois et demi du projet.
Pour quiconque orchestre l’IA au quotidien, ce glissement parle. On a longtemps répété que la machine se chargerait des tâches répétitives pendant que l’humain garderait la créativité et la décision. Ici, c’est l’inverse qui se dessine : la machine a posé les hypothèses et tranché les pistes, l’humain a assuré la relecture et la prose. La partie noble de la science, l’intuition de ce qu’il faut chercher, a basculé du côté du modèle.
88 %, mais 88 % de quoi ?
Le chiffre qui circule mérite un second regard. Les rendements se sont améliorés pour 88 % des acides boriques et 83 % des sulfonamides testés dans les conditions optimisées. Impressionnant, à condition de lire la phrase entière. Il s’agit d’une amélioration de rendement sur une famille de substrats, pas d’une réaction nouvelle ni d’un médicament. La synthèse de Chan-Lam existait déjà ; le système l’a rendue plus efficace sur un large panel.
C’est précisément ce qui rend l’affaire crédible plutôt que magique. Optimiser une réaction connue sur des milliers d’essais, c’est exactement le genre de problème borné où une IA couplée à un laboratoire automatisé excelle : beaucoup d’itérations, un critère de succès clair, peu d’ambiguïté sur ce qu’on mesure. La prouesse n’est pas d’avoir inventé une chimie inédite, mais d’avoir bouclé seule le cycle proposer-tester-mesurer à une cadence inatteignable pour une équipe humaine.
Une démonstration qui reste juge et partie
Reste la prudence d’usage. Le récit émane d’OpenAI et de Molecule.one, deux acteurs directement intéressés à montrer que leur collaboration fonctionne. Les éléments sont pour l’instant présentés dans un préprint, donc avant l’examen par les pairs qui fait foi en science. Et 2,5 mois pour optimiser une seule famille de réactions, ce n’est pas la fulgurance que le mot « autonome » laisse imaginer : la boucle est rapide à l’échelle d’un labo, lente à l’échelle d’un tweet triomphant.
Le terme à manier avec soin, c’est « quasi-autonome ». Le système n’a pas opéré dans le vide : il s’appuie sur un laboratoire taillé sur mesure pour ses workflows, sur un jeu de données généré à sa demande, et sur des garde-fous humains aux moments sensibles. Retirez l’infrastructure dédiée et la démonstration ne tient plus. L’autonomie dont on parle est celle d’un outil très bien outillé, pas celle d’un chercheur lâché dans la nature.
Ce que ça annonce pour les métiers de la connaissance
Au-delà de la chimie, le signal vaut pour tous les domaines où le travail consiste à lire l’état de l’art, formuler une hypothèse, la tester et la documenter. C’est la définition de la recherche, mais aussi d’une grande part du travail d’ingénierie, d’analyse ou de conseil. Si un modèle de pointe peut tenir cette boucle sur un problème cadré, la question n’est plus de savoir s’il sait chercher, mais quelles parts du métier on accepte de lui confier, et lesquelles on garde par choix plutôt que par nécessité.
OpenAI le présente comme un exemple précoce de modèles de pointe soutenant davantage le cycle de recherche scientifique. Le mot juste est « précoce ». Un cas, un type de réaction, des conditions très favorables. Mais la trajectoire, elle, est lisible à l’œil nu.
Mon avis
Je retiens une chose de ce cas, et ce n’est pas le pourcentage de rendement. C’est l’endroit où l’humain a atterri dans la chaîne : à la rédaction. On nous vendait l’IA comme l’exécutante des corvées pendant que nous garderions l’intuition ; ici, c’est elle qui a eu l’idée de méthode et nous qui avons tenu le stylo. Je parie que d’ici dix-huit mois, ce schéma sortira de la chimie pour s’installer dans l’analyse de données et l’ingénierie logicielle, et que le vrai sujet ne sera plus la performance du modèle, mais notre lucidité à décider ce qu’on lui laisse penser à notre place.
