Prédire structure et affinité d'un complexe protéine-ligand en minutes, pas en semaines
Vous avez une cible et une série de molécules candidates. Laquelle se lie le mieux, et comment ? Répondre expérimentalement — cristallographie, ITC, SPR — prend des semaines et un budget, donc on ne le fait que pour quelques molécules. Avec un modèle comme Boltz-2, désormais accessible dans Claude Science, un agent prédit la structure du complexe protéine-ligand et une estimation d'affinité en quelques minutes par candidat. De quoi trier une série entière avant de mobiliser la paillasse.
En bref
Pour qui : R&D discovery, chimie médicinale, biologie structurale, bio-informatique
Le problème : déterminer comment — et à quel point — un ligand se lie à une cible demande cristallographie ou simulations lourdes ; lent et cher, donc réservé à une poignée de candidats
Le résultat : pour chaque candidat, une structure de complexe prédite + un score d'affinité + un indice de confiance, en minutes
Le gain : trier une série de dizaines de molécules in silico pour choisir lesquelles synthétiser et tester
Le quotidien aujourd'hui
Vous voulez savoir si une molécule se loge dans le site actif de votre cible, et avec quelle force. Trois voies, trois impasses partielles :
- La cristallographie donne la vérité structurale — mais compte plusieurs semaines à plusieurs mois, quand elle est seulement faisable, et coûte cher.
- Le docking classique est rapide mais peu fiable sur l'affinité : il classe des poses, il ne prédit pas un Kd crédible.
- La simulation physique (FEP) est précise mais lourde en compute et en expertise — on ne la lance que sur quelques molécules déjà bien avancées.
Résultat : le comp-bio ne peut trier qu'une petite fraction de la série. Les autres candidats attendent, ou passent en synthèse « au jugé ». La priorisation se fait sur l'intuition autant que sur les données.
Ce que change Boltz-2 dans Claude Science
Boltz-2 « co-plie » la protéine et le ligand ensemble : il prédit d'un coup la structure 3D du complexe et une estimation d'affinité de liaison — une alternative bien plus rapide que les simulations physiques. Il fait partie des modèles nommés explicitement pour Claude Science (via le NVIDIA BioNeMo Agent Toolkit) et est aussi accessible dans Claude Code.
Concrètement, l'agent prend votre cible et votre liste de candidats, lance Boltz-2 sur chacun, et vous rend un tableau classé par affinité prédite avec, pour chaque ligne, la confiance du modèle. Il n'invente pas de chiffre : le score vient du modèle, et l'incertitude est affichée.
flowchart LR T[Cible + série de<br>molécules candidates] --> A[Agent · orchestration] A --> B[Boltz-2<br>co-folding + affinité] B --> C[Structure prédite<br>par candidat] B --> D[Score d'affinité<br>+ confiance] C & D --> R[Série classée<br>in silico] R --> H[Le comp-bio décide<br>quoi synthétiser & tester]
Ce que vous recevez, concrètement
L'agent rend une fiche de triage. Voici à quoi ressemble la sortie pour une série testée contre une cible enzymatique (exemple illustratif) :
| Candidat | Affinité prédite (pKd) | Confiance modèle | Pose / site | Note |
|---|---|---|---|---|
| CMP-014 | ~8.1 (fort) | Élevée | Site actif, contacts clés OK | À prioriser pour synthèse |
| CMP-007 | ~7.4 | Élevée | Site actif | Bon candidat de repli |
| CMP-022 | ~6.9 | Moyenne | Poche allostérique probable | Intéressant, mécanisme à confirmer |
| CMP-031 | ~5.2 (faible) | Faible | Pose incertaine | Dé-prioriser |
| CMP-045 | données insuffisantes | — | — | Ligand hors domaine du modèle — à traiter à part |
Les valeurs sont des prédictions du modèle, pas des mesures. Elles servent à trier une série, pas à statuer sur une molécule. Les candidats en tête se valident en laboratoire (SPR, ITC, cristallo).
Le gain, chiffré
| Avant | Après | |
|---|---|---|
| Candidats évalués | Quelques-uns (cristallo / FEP) | Toute la série, sur les mêmes critères |
| Délai par candidat | Semaines (expérimental) | Minutes (prédiction) |
| Coût d'un premier tri | Élevé (temps instrument + compute) | Marginal |
| Décision de synthèse | Au jugé sur peu de données | Sur une série classée, documentée |
Pour que ça marche chez vous
- Vos structures et séries restent dans votre périmètre. Une cible et une chimiothèque propriétaires révèlent votre programme avant tout dépôt. Ces données ne doivent jamais transiter par un modèle grand public avec réutilisation — on travaille sur des modèles entreprise à non-réutilisation contractuelle.
- Boltz-2 prédit, il ne mesure pas. Le score d'affinité est une estimation à recouper, pas une constante expérimentale. Le rôle de l'agent est de trier une série pour concentrer l'effort de paillasse, pas de conclure sur une molécule. Toute décision de développement se prend sur données expérimentales.
- Le comp-bio garde la main. L'outil accélère le triage et le documente ; c'est le scientifique qui arbitre quels candidats entrent en synthèse. La prédiction ouvre le faisceau d'indices — elle ne remplace pas le jugement.
Envie de transformer ce cas d'usage en agent qui tourne vraiment, dans les règles ?
Vous préférez d'abord situer votre organisation sur l'IA ?