Prédire structure & affinité protéine-ligand (Boltz-2)

Vous avez une cible et une série de molécules candidates. Laquelle se lie le mieux, et comment ? Répondre expérimentalement — cristallographie, ITC, SPR — prend des semaines et un budget, donc on ne le fait que pour quelques molécules. Avec un modèle comme Boltz-2, désormais accessible dans Claude Science, un agent prédit la structure du complexe protéine-ligand et une estimation d'affinité en quelques minutes par candidat. De quoi trier une série entière avant de mobiliser la paillasse.

En bref
Pour qui : R&D discovery, chimie médicinale, biologie structurale, bio-informatique
Le problème : déterminer comment — et à quel point — un ligand se lie à une cible demande cristallographie ou simulations lourdes ; lent et cher, donc réservé à une poignée de candidats
Le résultat : pour chaque candidat, une structure de complexe prédite + un score d'affinité + un indice de confiance, en minutes
Le gain : trier une série de dizaines de molécules in silico pour choisir lesquelles synthétiser et tester

Le quotidien aujourd'hui

Vous voulez savoir si une molécule se loge dans le site actif de votre cible, et avec quelle force. Trois voies, trois impasses partielles :

La cristallographie donne la vérité structurale — mais compte plusieurs semaines à plusieurs mois, quand elle est seulement faisable, et coûte cher.
Le docking classique est rapide mais peu fiable sur l'affinité : il classe des poses, il ne prédit pas un Kd crédible.
La simulation physique (FEP) est précise mais lourde en compute et en expertise — on ne la lance que sur quelques molécules déjà bien avancées.

Résultat : le comp-bio ne peut trier qu'une petite fraction de la série. Les autres candidats attendent, ou passent en synthèse « au jugé ». La priorisation se fait sur l'intuition autant que sur les données.

Ce que change Boltz-2 dans Claude Science

Boltz-2 « co-plie » la protéine et le ligand ensemble : il prédit d'un coup la structure 3D du complexe et une estimation d'affinité de liaison — une alternative bien plus rapide que les simulations physiques. Il fait partie des modèles nommés explicitement pour Claude Science (via le NVIDIA BioNeMo Agent Toolkit) et est aussi accessible dans Claude Code.

Concrètement, l'agent prend votre cible et votre liste de candidats, lance Boltz-2 sur chacun, et vous rend un tableau classé par affinité prédite avec, pour chaque ligne, la confiance du modèle. Il n'invente pas de chiffre : le score vient du modèle, et l'incertitude est affichée.

flowchart LR
  T[Cible + série de<br>molécules candidates] --> A[Agent · orchestration]
  A --> B[Boltz-2<br>co-folding + affinité]
  B --> C[Structure prédite<br>par candidat]
  B --> D[Score d'affinité<br>+ confiance]
  C & D --> R[Série classée<br>in silico]
  R --> H[Le comp-bio décide<br>quoi synthétiser & tester]

Ce que vous recevez, concrètement

L'agent rend une fiche de triage. Voici à quoi ressemble la sortie pour une série testée contre une cible enzymatique (exemple illustratif) :

Triage in silico — Série contre cible enzymatique (exemple)

Candidat	Affinité prédite (pKd)	Confiance modèle	Pose / site	Note
CMP-014	~8.1 (fort)	Élevée	Site actif, contacts clés OK	À prioriser pour synthèse
CMP-007	~7.4	Élevée	Site actif	Bon candidat de repli
CMP-022	~6.9	Moyenne	Poche allostérique probable	Intéressant, mécanisme à confirmer
CMP-031	~5.2 (faible)	Faible	Pose incertaine	Dé-prioriser
CMP-045	données insuffisantes	—	—	Ligand hors domaine du modèle — à traiter à part

Les valeurs sont des prédictions du modèle, pas des mesures. Elles servent à trier une série, pas à statuer sur une molécule. Les candidats en tête se valident en laboratoire (SPR, ITC, cristallo).

Le gain, chiffré

	Avant	Après
Candidats évalués	Quelques-uns (cristallo / FEP)	Toute la série, sur les mêmes critères
Délai par candidat	Semaines (expérimental)	Minutes (prédiction)
Coût d'un premier tri	Élevé (temps instrument + compute)	Marginal
Décision de synthèse	Au jugé sur peu de données	Sur une série classée, documentée

Pour que ça marche chez vous

Vos structures et séries restent dans votre périmètre. Une cible et une chimiothèque propriétaires révèlent votre programme avant tout dépôt. Ces données ne doivent jamais transiter par un modèle grand public avec réutilisation — on travaille sur des modèles entreprise à non-réutilisation contractuelle.
Boltz-2 prédit, il ne mesure pas. Le score d'affinité est une estimation à recouper, pas une constante expérimentale. Le rôle de l'agent est de trier une série pour concentrer l'effort de paillasse, pas de conclure sur une molécule. Toute décision de développement se prend sur données expérimentales.
Le comp-bio garde la main. L'outil accélère le triage et le documente ; c'est le scientifique qui arbitre quels candidats entrent en synthèse. La prédiction ouvre le faisceau d'indices — elle ne remplace pas le jugement.

Envie de transformer ce cas d'usage en agent qui tourne vraiment, dans les règles ?

Réserver un échange de 30 min

Vous préférez d'abord situer votre organisation sur l'IA ?

Faites le diagnostic (5 min)

Prédire structure et affinité d'un complexe protéine-ligand en minutes, pas en semaines

Le quotidien aujourd'hui

Ce que change Boltz-2 dans Claude Science

Ce que vous recevez, concrètement

Le gain, chiffré

Pour que ça marche chez vous