Concevoir un binder protéique in silico : du design à la shortlist à valider au labo
Concevoir une nouvelle protéine qui se lie à votre cible — mini-protéine, peptide, brique d'anticorps — relève encore, pour beaucoup d'équipes, de l'artisanat lent : cycles de design, synthèse, test, recommencer. La vague Claude Science (juin 2026) rend appelable, depuis un agent, la chaîne de modèles génératifs qui a fait sauter ce verrou côté « dry lab ». Résultat : d'une cible, un agent produit une shortlist de quelques candidats conçus et filtrés in silico — ceux qui valent la synthèse.
En bref
Pour qui : R&D discovery, protein engineering, bio-informatique, CSO / Head of R&D en biotech early-stage
Le problème : cribler expérimentalement des milliers de designs est hors budget pour une petite équipe ; les cycles design → synthèse → test sont lents
Le résultat : une shortlist classée de candidats binders, avec structure prédite, affinité estimée et drapeaux de développabilité
Le gain : concentrer la paillasse sur une poignée de candidats crédibles au lieu de partir dans le brouillard
Le quotidien aujourd'hui
Vous avez une cible validée et l'envie d'un binder original — pour bloquer une interaction, livrer une charge, ou servir de brique thérapeutique. Le chemin classique :
- Générer des idées de design (souvent par analogie ou à la main), en petit nombre.
- Synthétiser, exprimer, purifier — coûteux, lent.
- Tester la liaison, l'expression, l'agrégation. La plupart échouent.
- Recommencer.
Pour une petite biotech, cribler des milliers de designs en wet-lab est économiquement impossible. On avance donc avec peu de candidats, choisis tôt, et on encaisse un fort taux d'échec en aval. La compétence protein-design existe chez quelques rares experts — difficile à recruter, difficile à retenir.
Ce que change Claude Science
Un agent orchestre le pipeline de design génératif exposé par le NVIDIA BioNeMo Agent Toolkit et Claude Science, et n'appelle un humain que pour arbitrer :
- Structure de la cible — repliement / préparation (OpenFold3, Boltz-2 — nommés pour Claude Science).
- Génération de designs — squelette protéique (RFdiffusion) puis séquence qui s'y replie (ProteinMPNN). Ces deux modèles sont exposés par le BioNeMo Agent Toolkit, appelable par un agent compatible.
- Validation in silico — repliement et affinité prédite des candidats (Boltz-2 / OpenFold3), pour ne garder que ceux qui tiennent.
- Filtre de développabilité — drapeaux simples (agrégation, sites problématiques) pour écarter les impasses connues.
L'agent produit une shortlist classée. Il ne « découvre » pas un médicament : il réduit un espace de designs immense à une poignée testable, en traçant chaque étape.
flowchart LR C[Cible validée] --> S[Structure cible<br>OpenFold3 / Boltz-2] S --> G1[Design squelette<br>RFdiffusion] G1 --> G2[Séquence<br>ProteinMPNN] G2 --> V[Validation in silico<br>repliement + affinité<br>Boltz-2 / OpenFold3] V --> F[Filtre développabilité<br>agrégation · sites à risque] F --> R[Shortlist classée<br>quelques candidats] R --> H[Synthèse & test au labo<br>décision humaine]
Ce que vous recevez, concrètement
L'agent rend un « design report ». Voici la forme de la sortie (exemple illustratif) :
| Design | Affinité prédite | Confiance repliement | Développabilité | Verdict |
|---|---|---|---|---|
| DSN-03 | Forte | Élevée | RAS (pas de site à risque évident) | À synthétiser en priorité |
| DSN-11 | Forte | Élevée | 1 site sensible — mutation suggérée | À synthétiser (variante) |
| DSN-07 | Moyenne | Élevée | RAS | Repli intéressant, second tour |
| DSN-19 | Forte | Faible | — | Repliement incertain — écarter |
| DSN-24 | Moyenne | Moyenne | Agrégation probable | Écarter |
Chaque candidat garde le lien vers les étapes qui l'ont produit (design → séquence → validation). Ce sont des prédictions : la shortlist oriente la synthèse, elle ne remplace pas la validation expérimentale.
Le gain, chiffré
| Avant | Après | |
|---|---|---|
| Designs explorés | Quelques dizaines, à la main | Des milliers générés, filtrés in silico |
| Candidats mis en synthèse | Beaucoup, taux d'échec élevé | Une poignée, pré-filtrés |
| Dépendance à un expert rare | Forte | L'agent industrialise les étapes, l'expert arbitre |
| Cycle design → shortlist | Semaines à mois | Jours |
Pour que ça marche chez vous
- Votre cible et vos designs sont votre programme — avant brevet. Rien ne doit transiter par un modèle grand public avec réutilisation. On travaille sur des modèles et une infrastructure entreprise à non-réutilisation garantie ; les designs propriétaires restent dans votre périmètre.
- In silico n'est pas validé. Une shortlist prédite n'est pas une liste de molécules qui marchent — c'est une liste de candidats qui valent le test. Le rappel s'impose : même EDEN, le modèle de design de peptides antibiotiques intégré à Claude Science, en est aux résultats précliniques (in vitro, souris). La synthèse et la caractérisation restent le juge de paix.
- La chaîne doit être honnête sur son périmètre. Seuls Boltz-2, Evo 2 et OpenFold3 sont nommés explicitement pour Claude Science ; RFdiffusion et ProteinMPNN sont exposés par le BioNeMo Agent Toolkit (appelable par agent), pas cités nommément côté Claude Science. Un déploiement sérieux documente quelle brique fait quoi, et où tourne le compute.
- L'expert décide. L'agent réduit l'espace et prépare le dossier ; c'est le protein engineer / le CSO qui choisit ce qui part en synthèse. On automatise le tri, pas le jugement scientifique.
Envie de transformer ce cas d'usage en agent qui tourne vraiment, dans les règles ?
Vous préférez d'abord situer votre organisation sur l'IA ?