Architecture & Walkthrough

AI-Driven Antibody Discovery Platform — 平台架构与技术全景

生物学背景

核心问题、抗体格式与治疗应用

核心问题:如何设计能结合特定靶标的抗体?

传统方法需要免疫动物、筛选 B 细胞,耗时数月。我们的方法是用 AI 直接"画出"能结合靶标的纳米抗体——从蛋白质结构出发,生成序列和 3D 结构,再通过多维评分筛选最优候选。

我们设计的抗体格式

VHH / Nanobody
~13 kDa
单可变域(仅重链)。体积小、稳定、易于 CAR 表达。主要格式
Mini-binder
9-14 kDa
任意折叠(非抗体来源)。不受 CDR 限制,可能达到 picomolar 亲和力。次要格式
scFv
~25 kDa
VH-linker-VL 融合。传统 CAR 结合域,但存在错误折叠风险。
Full IgG mAb
~150 kDa
含 Fc 区的完整抗体。Phase 1+ 范围(Origin-1)。

In Vivo CAR-T 疗法

临床验证GT801 Phase ICPTX2309 Phase I

通过 mRNA-LNP 将 CAR 构建体直接递送到患者体内(无需体外工程化 T 细胞):

1

设计 VHH binder

靶向疾病抗原(如 anti-CD19 用于 B 细胞淋巴瘤)

2

组装 CAR 构建体

VHH + IgG4-hinge + CD28-TM + 4-1BB + CD3zeta (~335 aa)

3

优化 mRNA 序列

密码子优化以适应人类表达(~1.5 kb mRNA)

4

设计靶向 VHH

anti-CD7 或 anti-CD8 VHH 用于 LNP 表面(T 细胞递送)

5

包装进 LNP 并注射

mRNA 在内部 + 靶向 VHH 在表面。可重复给药

关键洞察:这是一个双 VHH 设计问题 — (1) VHH 用于 CAR 结合域 + (2) VHH 用于 LNP 表面靶向

两种设计范式

Diffusion vs Hallucination — 架构层面的关键区分

范式 A:Diffusion(扩散法)

RFantibody
1

RFdiffusion

从随机噪声生成蛋白质骨架(poly-G CDRs)

2

ProteinMPNN

反向折叠:为骨架设计氨基酸序列

3

RF2 验证

过滤:pAE < 10, RMSD < 2A

骨架和序列分离步骤。需数千设计,原子级精度。

范式 B:Hallucination(幻觉法)

mBERBindCraftBoltzGen
1

AF2/Multimer 反向传播

迭代更新序列直到预测出高置信度复合物

2

联合输出

同时产生结构 + 序列(一步完成)

结构和序列联合优化。设计数量少,4-45% 成功率。

模型全景

19+ 开源平台,分波次部署

Antibody Discovery Platform(抗体发现)

30K LOC30+ Models

De Novo 抗体设计是 CAR-T 研发上游关键环节。AI 可将全流程压缩至 4-8 小时, 支持亲和力、稳定性、可开发性、免疫原性的多目标同步优化。

6 阶段管线(表位分析 → 骨架生成 → 序列设计 → 结构验证 → 评分排序 → 迭代优化)完整实现, 集成 RFdiffusion、BoltzGen、AlphaFold-Multimer、ThermoMPNN、TAP 等 30+ AI 模型, 采用 MCP + Claude Code 的 Agentic 架构。

Wave 1 — 立即部署

mBER已验证
Hallucination
VHH 专用,45% 靶标成功率,百万级验证
RFantibody已验证
Diffusion
原子级精度,Nature 2025,VHH 框架 h-NbBCII10
BoltzGen已验证
全原子生成
最通用:nanobody + mini-binder + 多肽,66% 成功率
BindCraft已规划
Hallucination
小蛋白 binder,10-100% 成功率,MIT

Wave 2 — 快速跟进

PXDesign已规划
Diffusion
ByteDance,45% 平均命中率,最快设计工具
IgGM已规划
生成式
Tencent,VHH + Ab,84 pM 亲和力
Dyno Psi-1已规划
Flow-matching
Open-weight,Claude Code Skills 集成

API Only

Germinal
Hallucination
4-22% VHH 成功率。许可限制,通过 Tamarind API 调用
Tamarind Scoring
REST API
TAP、ThermoMPNN、AggreScan3D、DeepImmuno 等 20+ 评分工具

Agentic MCP 架构

Claude Code + ProteinMCP — 替代固定 DAG 编排器

平台架构

ProteinMCP38 MCP ServersMIT

Layer 1 — 用户

科学家通过自然语言或 /workflow-skill 命令发起请求

Layer 2 — Claude Code 编排器

解读目标 → 选择工具 → 执行工作流 → 维持上下文和状态

Layer 3 — MCP Server 层

mBER
BindCraft
BoltzGen
RFantibody
Tamarind
Dyno Psi-Phi
antibody_db
LinearDesign
PXDesign

+ ProteinMCP 内置 38 个 MCP:AF2, AF3, ProteinMPNN, ESM, OmegaFold, Boltz...

Layer 4 — Workflow Skills

/vhh-car-design/mini-binder-car-design/two-vhh-car-design/mRNA-optimize/score-candidates

设计工作流

VHH-CAR、双 VHH、Mini-Binder 三种模式

VHH-CAR 设计工作流

/vhh-car-design
1

Epitope 分析

解析抗原 PDB、计算 SASA、搜索 SAbDab 模板、验证表面暴露

2

VHH Binder 生成

Agent 选择最佳工具:mBER(默认 45%)/ BoltzGen(66%)/ RFantibody(原子级)

3

序列设计

AntiFold / ProteinMPNN 反向折叠(Hallucination 工具可跳过此步)

4

结构验证

ImmuneBuilder 快速初筛 → AlphaFold-Multimer Top-N 验证 → RMSD < 2.0A, ipTM > 0.6

5

评分与排名

TAP + ThermoMPNN + Tamarind Scoring(20+ 属性)+ CAR 特异性 + Pareto ranking

6

mRNA 优化

组装 CAR cassette → LinearDesign/VaxPress 密码子优化 → LNP 兼容性评估(~1.5kb)

双 VHH 体内 CAR-T 工作流

/two-vhh-car-design

VHH #1:CAR 结合域

靶向疾病抗原(如 CD19)

VHH #2:LNP 靶向

靶向 T 细胞标记物(如 CD7)

组装完整 In Vivo CAR-T 系统

CAR mRNA: [VHH#1] + [IgG4 hinge] + [CD28 TM] + [4-1BB] + [CD3z] = ~335 aa → ~1.5 kb mRNA

LNP: mRNA 在内部 + VHH#2 在表面。100 nm 颗粒,>85% 包封率

已验证结果

Smoke Test — 2026-04-05/06

SARS-CoV-2 RBD

BoltzGen已验证
靶标PDB 6W41, chain C, 195 aa
设计数10 → 5 ranked VHH
VHH 长度113-139 aa
ipTM0.136-0.264
运行时间~12 分钟

BCMA (多发性骨髓瘤 CAR-T 靶标)

RFantibody已验证
靶标PDB 4ZFO, chain F, 36 aa
设计数10 backbones → 20 VHH
VHH 长度116-120 aa
pred_lddt0.89
p_bind0.72
运行时间~20 分钟

关键发现

BoltzGen 适合较大靶标(>100 aa),RFantibody 可处理任意大小靶标

多工具策略得到验证 — 不同靶标特征适合不同工具

Tamarind API 全链路打通:上传 → 提交 → 轮询 → 下载 → 解析

BoltzGen 对小靶标(<50 aa 如 BCMA)会停止运行 — 需自动切换至 RFantibody

已验证工具

BoltzGen已验证
de-novo-nanobody
SARS-CoV-2 RBD 靶标,5 个 VHH
RFantibody已验证
nanobody mode
BCMA 靶标,20 个 VHH,p_bind=0.72
ImmuneBuilder已验证
NanoBodyBuilder2
VHH 结构预测,44 秒完成
Antibody Evolution已验证
PLM-guided
4 个亲和力优化突变建议
Tamarind API已验证
REST
上传、提交、轮询、下载全链路

系统架构

技术栈、数据库与部署

技术栈

Next.js 15FastAPISQLiteModal A100
前端
Port 3000
Next.js + React 19 + TypeScript + Tailwind CSS + shadcn/ui + Recharts + Molstar
后端
Port 8000
FastAPI + Uvicorn。路由:/workflows, /candidates, /secrets, /exports
AI 编排
Claude Code
ProteinMCP 38 MCP + 自定义 MCP + Workflow Skills + Dyno Psi-Phi
数据库
SQLite WAL
6 张表:targets, antibodies, complexes, scores, sources, tamarind_jobs
GPU 后端
Modal A100
每个工具独立 image(Python/CUDA 版本隔离)
外部 API
REST
Tamarind Bio (Scoring/TAP/Germinal)、Dyno Psi-Phi、AlphaFold DB

当前数据库

靶标 (targets)2 — SARS-CoV-2 RBD, BCMA
纳米抗体 (antibodies)30 — 10 anti-RBD + 20 anti-BCMA
评分 (scores)30 条
复合物 (complexes)5 个

AI-Driven Antibody Discovery Platform · Architecture v2 · Updated 2026-04-06