
麻省理工学院的下一代人工智能以超级计算机的速度筛选数百万个分子用于药物研究
麻省理工学院与生物技术初创公司Recursion联合开发的新一代AI模型Boltz-2正在以超级计算机的速度重塑药物发现领域。这一突破性技术能够在几小时内完成原本需要数周的分子筛选工作,为制药行业带来前所未有的效率提升。
超算级别的药物筛选能力
Boltz-2的核心优势在于其接近物理基础自由能微扰模拟的准确性,后者是预测分子结合紧密程度的黄金标准,但速度却快了多达1000倍。在Recursion的BioHive-2超级计算机上,该模型能够并行处理数百万个配体-蛋白质对,在单个NVIDIA A100 GPU上每对约20秒内返回结合结果。
这种速度优势为制药研究带来了根本性变革。科学家不再需要在湿实验室中逐个测试化合物,或等待数周才能完成物理模拟,而是可以在超级计算机规模上进行数字化分子筛选。
在基准测试中,Boltz-2超越了传统的分子对接方法和先前的机器学习方法,在MF-PCBA等高通量筛选中平均精度提升了一倍。该模型将复杂结构预测和结合亲和力估算统一在单一系统中,帮助研究人员显著压缩原本耗费大量时间和成本的研发周期。
工程优化实现实用化突破
Boltz-2的跨越式进步不仅源于生物学创新,工程优化同样功不可没。Recursion的BioHive-2超级计算机基于NVIDIA DGX SuperPOD和H100 Tensor Core GPU构建,经过专门优化以处理超过300万个标记样本的庞大训练数据,使模型能够在单次前向传递中同时学习分子姿态和效力。
NVIDIA工程师发挥了关键作用,通过性能分析消除计算瓶颈。他们引入了定制的cuEquivariance内核,加速了关键的"三角"操作,将训练和推理成本降低了多达3倍。这些优化现已向其他开发者开放,不仅减少了内存使用,还使Boltz-2成为制药企业可投入生产的实用工具。
企业级部署与开源双轨并行
对于企业用户,该模型以Boltz-2 NIM的形式提供,这是一个生产就绪的微服务,可接收蛋白质、RNA、DNA或配体序列,返回3D结构和亲和力预测,并提供企业级支持。NIM部署方案为生物制药公司提供了更高的吞吐量和更低的计算成本,在开发新药的激烈竞争中获得关键优势。
同时,Boltz-2于6月6日正式发布为MIT许可下的开源模型,其代码、权重和训练流程均可供学术和商业使用。这种双轨策略既促进了科学研究的开放协作,又满足了企业的商业化需求。
在Recursion的BioHive-2上训练并由NVIDIA加速的该模型,实现了接近FEP精度且速度快1000倍的性能,标志着AI赋能药物发现领域迄今为止最重要的进展之一。
产业影响与技术意义
这一技术突破对制药产业具有深远影响。传统药物开发周期长达10-15年,成本高达数十亿美元,其中分子筛选和优化占据了大量时间。Boltz-2的出现有望显著缩短早期发现阶段的时间,为患者更快获得新药治疗创造条件。
该技术的开源特性也将推动整个行业的创新。研究机构和小型生物技术公司现在能够获得与大型制药企业相当的计算能力,有助于促进更多样化的药物发现路径。
未来发展前景
随着AI技术在生物医学领域的深入应用,Boltz-2代表了计算生物学的重要里程碑。该模型可以重新训练、微调和自由部署的特性,为个性化医学和精准治疗提供了技术基础。
企业级推理通过NVIDIA AI Enterprise许可下的NVIDIA Boltz-2 NIM得到支持,确保了商业应用的可靠性和扩展性。这种技术架构为未来更复杂的生物分子模拟和药物设计铺平了道路。
Boltz-2的成功展示了产学研深度合作的威力,为AI驱动的科学发现提供了可复制的范式,预示着更多突破性创新的到来。