我国 AI 药物筛选获重大突破:千亿级分子库实现秒级检索
2026-05-25 17:35:13
5 月 25 日消息,据报道,由国家超级计算天津中心首席科学家孟祥飞与清华大学智能产业研究院兰艳艳教授共同领衔的 AI 生物医药团队,正式发布了面向超大规模药物发现的人工智能虚拟筛选平台——GalaxyVS。
该平台依托新一代天河超算系统,在全球范围内首次实现了对近千亿级可合成化合物空间的秒级虚拟筛选,将传统需数月甚至数年的药物早期筛选过程压缩至数十秒。
长期以来,创新药物研发面临“双十”困境——耗时超十年、投入超十亿美元。其中,从海量化合物中筛选出能靶向特定蛋白的活性分子尤为关键。
传统实验筛选成本高、周期长,常规分子对接方法计算效率有限且假阳性率较高。随着可合成化合物库迈入千亿乃至万亿级规模,现有虚拟筛选技术在算法、算力、存储和工程化能力上均面临严峻挑战。
项目团队核心成员、国家超级计算天津中心李培顺博士介绍,GalaxyVS以清华大学智能产业研究院团队前期发表于《科学》杂志的DrugCLIP模型为基础,将蛋白口袋与小分子映射到统一向量空间,把传统依赖逐一对接的蛋白—配体匹配问题,转化为可大规模并行执行的高维向量快速检索问题,从而从根本突破了传统分子对接在速度和规模上的限制。
在算力层面,GalaxyVS充分发挥了新一代天河超算的大规模并行能力。团队基于YH-Torch智能计算框架,对DrugCLIP模型进行国产异构算力适配与深度优化,替换传统CUDA/GPU依赖,使近千亿级分子编码从算法设想真正落地为可稳定运行的超算工程。
在检索环节,系统引入磁盘原生图索引框架,并结合定制化内存预加载机制,有效解耦共享存储瓶颈与计算执行过程,为超大规模虚拟筛选提供了关键吞吐能力。
实测数据显示,系统利用千级DSP节点完成全模式生物物种约400万个靶点口袋的高效编码,并在2万多个计算节点上开展超大规模分子检索。
单次检索千亿分子库可在数十秒内完成,平均单个靶点口袋检索用时不到1秒。系统日吞吐量约达16万亿次分子对接,比当前国际最先进的超算纪录高出六个数量级。
未来,GalaxyVS有望进一步拓展至跨物种蛋白—配体互作图谱构建、大规模开放数据集建设以及AI驱动药物发现基础设施构建,推动药物研发从经验试错走向数据驱动、从局部筛选走向全局探索、从单一模型走向系统工程。

相关阅读
-
小米 YU7 对决 Model Y:八败两胜,雷军回应输给全球销冠不丢人深度解读 2026-05-25 17:32:11
-
Windows 11 更新:音频逻辑大改,手动合盖音乐自动暂停金融科技前沿 2026-05-25 17:29:49
-
链上侦探 ZachXBT 揭露 Polymarket 遭黑事件:官方回应用户资金安全无虞区块链快讯 2026-05-25 17:28:38
-
米家空调微弱风 Pro 发布:超一级能效 + 微风量,售价 3299 元深度解读 2026-05-25 17:26:10
-
花椒味那么新鲜:揭秘古代“椒房之宠”的由来与含义金融科技前沿 2026-05-25 17:23:52
-
小米人车家全生态发布会:超 10 款新品汇总,定价 399 元起深度解读 2026-05-25 17:21:02
-
Coinbase vs Gemini 深度对比:费用、支持币种与安全性全解析区块链快讯 2026-05-25 17:19:28
-
时速 730 千米!无人机爱好者改装机试飞,创非正式世界最快纪录金融科技前沿 2026-05-25 17:17:28
-
王腾评价小米 YU7 GT:价格真香,祝大卖!深度解读 2026-05-25 17:15:13
-
麒麟芯片密度本年猛增 50%!华为回应:成心守旧提拔金融科技前沿 2026-05-25 17:12:09