近日,2025 AI For Life Science 智能体创新峰会暨水木分子春季战略与产品发布会在启迪之星(上海)星辰厅成功举办。启迪孵化企业水木分子发布了 2025年新战略与产品——全球领先的生物医药智能体平台战略,推出了目前业界最完备的生物医药智能体架构和开发平台,以及多项重大战略级产品发布与更新升级。上海市科学技术委员会、杨浦区科技和经济委员会、启迪之星(上海)作为支持单位参与。

水木分子是由清华大学智能产业研究院(AIR)孵化的大模型创业公司,成立以来获得了“科学智能全国十强企业”等多项业界荣誉和认可。

水木分子 2025年春季重大战略产品发布与更新升级包括推出:水木分子生物医药行业知识图谱和水木分子智能体知识图谱平台、PharMolix-FM 全原子基础大模型以及 ChatDD 药物研发智能体系列——ChatDD-Insight、ChatDD-Discovery 和 ChatDD-Trial。此外,水木分子还与清华大学 AIR 携手推出了 BioMedGPT-R1 开源多模态生物医药推理大模型和 OpenBioMed 生命科学与药物研发智能体开源平台。

“大模型与生成式 AI 技术正引领科学研究进入一个全新的人机协作新范式。生命科学智能体的出现与广泛应用,将彻底改变科学发现的进程,大幅提升科研效率,”中国工程院院士、清华大学讲席教授、清华大学智能产业研究院(AIR)院长张亚勤在 2025 AI For Life Science 智能体创新峰会上指出。“在这一新范式下,科学家的角色将更加聚焦于提出高质量的问题和任务描述,充分发挥人类的创造力、经验和直觉。而智能体则通过高通量的文献阅读、海量实验数据分析、算法迭代与任务执行,成为科学家最得力的助手。”

“大模型的下一个前沿是生物学。以 ChatGPT 为代表的通用大模型已经实现自然语言的智能涌现,生物医药大模型有望在 2~3年内实现生物语言的智能涌现。随着智能体的快速发展,‘通用大模型底座+行业大模型+行业智能体’将成为生命科学研发新范式,”清华大学国强教授、清华大学智能产业研究院(AIR)首席研究院、水木分子首席科学家聂再清在 2025 AI For Life Science 智能体创新峰会上表示。“水木分子致力于推动生命科学和生物医药大模型与智能体的科学研究和商业实践,为世界贡献中国科技创新成果。”

首发生物医药智能体战略

2025年被视为AI智能体爆发之年。OpenAI 曾推出《管理AI智能体的实践白皮书》(Practices for GoverningAgentic AI Systems )1,将大模型的风口推向了 AI 智能体。IEEE 专家在 2025 CES上表示,人工智能的下一步可能是能够制定计划并将其付诸行动的人工智能代理(智能体),代理性人工智能(智能体人工智能)也将对医疗健康、制造业、市场营销和网络安全等领域产生重大影响2。Gartner 更将 AI 智能体列为 2025十大战略技术趋势之首3。

水木分子作为在全球大模型与生成式 AI 以及生命科学研究领域的前沿创新组织,率先投入生物医药智能体相关研究,举办了首届 AI For Life Science 智能体创新峰会,同时全球首发生物医药智能体战略,推出多项前沿科研成果,发布了业界领先的生物医药智能体开源平台,引领了全球 AI 大模型与生命科学的研究与实践。

水木分子提出的生物医药智能体架构和平台分为三层:知识基础层为行业知识与企业私有知识层;中间层为 AI Agent 智能体引擎层,包括大型推理模型与生物医药模型和工具;最上层为行业和私有任务智能体层,可助力新药立项与决策、临床前药物发现、临床试验以及企业私有任务等。在知识基础层中,水木分子首次提出了智能体知识图谱概念和滚雪球式知识挖掘智能体,为 AI Agent 提供高质量的行业知识;在高质量专业与企业知识的基础上,水木分子更新和推出了一系列推理大模型,让具备推理大脑的智能体能够进行思维链学习,智能调用生物医药模型、工具、算法和 API,在生物医药场景下逐渐形成“长、短期”记忆,并以自然语言方式与用户交互;从而实现智能化支持各项药研任务。

智能体知识图谱

生物医药智能体架构的行业知识与企业私有知识层,主要为生物医药智能体提供人类通用知识之外的生命科学与生物医药领域相关专业通用知识,同时能够接入企业私有知识,以服务于生命科学和生物医药企业的新药研发项目。

技术创新一:重新定义大模型时代的知识图谱,全球首发智能体知识图谱及平台。相比于传统知识图谱的节点(实体)、边(关系)和属性数据结构,水木分子引入了基于大模型的高质量文本块,能够用自然语言解释节点和边。基于智能体知识图谱,生物医药智能体在推理过程中,不仅能够引用结构化的知识,还能够引用高度相关的文本解释进行补充说明,极大提升智能体问答的用户体验。

水木分子生物医药智能体知识图谱平台包括了数据层、平台层和应用层。在数据层,水木分子生物医药智能知识图谱已经收集了千万级权威实体,包括药物、靶点、疾病、公司等立项调研与研发关键实体;建立了亿级关系数据,包括药物作用靶点、药物治疗疾病、靶点相关疾病等;关联了亿级优质文本索引,包括关联权威论文、会议等相关文本片段;囊括千余高质量专家筛选数据源,包括亿级论文和专利、一手新闻资讯追踪、权威优质数据融合等。

技术创新二:滚雪球式生物医药知识挖掘智能体(SnowballKG该智能体主要用于构建和扩充智能体知识图谱。SnowballKG Agent 仅需少量种子知识即可从文本知识库中开始知识挖掘:通过 ChatDD 置信度计算,对于低置信度的抽取知识数据,由生物医药专家进行判断和数据清洗;将高置信度的抽取知识和专家清洗后的数据,纳入到知识图谱;通过主动学习(Active Learning)方法选取训练数据,通过有监督微调(SFT)实现模型的迭代升级;如此不断循环,获得高质量的智能体知识图谱。

水木分子为滚雪球式生物医药知识挖掘提供了一站式人机协作平台,进行知识的整合补全。该一站式人机协作平台引入生物医药专家对置信度不高的知识进行人工确认。同时,该平台能够进行知识图谱的新实体推荐、新实体建议以及新关系/文本推荐。通过一站式人机协作平台,生物医药专家能够与智能体一起高效协作,完成智能知识图谱的搭建和扩展,既能对海量文本数据库进行知识挖掘,也能对机构和企业私有/专有文本数据库进行知识挖掘。

技术创新三:生物多模态检索增强技术。水木分子开发的生物多模态检索增强技术,向 ChatDD 提供了强大的生物医药知识检索引擎。生物多模态检索增强技术支持自然语言以及分子、蛋白质等多生物模态数据作为输入和输出,能够挖掘隐含的生物学规律或医学价值,辅助科研发现、药物发现。对于用户提问,生物多模态检索增强技术首先进行问题的改写和扩写,结合多模态数据进行多模态共享嵌入,在检索策略中采用了自研的 Façade Retrieval 检索技术,通过信息标签快速定位到相关数据,再结合Re-Ranking检索策略和生物多模态融合及跨模态对齐技术,最终生成全面、丰富和强鲁棒性的自然语言回复。

重磅升级系列大模型

基座大模型是生物医药智能体的核心之一。水木分子与清华大学 AIR 在 2023年合作发布了开源可商用、生物医药多模态百亿参数开源基础大模型 BioMedGPT,水木分子发布了自研千亿参数多模态生物医药专业大模型ChatDDFM®。在 2025 AI For Life Science 智能体创新峰会上,水木分子和清华大学 AIR 再次重磅升级了系列大模型。

技术创新四:BioMedGPT-R1 开源多模态生物医药推理大模型和 ChatDD-R1 商用多模态生物医药推理大模型。在 BioMedGPT 的基础上,清华大学 AIR 与水木分子推出了 BioMedGPT-R1,用 DeepSeek R1 蒸馏版本模型更新了 BioMedGPT 中现采用的文本基座模型,从而引入了更优的文本推理能力。通过跨模态特征对齐,BioMedGPT-R1 实现了生物模态与自然语言文本模态在同一个特征空间的统一融合,探索了生物多模态场景下的模型深度推理能力。通过训练对齐翻译层(Translator),BioMedGPT-R1 将生物模态编码器(Molecule Encoder 与 Protein Encoder)输出映射到自然语言表征空间,从而在 DeepSeek R1 基础上增加了生物模态数据的理解能力。

同时,水木分子这次推出的 DeepSeek 版 ChatDD-R1 是具备生物医药知识的商业多模态推理大模型,大幅提升了推理规划能力,助力广大药企达成更强的研发能力、更高的研发效率和更低的研发成本。

水木分子团队为 ChatDD-R1 构建了一套适用于生物医药行业算法和工具调用的强化学习训练方法,经验证在生物医药相关的任务上显著超越了业界领先的通用大模型。

技术创新五:业界领先的全原子基础大模型 PharMolix-FM。目前,业界在基于原子的统一生物多模态基础大模型方向,还处于前沿创新和探索阶段。在 2025 AI For Life Science 智能体创新峰会上,水木分子发布了全原子基础大模型 PharMolix-FM,在该科研方向上实现了创新。原子是构成小分子、肽、蛋白质、DNA、RNA、离子等结构生物学研究对象的基本单元,原子间相互作用是决定生命科学中生物分子结构、功能和相互作用的微观基础。全原子基础大模型 PharMolix-FM 可以实现结构生物学的多尺度统一和多任务统一,为下游任务提供了强大的生物基础大模型。经验证,PharMolix-FM 在分子对接任务和基于靶点结构的药物设计等任务上,能够更精准地预测小分子药物与靶点蛋白的结合模式和亲和力,也在 Binding Affinity 和 Drug-like Property 等多个关键任务上取得了综合 SOTA 表现。

技术创新六:SOTA 分子图像化学结构理解(OCSU)模型用于构建医药专利大模型。2025年 1月,水木分子团队发表了题为《OCSU:Optical Chemical Structure Understanding for Molecule-centric Scientific Discovery》4的技术报告,首次定义了 OCSU 问题:从分子图像中理解化学结构,并将分子图像转换为文本描述。OCSU 可以多层次理解分子结构,将分子图像翻译成化学家可以理解、机器可利用的文本。在水木分子的生物医药智能体中,采用了 OCSU 构建医药专利大模型,从而对专利内容进行解析。基于 OCSU 的医药专利大模型,能够精准识别医药专利术语和分子化学结构,从而显著提高对药物专利的理解深度。

AutoPilot+Copilot:生物医药研发的智能双引擎

作为全球首家提出第四代药物研发范式 ChatDD(Chat Drug Discovery & Design)的创新创业公司,水木分子致力于发展第四代药物研发范式 ChatDD。ChatDD 基于大模型能力,对生物多模态数据进行融合理解,用自然语言与专家进行人机交互协作,将人类专家知识与大模型知识联结。水木分子ChatDD将提供Copilot 和 Autopilot 两种智能体模式。其中复杂任务需要由人类专家和 ChatDD 一起完成,而简单任务可以由ChatDD以Autopilot 方式独立完成。

技术创新七:OpenBioMed 生命科学与药物研发智能体开源平台。清华大学 AIR 和水木分子研究团队长期持续维护 OpenBioMed 智能体开源平台,该开源平台助力应对生物医药研究工具分散和数据孤岛导致的多任务协作困难的挑战。OpenBioMed将清华大学AIR、水木分子以及业界众多生物医药相关工具和算法等以API形式进行了“封装”,其中包括:BioMedGPT、BioMedGPT-R1、OCSU 等跨模态理解模型和算法;MV-Mol、ESM-2 & ESMFold、PharmolixFM-Dock等分子性质与结构预测算法;MSAaaS & FoldSeek、MV-Mol 、DrugCLIP等分子检索算法;MoleculeSTM、ActMolEdit、MutaPLM 等分子编辑工具;BioTS+、MolCRAFT、RFDiffusion-AA 等分子设计工具等等。

欢迎大家注册试用:

OpenBioMed开源平台在线试用地址:http://openbiomed.pharmolix.com/                                       

GitHub开源地址:https://github.com/PharMolix/OpenBioMed

OpenBioMed 以可视化编辑模式,让科研人员用拖拉拽的方式就能够轻松调用前沿 AI 算法与工具,完成智能体的设计开发。同时,OpenBioMed 也提供了一个小分子生成设计和优化的智能体模板,科研人员可以直接输入一个靶点,智能体自动完成小分子生成设计工作,最终提交基于靶点的分子设计分析报告。智能体以 AutoPilot 形式异步工作,无需科研人员在电脑前等待,AutoPilot智能体自主完全所有药物分析设计工作。OpenBioMed 大幅降低了复杂生物医药算法和工具间的多任务协作难度,将重构未来科研的基础设施。

技术创新八:ChatDD 智能体,人机协作完成药物研发行业和企业私有任务。在 2023年,水木分子首次发布了 ChatDD 对话式药物研发助手。在 2025 AI For Life Science 智能体创新峰会上,水木分子推出ChatDD-Insight、ChatDD-Discovery 和 ChatDD-Trial 三大智能体,分别为医药企业用户在立项决策、临床前药物研发、以及临床场景提供Copilot+Autopilot服务。其中复杂任务需要由人类专家和 ChatDD 一起完成,而简单任务可以由 ChatDD以Autopilot 方式独立完成。

面向药物研发立项场景:ChatDD-Insight 智能体将新药立项调研大任务拆解为若干子任务,包括背景调研、竞品调研、监管交易和重要性排序等子任务,在每一个子任务能够自主自动采取相应的行动;在 ChatDD-Insight Copilot 模式下,专家可以与智能体的每一个子任务进行协同,在业务细分领域分析、判断投入方向、明晰市场动态、专家分析和判断内容重要性排序等方面与智能体发生多轮对话,让立项决策从人工马拉松变成 AI 驱动的“百米冲刺”。

面向研发探索场景:ChatDD-Discovery 智能体自动完成蛋白质数据库检索、突变效应预测、口袋结构预测、配体分子生成、先导化合物、偏好排序、性质评估、分子性质优化、候选药物直到基于靶点的分子设计分析报告等多阶段研发流程;在 ChatDD-Discovery Copilot 模式下,专家可以在配体分子生成到先导化合物环节,根据专家经验对生成的分子进行微调,筛选出优质的先导化合物,在分子性质优化环节加入专家手动优化与自动化优化结合等,增强智能体研发探索过程。

面向临床试验场景:ChatDD-Trial 智能体能够自动完成各类临床报告和方案的总结和撰写工作,例如临床CDP开发计划报告、临床实验方案等,能够实时将结构化数据流转化符合 ICH 规范的临床报告和方案;在ChatDD-Trial Copilot 模式下,专家可以调用官方以及自定义模板,在满足监管要求的前提下对定制化内容进行调整,在报告或方案的生成过程中随时与 ChatDD-Trial 进行交互和更改,每一次修改也将自动迭代刷新报告或方案。

水木分子对 ChatDD 智能体设计了多种服务方式,以满足客户的不同需求,包括,订阅服务:支持企业账户、提供包月/包年套餐;API 服务:提供 API 服务、高速推理服务和知识图谱等;报告服务:提供各类报告;私有化部署:可提供模型私有化部署、智能体私有化部署、知识图谱平台私有化部署、定制场景方案等。

AI 智能体时代的创新是革命性创新,必须由生态上下游合作伙伴和企业客户携手共进才能实现快速突破。2025 AI For Life Science 智能体创新峰会上,水木分子作为生命健康领域大模型的探索者,与长春金赛药业有限责任公司、凯莱英临床(凯诺)、苏州晟然为安医药科技有限公司、天津市药物临床研究技术创新中心、上海序祯达生物科技有限公司、钉钉(中国)信息技术有限公司等进行了战略合作签约,共同探索和加速 AI 在生命健康领域的突破创新。

2025 AI For Life Science 智能体创新峰会上,水木分子还与成都先导药物开发股份有限公司、北京英飞智药科技有限公司、嘉华药锐 DeepKinase、药渡智慧(北京)医药科技有限公司等战略合作成立了“AI 生物医药源头创新联合体”,该联合体将致力于将人工智能融入药物研发最具挑战性的前端,助力筛选最优的靶点、最优的分子,加速新药的开发。

同时,在此峰会上,水木分子宣布与北京博奥晶方生物科技有限公司、美年大健康产业(集团)有限公司、成都升泷科技有限公司、美国健康产业集团等战略合作成立了“AI 中医药大健康联合体”,该联合体将以 AI 大模型为枢纽,融合基因-蛋白组学筛查、中医证候智能解析、跨国健康数据联动,打造“早筛预警-靶向干预-智慧诊疗-全病程管理”的闭环生态,让前沿算法与千年医学智慧共铸精准健康新范式。

客户证言:

水木分子助力复星医药打造了 PharmAID 决策智能体平台,合作达成了建设性成果。目前 PharmAID 决策智能体平台已经融合了水木分子 ChatDD 和其它全球领先的文本大模型技术,并且已接入全球多个专业临床资讯及管线数据平台,医药健康领域内容生成准确率比通用大模型提升 50%,且数据为 T+1 更新,内容的准确性与及时性更出众。该合作充分利用了复星医药和水木分子宝贵的专有数据和专家知识,依托水木分子的前沿 ChatDD 生物医药大模型,重点关注自动情报分析和商业价值评估等场景,助力 PharmAID 提升研发人员和决策人员对海量实时变化行业信息的追踪效率,解决商业评估客观性和标准一致性的问题,多维度、全方位、快速高效地支撑药物商业价值辅助决策。双方会继续深化合作,助力医药研发全流程创新。

——上海复星医药(集团)股份有限公司首席数字官兼总裁助理  林锦斌

水木分子是晟然为安的长期战略合作伙伴,双方携手打造全球化多语言的医药专利智能模型。通过对专利的智能识别与切片,能够精准解析专利中极具挑战的医药专业术语,包括复杂的药物分子式。在专利领域,分子结构的精准解析是核心,也是难点。无论是药物研发、材料科学还是生物技术,化学式或立体构型的正确解读都是行业的基本功。过去依赖人工比对和传统软件逐行校验,效率低且易出错。ChatDD“复杂结构”变得“简单可读”。无论是手性中心、杂环化合物还是多维结构式,ChatDD 都能在专利数据库中快速定位相关文本并进行精准比对,效率远超人工。这只是 ChatDD 当前的一个应用场景。我们相信,在双方的深度合作中,ChatDD 将充分发挥垂直模型的强大能力,在医药行业中大放异彩。对我们而言,与水木的合作不仅升级了专利系统,更将创新药的全球知识产权保护与医药人工智能紧密结合,走在 AI 应用的前沿,我们期待更多合作成果的涌现。

——苏州晟然为安医药科技有限公司创始人兼CEO 王旭红

博奥晶方作为水木分子的长期合作伙伴,最近的合作项目是疾病信号通路知识图谱的精准挖掘。水木分子使用包括 4000万篇生物医药文献、10多个权威数据库及临床多组学数据构建的“疾病-信号通路超维图谱”,能够让我们用 AI 筛查近十年 90%疾病研究,智能识别与推荐关键通路。水木分子使用 SnowballKG 智能体,提升结构化知识图谱的构建能力,整合了多家专业数据库和几千万篇论文的相关内容。ChatDD 系统通过多维度评估(包括研究热度、临床数据验证、通路的重要性等),对千万级医学数据进行动态评分,帮助用户快速找到最有价值的疾病相关信号通路,理解疾病的机制,高效地优化配方。我们相信,当 3000年的经验智慧遇见 AI 驱动的信号通路网络,中医药必将成为精准医学的“中国方案”!

——北京博奥晶方生物科技有限公司 邓莉莉

或许很多朋友是通过我创立的"药物导图"公众号以及耗时数年编撰的《化学药物导图》认识我的。作为亲历中国医药产业从"刀耕火种"式研发到智能时代的行业老兵,很荣幸能参与 ChatDD这一革命性产品的开发工作。这项创新让我深刻感受到:当系统化的药物知识体系与人工智能深度融合,将迸发出改变行业的磅礴力量。

我历时五年构建的全球药物知识库——覆盖FDA、EMA、NMPA等ICH成员国权威数据,包含药物基本信息、原研上市信息、原料药信息,制剂信息和核心专利等 5个维度的 412万字数据资产——为ChatDD提供了精准的"药物基因图谱"。水木分子团队通过知识图谱注入和算法优化,让 ChatDD 的药物解析能力实现了从"认知学习"到"专家系统"的质变飞跃,如同将模型的药学智能从本科阶段提升至博士水平。

这种突破源于三大技术支点:①结构化思维导图构建的知识网络,使复杂药物数据形成可计算的关联体系;②基于 ICH 成员国药监局权威数据库的标准化标注,确保数据源的精准可靠;③多模态算法对药物作用机制的可视化解析。作为见证者,我坚信 ChatDD 将成为医药行业的"超级智脑"——它不仅能加速新药研发的"马拉松",更能为临床决策、专利布局、战略规划提供智能支撑,开启药物研发的第四范式。

——深耕药物研发领域二十余载  药圈老葛

如果您想亲自体验ChatDD产品,申请测试账号,欢迎联系后台!

关于水木分子

水木分子,作为清华系大模型创业公司,成立于 2023年 6月,源自张亚勤院士创办的清华大学智能产业院(AIR)。清华大学国强教授、AIR 首席研究员聂再清教授担任公司首席科学家。公司专注于打造生物医药行业的基础大模型,并推出新一代对话式药物研发助手 ChatDD。2023年,在中国信通院大模型驱动数字经济新生态峰会上,水木分子研发的“ChatDD”被选为唯一生物医药大模型应用案例,入选首部《2023大模型落地应用案例集》。此外,公司还荣获“ScienceAI 领军 Top10 企业”称号,成为最年轻入选的科学智能全国十强企业。截止2024年底,水木分子在 NeurIPS、ICML 和 KDD 等国际顶级机器学习会议上发表了 5篇关于生物医药领域的人工智能创新论文。公司与复星医药、博奥晶方等医药企业深度合作,将多模态生物医药大模型的前沿科研成果转化应用,推动医药产业的智能化发展。目前,水木分子已与超过十家头部生物医药企业和机构建立了深度合作。同时,与清华大学合作开源的生物医药大模型 BioMedGPT 等技术,已广泛应用于行业内的科研工作。

敬请您扫描二维码,即可在同写意以及量子位平台查看峰会回放。

参考链接:

1:OpenAI:Practices for Governing Agentic AI Systems,

https://openai.com/index/practices-for-governing-agentic-ai-systems/

2:IEEE:IEEE 会员在 CES 上分享观点,

https://www.elecfans.com/d/6451344.html

3:Gartner发布2025 年十大战略技术趋势:

https://mp.weixin.qq.com/s/tii_J13osI9VWALtSAMh1Q

4:OCSU:Optical Chemical Structure Understanding for Molecule-centric Scientific Discovery,

https://arxiv.org/abs/2501.15415

来源:水木分子

来源:启迪之星上海

免责声明:凡本站注明稿件来源为“科普中国”、科普类微信公众号及互联网的文章,其转载目的在于传递更多信息并促进科学普及,但并不代表本站赞同其观点或对其内容的真实性、准确性负责,亦不构成任何形式的建议。若需转载本网站所提供的内容,请确保完整转载,并明确注明来源及原作者姓名。未经许可,转载内容不得用于任何商业目的。任何单位或个人若认为本网站或其链接内容涉嫌侵犯其合法权益,请及时向本网站提交书面反馈,并提供身份证明、权属证明及详细的侵权情况说明。本网站在收到上述法律文件后,将尽快处理并移除涉嫌侵权的内容或链接。