近期,西湖大学郑冶枫团队联合牛津大学、腾讯天衍实验室及英国多家顶尖医学机构,共同开发了一种基于知识协作机制的大语言模型药物分析系统——DrugGPT。该系统针对现有大语言模型在医疗场景中易产生“幻觉”、缺乏可追溯证据等关键痛点,创新性地引入三大协同模块:问诊分析模块(IA-LLM)、知识获取模块(KA-LLM)与证据生成模块(EG-LLM),实现药物推荐、剂量调整、不良反应识别、药物相互作用预测及药理学问答五大临床任务的精准覆盖。研究整合Drugs.com、英国国家医疗服务体系(NHS)与PubMed三大权威知识库,构建疾病-症状-药物知识图谱(DSDG),并通过知识一致性提示与证据可追溯提示策略,确保输出结果忠实、可解释且符合临床标准。
团队基于11个公开及3个自建数据集、累计超4.2万条药物相关问答,对DrugGPT进行了系统开发与严格验证。结果显示,DrugGPT在USMLE、MedMCQA、MMLU等权威医学考题中全面超越GPT-4、ChatGPT、Med-PaLM-2等现有最强模型,平均准确率提升4.7–24.5个百分点;在药物不良反应(ADE)、药物-药物相互作用(DDI)等安全关键任务上,准确率提高17.3–39.8%,几乎实现性能翻倍。外部前瞻性验证进一步表明,DrugNT可将基层医生药物决策准确率从83.4%提升至91.2%,并在未见过的新药场景下依然保持93.5%的卓越泛化能力。
该成果充分展示了人工智能在复杂药物决策中的巨大潜力,为临床个体化用药、安全监测及新药快速评估提供了可信赖的新路径。相关研究以《A collaborative large language model for drug analysis》为题,发表于《Nature Biomedical Engineering》(中科院、JCR双一区TOP,影响因子26.6)。
论文链接:https://www.nature.com/articles/s41551-025-01471-z
药物安全是临床诊疗的基石,然而由于药品种类繁多、作用机制复杂,且患者个体差异显著,传统依赖经验与静态指南的用药决策常面临剂量不准、相互作用遗漏及不良反应漏警等风险。针对这一痛点,郑冶枫教授团队联合牛津大学、腾讯天衍实验室与英国多家顶尖医学机构,创新性地提出基于“知识-协作-可追溯”三元架构的大语言模型药物分析系统 DrugGPT,用于精准覆盖药物推荐、剂量优化、不良反应识别、药物-药物相互作用预测及药理学问答五大核心场景。模型构建采用“三模块协同”策略:首先由问诊分析模块(IA-LLM)动态解析临床提问,明确所需知识类型;随后知识获取模块(KA-LLM)在Drugs.com、NHS与PubMed三大权威知识库构建的疾病-症状-药物图谱(DSDG)中检索并抽取高质量证据;最终证据生成模块(EG-LLM)结合知识一致性提示与证据可追溯提示,输出忠实、可解释且可直接溯源的用药建议。依托检索增强生成与指令提示微调技术,DrugGPT不仅显著降低幻觉发生率,还在多中心、多任务、多药品场景下展现出卓越的稳健性与泛化能力。