百位临床专家专业把关,国际顶刊内容注入,医学AI要走进诊室,首先要过的不是技术关,而是信任关。

  撰文丨凌 骏

  医学AI赛道从不缺热闹。

  大模型、智能问答、辅助诊断……过去几年,医学AI工具层出不穷,可对医生群体而言,一个问题始终悬而未决——AI给出的答案,能信吗?

  这不是技术洁癖,而是现实的顾虑。日常生活中, AI的“幻觉”现象或许只是一次无伤大雅的误差;但在医学领域,一条虚构的文献引用,一个编造的用药剂量,都可能将临床决策引向危险的方向。

  面对这一痛点,一款新的医学AI工具给出了一套不同于行业主流的解法——不卷模型参数,转而从“内容源头”和“输出把关”两个维度同时下手。

  5月13日,阿里健康旗下的医学AI助手“氢离子”正式发布,由超300位中国临床专家组建起“医学AI专家委员会”,并宣布与英国BMJ集团(BMJ Group)达成期刊内容独家合作。

  一边是数百位中国临床专家的专业判断力把关,一边是国际顶刊的前沿内容注入。当这两股力量同时汇入一个AI模型,医学AI或许才真正具备了走进诊室的资格。

  AI能答,但医生敢不敢信?

  循证医学引入中国已近三十年,其价值早已不言而喻。但在高强度的临床节奏下,如何高效获取、筛选并应用最新的医学证据,仍是一道现实难题。

  北京某三甲医院肿瘤内科住院医师卢医生对此深有体会。她告诉“医学界”,肿瘤学的知识更新极快,几乎每隔一阵就有新的临床试验结果公布,顶刊上的新发现,可能会直接影响第二天的治疗策略。

  “但现实是文献更新的速度,远快于人工检索、学习并总结的效率。”卢医生认为,在高强度的临床节奏下,医生很难实时追踪每一条前沿进展,想把循证要求完全落到实处,并不容易。

  这也并非个别科室的困扰。温州某三甲医院急诊科温医生同样提到,急诊科病种繁杂、病情瞬息万变,遇到疑难病例时,医生往往需要跨多个专业检索平台,才能找到可靠的临床证据,“整个过程非常繁琐费时”。

  这种情况下,AI工具的出现一度被寄予厚望,可当医生们真正上手后,又遇到了新的问题。

  卢医生告诉“医学界”,她曾尝试用通用AI检索文献,即便明确要求提供准确的DOI号,点开链接却发现是一篇毫不相关的文章。“这不但没节省时间,反而增加了验证成本。”温医生也有类似经历,有些回答给出的引用,根本查不到出处。

  虚构文献,编造结论……通用AI的“幻觉”问题,在其他领域或许只是不便,但在医学场景中却可能酿成真正的风险,也是医生们难以信任AI最根本的原因。

  正是基于这一痛点,阿里健康在开发“氢离子”之初,就将核心定位瞄准在六个字上:低幻觉,高循证。换句话说,“氢离子”要解决的,不是“AI能不能回答医学问题”,而是“医生敢不敢信AI的回答”。

  为此,“氢离子”构建了一套完整的循证链路。

  为了确保所有回答均能标注权威出处,支持一键溯源,“氢离子”录入了千万级医学核心期刊文献,并打通了“中外文献检索——翻译——解析——可溯源回答”的全流程,覆盖从问题提出到证据验证的完整工作流。

  同时,氢离子还首次将时效性与权威性融入引用逻辑——通过对全球指南与文献的日更追踪,每一个回答都能精准定位到原文中支撑观点的具体语句,并同步校验其时效性与可信度,精准指出“引用的哪句话?为什么可信?此刻是否仍然有效?”。

  卢医生告诉“医学界”,在“氢离子”的辅助下,目前她已经形成了一套熟练的工作流:准备学术汇报时,先用通用AI生成大纲初稿,再用“氢离子”搜索权威文献、翻译精读、提炼总结。“它给出的每一条引用,我都能查到真实出处,这是让我最放心的。”

  让证据可得、可用、可信,在面对循证医学落地的“最后一公里”时,这是“氢离子”所给出的回答。

  医学循证,靠什么保障?

  “低幻觉”三个字说起来简单,但在医学场景中,靠什么来保障?

  当行业多数产品还在卷模型参数、卷问答的流畅度时,氢离子选择了另一条路径——从“内容源头的权威性”和“输出质量的专家把关”两个维度,同时建立壁垒。

  在内容源上,“氢离子”没有选择依赖互联网上质量参差不齐的公开信息,而是基于千万级国际顶尖期刊文献、国内外权威临床指南与共识以及药品说明书,构建了一套专用的循证数据库。

  据阿里健康CTO王祥志介绍,“氢离子”有别于其他通用大模型的底层技术逻辑,是四层循证AI架构。

  “第一层是证据理解与内容体系,所有指南和文献在进入系统时,都会基于PICO框架和GRADE标准进行结构化理解;第二层基于PICO的检索与数据增强,保证输出的每一句话都有据可查;第三层是模型强化与微调,让模型学会‘什么是准确、忠实循证、安全有用的答案’,并确保满足循证医学的严格标准。”

  而第四层,则是由医学专家评审体系完成质量的闭环。

  在此次发布会上,“氢离子”正式宣布成立“AI医学专家委员会”,由黄晓军教授、肖瑞平教授、于金明教授等10位国内各学科顶级专家领衔,负责整体学术方向把关。

  同时,50位指导委员会成员负责制定评测标准与方法论;数百位来自复旦100强医院的评测医生,则对AI回答进行验证与反馈。

  值得一提的是,这并非一次性的“专家亮相”。专家的定期评测结果,将持续地反馈到产品的迭代中,经确认后统一纳入“氢离子”的实时知识库更新,形成了“用——评——改”的循环。

  肖瑞平教授在发布会上表示,AI对医学的影响是方方面面的,但越往前走,越需要标准、需要底线、需要方向。“什么样的AI是安全的?什么样的模型是可信的?这些问题不只是靠技术来解决,必须由临床、由科学证据、由规范治理来回答。”

  肖瑞平教授指出,专家委员会的三级架构设计——顾问委员会把握方向,指导委员会制定标准,评审委员会扎实做好临床验证——是一种务实、专业、可长久运行的模式。“我们不是走个形式,而是要面向临床,建立一个经得起检验的、有循证基础的AI评价体系。”

  从内容源头的权威性,到输出质量的专家把关,这套“顶刊授权+专家审核”的双保障体系,都指向了一个核心目标:让每一条AI输出,都能经得起临床验证。

  当国际顶刊投出“信任票”

  发布会上另一个引发广泛关注的信号,来自国际顶刊英国BMJ集团。

  “氢离子”宣布,成为BMJ集团在中国独家合作的医学AI平台,包括《英国医学杂志》在内,BMJ集团旗下70本医学期刊的所有内容和多媒体资源,将独家授权提供给“氢离子”。同时,“氢离子”目前还正在与全球多家顶刊进行合作沟通。

  国际顶刊筛选合作对象的标准素来严苛,其判断“独家内容授权”的依据,不仅是模型参数和用户规模,更是对产品循证能力与专业内容把控水准的专业认可。

  因此,对于一款将贯穿医生日常工作的AI工具来说,这张“信任票”的分量不言而喻。

  依托此次合作,中国医生可以通过“氢离子”直连全球顶级医学文献,进行循证问答、全文阅读、在线翻译,解决临床与科研过程中的医学问题。

  BMJ集团出版业务首席执行官Niels Peter Thomas博士表示:“BMJ集团致力于提供优质医学知识、促进全球健康事业的发展。将期刊文章内容接入人工智能医学平台‘氢离子’,是突破传统知识获取方式的一次创新,期待能以此更好、更多地服务中国医生。”

  当AI的所有回答,都可溯源至顶刊原文或国内权威指南,当每一次输出都经过专家委员会的验证,“氢离子”实际上建立的,是一套“循证问答标准”——什么样的信息源可以被引用,什么样的输出质量才算合格,什么样的迭代机制才能持续可信。

  这不只是一个产品的能力边界,更可能深远影响中国医生的临床决策习惯:从“凭经验判断”到“有据可查”,从“我觉得”到“证据显示”。

  肖瑞平教授认为,面向全球医学 AI 快速发展的格局,中国需要有自己的权威学术声音,需要有立足临床实践、符合中国国情、经得起国际检验的医学 AI 标准体系。

  “我们有决心,也有能力,汇聚全国顶尖学术力量,以严谨态度、科学方法、临床实践,打造属于中国、服务中国,并能走向世界的医学 AI 标准,为全球医学 AI 治理贡献中国智慧与中国方案。”肖瑞平教授说。