钛媒体 3小时前
今年最火的AI医疗增长神话,中国能复制吗?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_renwen1.html

 

文 | vb 动脉网

11 个月、免费、覆盖 40% 美国医生群体。

美国 OpenEvidence 以专精小模型 + 病毒式增长,证明了在医疗这个最难渗透的行业里,依靠精准的发展策略,也能做出现象级爆款产品。

成立仅四年,OpenEvidence 已创下多项行业纪录:美国约 40% 的执业医生成为其活跃用户,注册医生总量超 25 万,日均处理临床查询超 6 万次,成为历史上增长最快的医生端 AI 平台。自今年 7 月以来,该平台每月临床咨询次数几乎就翻一番,达 1500 万次。这表明医疗工作者对该工具的需求正在极速增长。

资本层面,其估值实现了火箭式增长:2025 年 7 月估值为 35 亿美元,10 月完成 2 亿美元融资后,估值跃升至 60 亿美元,短短三个月增长近 70%。截至目前,公司累计获得 Google Ventures、红杉资本、凯鹏华盈、黑石集团等知名风投超 3 亿美元投资,成为医疗 AI 赛道估值最高的初创企业之一。

面对这样一个快速蹿升的项目,我们不禁要问它究竟做对了什么,国内是否有类似的产品?

OpenEvidence 解决了什么问题?

解决临床医生实际痛点是 OpenEvidence 发展的核心逻辑。

据《Nature》的研究,如今医学知识每 73 天就会翻一倍,而在 1950 年时,这个数字为 50 年。照此计算,医科学生甚至要每天学习超过 29 小时才能跟上专科文献的发表速度,这显然是不可能做到的。

OpenEvidence 创始人举过一个例子,一位银屑病合并多发性硬化症的患者来找皮肤科医生。皮肤科医生就会处于一个困境,他们不想让多发性硬化症变得更糟,而多发性硬化症是一种神经疾病,皮肤科医生很难快速获得 IL-17 抑制剂和 IL-23 抑制剂疗效的最新证据,特别是这些抑制剂对多发性硬化症合并症患者的疗效和安全性是什么。

在传统场景下,医生不得不求助 PubMed,可搜索后只会得到文献标题,而不能得到诸如 "IL-17 抑制剂与 IL-23 抑制剂的安全性如何?" 这样一个非常具体问题的答案。站在 AI 工程的角度来看,这是一个去寻找边缘案例的过程,在同行评审的顶级医学期刊的某篇文章中回答了银屑病和多发性硬化症患者 IL-17s 与 IL-23s 的比较安全性问题,但它永远不会出现在标题中。

在智药局合伙人张世晨看来,可以有两个纬度来理解 OpenEvidence:从技术端来看,它是医学证据的 Google 增强版;从产品端来看,它是专属于医生的 ChatGPT。

OpenEvidence 所做的,就是在医学知识数量疯涨的当下,为注册医生提供可信医学证据的 AI 搜索引擎,通过整合全球权威医学文献,在数秒内快速为医生输出可追溯、结构化的临床决策支持内容,本质是解决医生 " 知识过载但可信信息稀缺 " 的痛点,其输出的每一条结论都能精准关联至 NEJM、JAMA 等顶刊文献的具体段落,规避了 AI 幻觉风险。

OpenEvidence 怎么做的?

OpenEvidence 选择垂直深耕而非规模竞赛模式来构建产品。

OpenEvidence 摒弃了通用 AI" 参数竞赛 " 的逻辑,走垂直知识深化路线,其技术体系围绕 " 垂直化模型训练 "、" 证据可信度 " 和 " 医疗场景可用性 " 三大核心构建。

当前,随着 AI 大模型的广泛应用,越来越多的 AI 公司喜欢追逐大参数规模的通用模型。特别是考虑到 OpenEvidence 成立于 2022 年,正值 ChatGPT 带来的通用大语言模型浪潮,OpenEvidence 却反其道而行,在 2023 年发表了《Do We Still Need Clinical Language Models?》论文,详细论述了医疗这类高精度要求的领域,专门训练的 70 亿参数模型表现优于数万亿参数通用模型的内在逻辑。

2025 年 8 月,OpenEvidence 取得了里程碑式的突破,在美国医师执照考试(USMLE)中获得了 100% 正确的成绩,在全部 325 道问题均准确回答并正确提供参考文献。这一成绩超越了 ChatGPT-5,成为史上首个在该考试中获得满分的 AI 系统。这样的结果无疑是对其模型方法论的最佳背书。

在 " 证据可信度 " 方面,OpenEvidence 选择使用经过同行评审的,来自 PubMed、Cochrane 等权威公共数据源的数据来训练大模型,并且拒绝抓取公共互联网上的内容,尽量避免错误。同时,为解决 AI" 幻觉 " 问题,要求每一条输出结论必须与至少 2 篇以上高等级文献的具体段落强关联,实现结论可追溯、证据可验证的效果。

同时,医生在使用 OpenEvidence 时能直接查看答案的来源,也就是说,OpenEvidence 会直接把流量送回数据库。正是这样的机制,吸引来了顶尖医学期刊《新英格兰医学杂志》的独家合作,获得其全文训练权限并近乎实时更新知识库,同时为其带来大量访问。医生有可靠的内容,专业期刊获得了流量,OpenEvidence 获得了权威内容让模型更加精准,从而形成一个良性循环。

OpenEvidence 架构示意图,据公开信息整理绘制

在 " 医疗场景可用性 " 方面,OpenEvidence 围绕临床决策全流程进行设计,在 Mayo Clinic 的实测显示,系统将复杂病例处理时间缩短 40%,误诊率下降 35%,特别在肿瘤跨学科会诊中提升诊断一致性达 68%;在急诊科,系统将分诊准确率提升至 92%,大大降低了急诊科的误诊率和漏诊率;在罕见病诊断方面表现则更为突出,对 121 种罕见病的识别准确率超过专科医生组 15.7 个百分点,平均决策时间仅为人类专家的 1/8。

具体到产品界面,更是以医生工作流程为设计重点,围绕证据可追溯这一核心,做到每句回答都标注交叉引用编号,文末附上完整参考文献清单,方便医生核实。同时对问题采用双模式回答机制," 临床证据 " 模式侧重展示支持证据和文献综述," 护理指南 " 模式则提供直接操作建议。

总的来看,OpenEvidence 成功构建起了护城河,形成短期难以复制的竞争壁垒。

首先,独家权威内容授权是其核心壁垒,它不仅是仅有的获得 NEJM 与 JAMA 全文索引权的 AI 工具,还与全球多家顶级医学学会达成合作,获得权威的结构化数据,而通用 AI 模型仅能获取文献摘要,内容深度和完整性不可同日而语。

其次,40 万活跃医生产生的真实世界查询数据(包含具体病例、用药疑问、指南困惑等)经脱敏处理后,又能成为模型优化的黄金数据。同时,在医疗自然语言处理领域的深厚积累,包括医学实体识别和关系抽取的特殊优化,临床语境理解和查询意图识别,证据质量评估和排名算法都不是一朝一夕可以追赶的。

最后,是品牌的信任度。目前,OpenEvidence 已经覆盖了美国超过 40% 的执业医师,广泛的用户基础是医生们对其准确性和可靠性的认可。斯坦福医院的心脏科医生表示:" 每当我怀疑 OpenEvidence 的答案,就会去查证原始文献,可大多数情况下,它提供的信息都是准确且有良好引用的。这种信任需要时间建立,但一旦建立,就会成为强大的竞争优势。"

OpenEvidence 能持续盈利吗?

用户免费 + 广告变现的 " 谷歌 " 式商业闭环。

说起 OpenEvidence 的商业模式,就不得不提其创始人 Daniel Nadler 的经历。Nadler 在哈佛大学获得经济学博士学位,2013 年,他创立了金融 AI 公司 Kensho,开发了一种能够实时分析金融事件对市场影响的智能系统,以 5.5 亿美元的价格卖给了标普全球,之后 Nadler 与牛津大学计算机博士 Zachary Ziegler 联合创办了 OpenEvidence。

这位金融专业出身的创始人自然明白一个高效的商业模式对于企业的重要性。

传统医疗 AI 软件系统要想进入医院,有着冗长的医院采购流程,美国一套医院信息系统从评估到采购最快也要 2 年的时间,同时,还要面临 FDA 严苛的审批要求,并且审批过程也较为漫长。

因此,OpenEvidence 选择避开这些障碍,高效抓住用户的同时进行快速迭代。首先,它将自身定位成医学信息检索工具,而不是需要审批的诊断设备,这样一来就不需要 FDA 审批。

其次,它绕过医院采购部门,直接向医生个人提供免费服务。只要经 NPI(美国国家医师识别码)或各国执业医师认证的用户,都可以免费使用基础功能,而文献检索、指南查询、病例分析等核心服务医生也只需用邮箱注册就能使用,整个过程快速高效,医生决策成本极低。同时,极佳的用户体验和免费政策使得产品依靠口碑在行业群体中裂变式快速增长。

最后才是依托于医生用户群体的场景化精准广告投放。过去,像礼来、辉瑞、罗氏这些 MNC 的营销预算要透过医药代表、学术会议或专业期刊进行广撒网式宣传;现在,OpenEvidence 为这些 MNC 提供了将产品信息精准推送给相关领域医生的渠道。

例如肿瘤科医生查询 "PD-1 抑制剂 " 时,会推送相关药物的 3 期研究成果,并且广告内容会经平台临床专家审核,确保符合指南规范。同时,广告与答案系统在界面上采用物理隔离设计,不干扰医生的临床判断。对于甲方而言,数字化广告可以精确跟踪展示次数、点击率和后续处方行为,能清晰呈现 ROI 数据。

目前,OpenEvidence 的年广告收入已超过 5000 万美元,手中还握有价值约 4 亿美元的广告库存,未来会进一步转化为营收,并且由于是数字交付模式,毛利率超 90%,远超 AI 初创企业的平均水平。

在多数 AI 初创公司依赖融资生存的背景下,OpenEvidence 已跑通盈利模式,90% 的毛利率展现出极强的变现能力。从中长期来看,它还可以继续技术集成拓展,针对医院、医学院、制药企业推出定制化 API 接口服务,从而拓宽营收渠道。

这条路国内能走通吗?

中国市场的特殊性导致发展路径有所差异。

国内也有不少定位为医生的 AI 循证决策工具的产品,他们与 OpenEvidence 的核心目标是一致的。

例如成立于 2019 年的上海零假设信息科技有限公司(简称零假设),专注于医学智能化产品开发,旗下 "KnowS" 系列产品是一个虚拟医学助手,通过融合数据技术和医学专业知识,为医生提供以文献分析和临床数据分析为核心的科研解决方案,助力医学研究与创新。

还有百川智能的循证增强医疗大模型 M2Plus,该模型通过创新的六源循证推理范式,涵盖了从基础研究到实际临床反馈的完整知识体系,在医疗知识的准确性和可靠性方面实现了显著提升,医疗 " 幻觉 " 率大幅降低。在生成回答时,M2Plus 也引入了循证增强训练机制,以确保其引用权威来源,而非随意生成内容。

灵犀医疗自主研发的 "EviMed 智慧循证分析引擎 ",通过动态整合全球数亿条医学文献、临床试验数据及真实世界证据,构建了覆盖疾病全生命周期的证据链网络。它不仅能实时追踪最新医学进展,还能通过多模态证据融合与因果推理算法,自动规避证据冲突,为医生和研究者提供可信赖的决策支持,实现 " 零幻觉 " 的精准搜索与推理。

钉钉联合壹生检康发布 " 豆蔻医生超级助理 ",它是钉钉上首个针对医生的专业 AI 应用,能实现 1 分钟整合全球超过 4000 万医疗专业文献,并进行全链路溯源,用权威医疗研究证据,在产前诊断、妇科肿瘤等高复杂度医学场景,妇产科医生只需将病例提交,AI 会从专业文献指南中智能检索,获取 " 指南推荐 + 真实世界数据 + 相似病例 " 的完整证据链,并在 1 分钟生成诊疗建议。

还有定位为 " 医生最便捷的临床决策工具 " 的医渡临床 Copilot,它深度融合医疗垂直大模型、动态循证知识体系与院内患者数据,通过循证校验解决 AI" 幻觉 " 问题,让顶级证据一键溯源确保精准性;又能自动对接患者数据,将医学证据与个体化病情无缝衔接直接给出可执行的诊疗策略,省去繁琐步骤。Copilot 配备集成医生工作站的桌面版与移动端,方便医生在病房诊疗、居家查阅等多环境下使用。

与 OpenEvidence 的免费策略不同,国内的产品普遍选择收费模式,像 "KnowS" 的商业模式是先聚焦头部药企,专注于医疗科研方向,在提供付费服务的过程中,进行高质量标注数据积累并迭代算法模型,再将成熟的 to C 产品 "KnowS" 模型及智能体推向医生群体。EviMed 同样选择了 To B 收费模式,目前,EviMed 平台已在国内超 100 家三甲医院试点应用,辅助完成覆盖心血管药物、抗感染药物、风湿免疫等领域的综合评价项目。

商业模式示意图,据公开信息整理绘制

从产品层面看,国产大模型都有自己逻辑,百川选择了大模型 + 医疗检索增强生成优化的路径,将循证医学作为约束层,反映其对大模型能力的充分自信。零假设选择先服务对专业性要求极高的药企,积累数据后再推向医生这条与 OpenEvidence 相反的路,背后是中国医生工作强度更高、容错率更低的现实问题。还有多款围绕医院现有工作流程设计的产品,其考量也是如何快速融入当下中国医疗信息化的运行模式。

OpenEvidence 能成功,根本在于美国医生是独立决策者,可自主下载 App,有消费级产品使用习惯。而国内医生执业在公立医院体系内,工具采购需医院审批,个人免费工具难以进入核心流程。因此,无论是走 B 端路线,绑定医院系统或是 API 解决方案,都是围绕体系而非个人进行。

张世晨表示,国产 OpenEvidence 的真正启动,需要一批活跃的医生用户。哪款产品能更快赢得医生群体的认可与支持,就越能在这一领域立足,仅靠大众用户数量的增长是远远不够的。

另一方面,OpenEvidence 早期利用 FDA/CDC 公共数据,后期靠 NEJM 主动授权,本质是内容方认可其用户价值。而国内产品尽管在数据方面下了大功夫去提高质量,但相比 NEJM 级别的权威背书还有所不及。此外,OpenEvidence 的病毒式传播,本质是产品驱动增长(PLG),而国内产品以 B 端为主,难以实现 OpenEvidence 的指数级增长。

因此,OpenEvidence 的一些独特壁垒,目前国内产品还没有建立起来。

OpenEvidence 的竞争壁垒,据公开信息整理绘制

比如 OpenEvidence 的产品驱动增长模式,依靠医生自发使用→数据优化→更好体验→口碑传播触达更多医生,从而省下销售费用;内容护城河方面,《NEJM》的主动合作是任何付费推广都买不到的品牌信任,与多个顶级期刊合作共建商业模式解决数据版权问题;还有技术路径的逆共识操作,在如今堆参数的时代坚持使用小模型,反而在专业领域实现更高精准度。

这些策略建立起来的竞争壁垒其实对国产医疗 AI 模型同样具有参考意义。如果国产 AI 医疗模型能在版权和商业模式层面走通,那何尝不能出海与之竞争呢?

综合来看,国内短期内或许不会出现一模一样的 OpenEvidence 类产品,这是因为医疗生态的土壤不同,但国产 AI 大模型经过 B 端用户的使用,在合作中积累足够数据并打磨好产品,在 3 年 ~5 年后在 C 端实现突破,届时或能复制部分 OpenEvidence 的成功。

医疗 AI 的竞争本质是数据与信任的竞争,它的出现不是替代医生,而是让希波克拉底誓言在算法时代重获新生。无论是 OpenEvidence 还是国产 AI 大模型,都在经历从信息检索器进化为医疗生态中枢的过程,这类垂直 AI 赛道都将基于可信优先、场景为王持续进化。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论