2025 年 6 月 24 日,国际顶级医学期刊《自然 · 医学》(Nature Medicine)刊发的一篇论文,在中国乃至全球的医疗 AI 领域投下了一枚重磅炸弹。
由浙江省肿瘤医院与阿里巴巴达摩院联合团队研发的胃癌筛查 AI 模型 GRAPE,宣告仅通过最常规的腹部平扫 CT 影像,实现对胃癌,特别是早期胃癌的规模化筛查。
在胃癌发病率、死亡率双高,而早期诊断率严重不足的中国,这一成果直指一个规模巨大、却始终未能有效解决的公共卫生痛点。
继胰腺癌筛查模型 PANDA 之后,达摩院的 " 平扫 CT+AI" 多癌筛查战略再下一城,其背后的商业逻辑、市场格局与未来想象空间,值得进行一次彻底的审视与剖析。
一道无解的方程:中国的胃癌困局
胃癌,是中国的一场 " 沉默的流行病 "。根据国家癌症中心的数据,中国每年新增胃癌患者约 35.87 万,死亡人数高达 26.04 万,占全球总数的近 40%。与此相伴的,是 " 两高一低 " 的严峻现实:发病率高、死亡率高,以及仅为 35.9% 的五年生存率。
这道生存率鸿沟,在与邻国日本(60.3%)和韩国(68.9%)的对比中显得尤为刺眼。值得注意的是,这一差距并非源于手术技术或创新药物的代差,其根本原因在于后者自上世纪 80、90 年代起便推行了全国性的胃镜筛查计划。这些计划将韩国等国的胃癌早诊率(确诊时仍属早期的比例)提升至 60-70% 的水平;而在中国,超过 70% 的患者在确诊时已是进展期,错失了最佳治疗窗口。
医学界的共识和数据早已证明,早期发现是逆转胃癌高死亡率的唯一关键。早期胃癌(EGC)经过治疗后的五年生存率高达 95-99%,几乎等同于治愈;而晚期患者则不足 30%。
因此,GRAPE 模型所要解决的,并非一个未知的科学难题,而是一个已被充分验证、但始终无法在中国大规模有效实施的巨大市场缺口。
1)胃镜的瓶颈与替代方案的集体失效
既然胃镜是金标准,为何在中国难以普及?答案在于其固有的三大瓶颈:侵入性、资源依赖和低效率。
首先,胃镜作为一种侵入性检查,会给患者带来不适与痛苦,导致民众接受度与依从性极低。官方数据显示,中国每年完成的消化道内镜检查不足 4000 万例,大量人群终身未接受过胃镜检查 。在一些针对性的筛查项目中,依从率甚至低至 18-48%。
其次,胃镜检查高度依赖操作医师的经验和麻醉科医生的配合,优质医疗资源分布不均,难以支撑全国范围的普筛。
最后,也是最致命的一点,是其效率低下。传统胃镜筛查的胃癌检出率仅为 1.16% 至 1.20%,这意味着平均需要进行约 100 次胃镜检查才能发现 1 例胃癌。这种 " 大海捞针 " 式的模式,对于拥有 14 亿人口的中国而言,无论在经济成本还是医疗资源上,都是难以承受的。
因此,《中国早期胃癌筛查流程专家共识(2022 版)》等权威指南明确指出,当前最可行的策略是:先通过非侵入性方法筛选出高风险人群,再对这部分人群进行靶向性胃镜精查。这一策略的核心,在于找到一个精准的 " 过滤器 "。
然而,现有的 " 过滤器 " 们表现均不尽如人意。以血清学检测(如胃蛋白酶原 PG、胃泌素 G-17、幽门螺杆菌 Hp 抗体等)为代表的传统方法,被证明对检出率的提升极为有限,仅能将检出率从 1.20% 微升至 1.25%。而近年来备受关注的液体活检技术,尽管前景广阔,但目前仍面临成本高昂、灵敏度有待提升等商业化初期的难题。
这就形成了一个清晰的市场真空:市场迫切需要一种全新的、非侵入性的、低成本且高精度的风险分层工具。GRAPE 的价值定位,并非要取代胃镜,而是要成为那个高效的 " 过滤器 ",确保每一台宝贵的胃镜检查都能用在 " 刀刃 " 上,从而在宏观层面解决整个筛查体系的效率难题。
GRAPE 蓝图:医疗 AI 的新范式
GRAPE 模型的诞生,本身就是对行业固有认知的一次颠覆。长期以来,医学界普遍认为平扫 CT(NCCT)因其对胃、肠等空腔脏器的成像对比度低,且易受气体、蠕动等因素干扰,无法用于胃癌筛查。
达摩院与浙江省肿瘤医院的联合团队,通过构建全球最大规模的胃癌平扫 CT 影像数据集,并利用深度学习技术,从这些在人眼看来信息量极低的影像中,挖掘出了早期病变的微妙特征。
这一成果建立在达摩院 " 平扫 CT+AI" 技术路线的长期积累之上。其早前发布的胰腺癌筛查模型 PANDA,同样基于平扫 CT,也登上了《自然 · 医学》,并获得了 FDA 的 " 突破性医疗器械 " 认定,这为 GRAPE 的技术可靠性提供了强有力的背书。
1)技术架构:兼顾性能与可解释性
GRAPE 模型采用了一个高效且巧妙的两阶段深度学习框架,其核心基于在医学影像分割领域被广泛验证的 nnU-Net 架构。
第一阶段:胃部分割。 模型首先利用一个分割网络,在整个三维 CT 扫描中精准定位并 " 框 " 出胃部区域。
第二阶段:联合分类与分割。 随后,一个包含分类和分割双重任务的网络,对分离出的胃部区域进行精细分析。它不仅能输出一个将患者分为胃癌(GC)或非胃癌(NGC)的风险评分,还能同时生成一个像素级的分割掩码,在图像上直接标示出可疑的肿瘤区域。
这种架构设计是其未来临床推广的关键优势之一。它并非一个提供 " 是 " 或 " 否 " 答案的 " 黑箱 ",其输出的分割图像(即可解释性)为放射科医生提供了直观的视觉证据。医生可以据此验证 AI 的判断,这极大地增强了临床采纳的信任度,有效解决了许多医疗 AI 工具因 " 不可解释 " 而难以被医生接受的核心痛点。
2)临床数据深度解读:关键在于早期发现
GRAPE 的性能表现经过了极为严苛的多中心、大规模数据验证。模型在包含 20 个中心、近 10 万人的数据上进行了开发与验证。
内部验证集(1,298 例): 曲线下面积(AUC)高达 0.970,敏感性为 85.1%,特异性为 96.8%。
独立外部验证集(来自 16 个中心,18,160 例): 表现依然稳健,AUC 为 0.927,敏感性 81.7%,特异性 90.5%。
在与 13 名放射科医生的 " 人机大战 " 中,GRAPE(AUC 0.92)的表现全面超越了所有人类专家(AUC 范围 0.76-0.85),平均灵敏度提升 21.8%,特异性提升 14.0%。
然而,对于一个筛查工具而言,最有价值的指标并非其平均性能,而是其对早期癌症的检出能力。论文数据显示,GRAPE 对早期胃癌(EGC, T1/T2 期)的检出敏感性约为 50%,而对进展期(T3/T4 期)则超过 90% 。
筛查的全部意义就在于 " 早 ",能将晚期胃癌的发现窗口提前至早期,这正是 GRAPE 的颠覆性价值。
" 一扫多查 " 的雄心
达摩院的雄心不止于胃癌。其公开宣称的 " 一扫多查 " 战略,是以一次平扫 CT 检查为入口,通过 AI 平台同时对胰腺癌(PANDA)、胃癌(GRAPE)、肝癌、结直肠癌、食管癌乃至骨质疏松等多种疾病进行筛查。此前,达摩院已实现在胰腺癌上的突破。
当前,医疗 AI 市场高度碎片化,充斥着大量只能解决单一问题的 " 点解决方案 "。对于医院而言,采购、集成、管理数十个来自不同供应商的 AI 工具,是一场 IT 和工作流程的噩梦。
如果达摩院的 " 一扫多查 ",能够在多种肿瘤或其他疾病中显示积极作用,对医院来说,它就只需一次性集成该平台,即可获得一个不断扩充的、覆盖多个病种的 AI 能力库。
如何商业化?
商业化的核心是支付。对于 GRAPE 这类 " 软件即医疗器械 "(SaMD),其报销路径在中国尚不清晰。
因此,对于类似 GRAPE 的软件即医疗器械类产品商业化可能需要多条腿走路:
B2B 模式(体检机构): 这是目前最清晰、最可行的主渠道。向美年健康这样的大型连锁体检机构销售 " 一扫多查 "AI 服务包,由体检机构作为增值服务向其企业和个人客户推广。
B2B2C 模式(医院自费): 医院在进行常规 CT 检查时,向患者提供一个可选的、自费的 "AI 癌症风险评估 " 附加项。考虑到中国平扫 CT 的价格相对低廉(约 300-500 元),增加一项数百元的 AI 分析费用,对于关注健康的中产阶层具有吸引力。
OEM/ 授权模式(设备厂商): 将 GRAPE 算法授权给影像设备巨头,作为其高端 CT 机型的一大卖点。这是一种轻资产、高杠杆的渠道扩张模式。
价值医疗模式(未来探索): 从卫生经济学的角度,向支付方(包括商业保险和未来的医保政策制定者)证明,投入 AI 筛查的成本,远低于其所能节省的晚期癌症治疗费用。这需要长期的、大规模的前瞻性队列研究数据支撑,是终极目标,但道阻且长。
不过积极来看,GRAPE 有望在未来大幅改善中国胃癌的检出率,提高中国患者生存率,让我们一起期待其大规模的前瞻性验证。
本文来自微信公众号 " 硬 AI",关注更多 AI 前沿资讯请移步这里
登录后才可以发布评论哦
打开小程序可以发布评论哦