
" 如果没有转型,继续走主流道路,你也会有同等程度的焦虑。" 王小川说,这次转型,让他真正回归到从创业第一天就最想做的事情:造 AI 医生。
访谈|邓咏仪 杨轩
文|邓咏仪
编辑|张雨忻
一年前,王小川带着百川智能来了一次激烈的 " 大刹车 ":大幅缩减通用模型团队,关闭金融等多条行业线,All in 医疗大模型。但与此同时,整个大模型行业却热闹非凡,大厂和创业公司轮番进行 " 轰炸式更新 " ——过去半年里,平均 3 天就有一个新版本的通用大模型面世。
而看起来沉寂的百川在做什么?5 月 22 日,王小川安静地交出答卷:新医疗大模型 M4,以及 Agent 产品 " 百小医 "。
过去 3 年里,百川逐渐从 " 要做中国最好的基础大模型 " 转向 " 同时押注多个落地场景 "、" 做 C 端超级入口 "、再到如今的 " 只做医疗 ",团队规模不断缩小,部分合伙人离开,原定的上市节奏也因而延迟。
这看似颠簸的路走对了吗?当我们在新产品发布前夕见到王小川时,发现他的状态反而更坦然了:" 继续卷通用模型,走主流道路,那是一种选择,即使上市了很风光,但焦虑也不会减少半分。" 他对《智能涌现》说,比起当时公司内外巨大的不理解,以及选择非共识道路的孤独感,他更难以接受的是:" 公司快成立两周年了,却不知道自己到底在干什么,创造什么价值。"
在互联网上一个十年,医疗并不是一个好生意——商业化路径漫长,反馈周期以年计。从大厂到初创公司,即使投入高达数十亿元,成功跑通 PMF 的产品都寥寥无几,更别提获得商业上的大成功。
在当时的背景下,很多公司的选择是给医生提效,或是打通挂号、药、保险的链路,以此跑通商业闭环。但王小川说,这些都不是当下最重要的事。他想明白一点:百川的 C 端产品必须以患者为中心,要增加医生的供给," 我们要造更多的医生 "。
在这个思路下,百川在医疗的 B 端场景中有了更多落地进展:在北京儿童医院,百川两款 AI 儿科医生已在院内多学科会诊中正式 " 上岗 "。在很多诊疗方案中,AI 儿科医生与专家会诊结果吻合率达 95%,并开始向河北省 150 余家县级医院下沉。
同时,在 C 端,百川新上线的 Agent 产品 " 百小医 " 则在 App 和微信生态中共同提供服务。" 百小医 " 就像一个 "AI 家庭医生 ",不只是提供问答,会在患者就医前准备给医生的病情梳理,做处方分析,管理病例,还会定时提醒你吃药、做检查等等。

△图源:百川智能
王小川并不接受 " 医疗是更长、更慢的一条路 " 这个观点。" 这个想法本身就是一种时代惯性。" 他的逻辑是:如果 Coding Agent 能在几个月内成为史上增长最快的应用场景,就意味着很多旧边界已经被打破。
从通用大模型的白热化竞争中抽身,All in 医疗——对这个选择,王小川坦承," 我的选择不一定对,也不一定错,但我觉得,AI 时代只要交付给用户足够重要的价值,商业化会是水到渠成的事。"
对于那些依然身处在同质化竞争中的 AI 公司来说,王小川的选择,至少是一条值得认真审视的路径:去找一个真正相信的问题,然后用足够长的时间回答它。
以下是王小川与《智能涌现》的对话:
All in 医疗有它的代价
《智能涌现》:今年年初,你们发了医疗大模型 M3,今天再接着发布新一代医疗大模型 M4,还有新 Agent 产品百小医,核心提升有哪些?
王小川:M4 是我们的闭源医疗大模型,通过 API 提供服务,一个核心亮点是走 Agent 架构,从简单的对话走向临床,里面有基于患者全生命周期的记忆能力。
另外的突破有几个:幻觉减少、循证能力增强——我们把指南做原子化拆解,甚至把专家共识也纳入进来;提问能力也有了很大提升——这个对医疗场景很关键,我们每提升两个点的提问能力,就能增加一个点的诊断准确率。
现在,在肿瘤这类复杂场景里,M4 能自己跑完整个 Agent workflow ——收集数据、校对冲突、调用基因变异数据库、出诊断建议。M4 能够自主决策,不同的子项肿瘤的情况它甚至能查基因库,像龙虾一样,做到主动提问和主动管理。
" 百小医 " 是百川的新 To C 产品,形态是一个在 App 和微信上的 bot,可以主动提供处方、病例分析,做全周期的健康数据管理。
《智能涌现》:你所指的 M4 模型 " 做得好 ",是怎么定义的?
王小川:在 OpenAI 发布的 HealthBench 测评集上,我们在 Hard 和 Professional 两个子集里都是最好的模型。我们没有对 benchmark 做特殊训练,所以,模型表现好就是好。这个评测集有 5000 个医患多轮对话场景,262 个人类医生编写了近 5 万条评价规则,不是刷榜能刷出来的。
《智能涌现》:今天最大的行业共识是 Coding,百川却在一年前就选择不走通用模型路线,All in 医疗,当时怎么想的?
王小川:AGI 大叙事没问题,但这里面肯定有泡沫,泡沫褪去之后珍珠会留下来。怎么去找这个珍珠?大家会押注各自的生态位。做百川到现在,我想做的东西其实没什么变化——当初的初心就是做生命模型,造医生,ChatGPT 的出现是这个目标的助力。
我之前想得太早,又想得太远了。2023 年的时候你跟大家讲造医生、做生命模型,会发现理解的人不多。
《智能涌现》:但在那个节点,不卷通用模型,是一种脱离主流赛道的选择,你有过担忧吗?
王小川:如果做主流,你也会有其他恐惧。我不是说我现在做得特别好,只是主流也有主流的问题,不同选择有各自的代价。
我们在 2025 年 4 月大调整后开始专注做医疗,也是因为当时临近百川成立两周年,我有巨大的紧迫感。当时公司特别重,从模型、医生到生命模型,再到商业化都在做。当时就是不知道自己在干嘛,在创造什么价值。
《智能涌现》:这个决定的代价是什么?
王小川:很多人在那个时候离开。有同学觉得做通用模型才是对的道路,投资人也有意见。当时有各种曲解,比如有人传小川可能对上市没想法,无所谓,反正自己财务自由了。
《智能涌现》:有创业公司也会选择先不考虑这么远,先赚到钱养梦想,上市也是一种路径。
王小川:我们那个时候也不缺钱啊。上市了,然后呢?
《智能涌现》:百川的一些前高层,以及你的一些投资人,他们都很难理解你的突然刹车。
王小川:可以想办法把 ARR、收入做起来,但在当时也不是我最想要的。
第一,你就没精力做业务了,你拿到收入跟你真正交付一个好的产品或服务不是一个维度的事。第二,业务单点还没突破的时候,搞矩阵化管理是特别危险的事,当时销售、产品、技术,每个人身兼数职,为多个产品服务。
这种状态和我对公司想实现的价值的判断是没法 match 的。如果我从内心就不相信这个事情的话,也很难做好。
《智能涌现》:那你怎么跟投资人解释?
王小川:很难解释。投资人肯定想上市,我只能继续把现在的事做好。
《智能涌现》:4 月调整完之后,团队规模、架构,包括百川整体的工作方法有什么改变?
王小川:我们人数压缩到不超过 300 人,层级扁平,现在就 10 多个人给我汇报。
我们现在就分几大块:一是做医疗模型本身;二是以 Agent 的形态做 AI 医生产品;三是做医院体系的合作,通过 AI 医生,把医院、卫健委等等体系联系起来,我们的目标是用 AI 做四级诊疗。
《智能涌现》:所以,你对这一段探索过程的反思会是什么?
王小川:最大的反思是不该开那么多条线。你要么做通用,要么做医疗,两个脚一块走是不行的。同时做商业、做技术、做医疗,一开始很难负担得住。
我们不是想取代医生
《智能涌现》:" 百小医 " 为什么会在微信里做 AI 医生 bot?
王小川:Bot 就是你微信上的一个朋友——你问他 " 该不该去医院 ",他说不用,你先观察;过两天他会主动来问你 " 有没有变严重 ",也会提醒你吃药,能够对个人和家庭健康进行主动和个性化管理。
日常的健康管理不是一两次问诊能解决的,是长期陪伴,助手类 APP 很难承载这种持续性。
《智能涌现》:很多人可能会问,用百川的助手看病,和用豆包看病,体验差距大吗?
王小川:我们在专业性文献的引用、溯源上,会比通用 AI 助手更丰富。但坦白讲,无论是什么领域,问答场景的体验很难形成断代式的差距。
在产品形态和体验上。这次发布的 " 百小医 " 是走双端架构:APP 端负责提供严肃的就医决策——针对病例、处方做分析报告、对比;微信 bot 端负责日常的提醒和执行,这是一个会主动跟进你健康情况的 AI 医生。
另外我们在底层做了一套永久性的记忆存储,不走上下文那套模式。这是一套有数据库结构的存储——用户上传的体检报告、对话里提到的症状病情、血压、用药情况都能被记录,做全生命周期的健康数据管理。记忆能力在医疗场景特别重要,通用模型很多时候根本不知道该存用户的什么数据。
《智能涌现》:如果和同样是做医疗方向的阿福相比呢?
王小川:我们的切入点不一样。我们做的是主动管理——你问完之后,过两天它会微信上主动来问你 " 有没有更严重 ",提醒你吃药、该复诊了。这种持续跟进的能力,App 很难承载,用户一上手就能感觉到不同。
《智能涌现》:美国 AI 医疗赛道的头部公司 OpenEvidence 估值已经 120 亿美元了,他们做是面向医生的 AI 临床决策支持工具,用顶刊论文辅助医生做诊疗判断。你们在中国能走这条路吗?
王小川:中国和美国的医疗市场有很大区别:给美国医生提效能直接多赚钱——他一天看 10 个病人变成看 15 个,这是保险公司付费的,按人头算,收入直接多 50%。但中国医生平均一天看 50-80 个病人,已经够忙了,提效的空间几乎没有。
《智能涌现》:那在中国做 AI 辅助诊疗,动力在哪儿?
王小川:中国优质医疗供给现在是严重不足,直接用通用 AI 助手给患者做 AI 咨询,这是很难进入医疗体系的,还容易带来新的医患矛盾——今年已经有三甲医生和我反馈,30 个病人里有 25 个都带着豆包来 " 对线 ",会对医生产生质疑。
现在国家在倡导主动健康管理和强基层,如果 AI 能融入医疗体系、做分级诊疗的前置环节,这是政策认可的方向,也是新物种的机会。
《智能涌现》:那百川是怎么提升医疗模型的智能的?
王小川:我们做的不是传统意义上的训练数据,更多是做强化学习的评价体系。
医生标的不是正确答案,是帮我们建立奖励函数做评测集——什么样的提问路径最终能导向好的诊断结果。
《智能涌现》:我们听说你们请了很多医生做数据标注,这部分很花钱。
王小川:跟医生打交道做数据标注,真的很难,但不是钱的问题,是说服他们、建立评价体系、让团队跟他配合,这些都要摸索,没人做过。
《智能涌现》:既然是全新的做法,那一定也会有人反对吧?
王小川:不少人觉得在中国做医疗 AI,要跟医生合作,要用医生的病例数据造 AI 分身。
《智能涌现》:什么样的 AI 分身?
王小川:就是很多 AI 医疗公司的做法——跟某个医生合作,拿他的病例数据训一个模型,本质上是复制这个医生的经验。肾病专家造个肾病模型,肿瘤专家造个肿瘤模型,每个人都想巩固自己的学术权威。你见过一个医生用另一个医生做的 AI 吗?
《智能涌现》:你们的 " 造医生 " 和这种做 AI 分身有什么不同?
王小川:分身是模仿学习——把病例喂进去,让 AI 学着像某个医生那样看病。但你拿病例训出来的模型,它会提问吗?
这代大模型造的是 " 人 ",不是上一代那种用来看 CT 片子的模式识别模型。我们走的是强化学习的路:模拟患者,激发模型提问,用最终的诊断结果做奖励函数,反向训练它该怎么提炼病例数据,问什么问题、该怎么推理。不是复制某一个医生,而是让 AI 学会医生思考的过程本身。
《智能涌现》:所以你们做的事情,本质上是把医生拉下神坛。
王小川:这是个危险的评价。我们不是要挑战医生的权威,而是要帮患者明明白白看病,以患者为中心,让他拥有知情权和决策权。
《智能涌现》:面对医生,你怎么一句话解释百小医的价值,来消解这种可能存在的对抗?
王小川:我说我能帮你做随访。
这是一个共赢的场景:很多病人去看完病,加上医生微信,回家之后问问题,等医生的回复往往要等到大半夜,因为医生太忙了。院后随访、复诊提醒、用药管理等等都是这样的场景,现在用 AI 医生就能帮医生分担这部分需求。
《智能涌现》:你们的目标用户是谁?
王小川:我们概括为 " 一老一小 " ——老人慢病多,小孩咨询多,这是最高频的场景。
比如,我把我妈和 AI 医生拉进群,AI 医生跟我妈对话的时候,也跟我沟通。就像家里请个保姆,不是只跟老人在一块,他也跟你有交流。
医疗是条更慢的路?这是上一代的认知
《智能涌现》:很多人会说,医疗是一个反馈路径很长的赛道。先用通用模型赚到钱,再长期养医疗这条线,不是更稳妥吗?
王小川:我不接受这个叙事,这里面有很多误解。医疗慢这是过去的经验形成的认知,不代表今天。
今天太多事情跟过去的规律不一样了。几个月时间,一个产品就能上亿用户、上亿收入规模。那为什么我们还要用老的方式看医疗?
百度三分之一的收入来自医疗,一天医疗相关的 query 量是上亿级别的。蚂蚁阿福也有 3000 万月活了。需求一直在那里,只是以前可能是我们还没做好供给。
《智能涌现》:你们原来做 To B、To G,到现在做 To 患者,这个变化是怎么发生的?
王小川:我确实有过很多反思,但我始终相信 AI 能造医生,这个信仰从第一天就刻在骨子里。我们在中间走过弯路,比如尝试让医生认可,就先做一个 AI 工具帮医生看片子、写论文;也试过做院内,先打进医院体系里,但这些路径都太长了。
大概去年 4 月我们就想清楚了,To 患者才是我们主线,这条路其实也是 To 医生。医生和患者不过是有不同需求的 C 端用户。
《智能涌现》:比如挂号、买药,这些也是 C 端用户的刚需,你们会做吗?
王小川:帮你挂号、帮你买药,那些是执行,是上一代互联网干的事,偏匹配、链接。我们不是不能做,但核心还是想做决策——比如你有三个处方选哪个?去什么科室?要不要去医院?执行更直观、更有获得感,但帮你做选择判断是更难也更宝贵的事。
《智能涌现》:但蚂蚁做阿福,后续可以把挂号、卖保险、卖药联系起来,这样不会比你们在商业化上跑的更快吗?
王小川:他们是从 " 药 " 和 " 险 " 出发,补前面的问诊环节,而我们是从 " 医 " 这端开始切的。站在药的思路去做医,跟独立做医,立场不一样,做出来的东西也不一样。
《智能涌现》:短期内,你希望能够达到什么产品和业务上的目标?什么时候会考虑商业化?
王小川:第一步是上岸——去年还有朋友问 " 百川还活着吗?" 得先让大家看到我们在做什么,第二步是在不同场景里积累技术口碑和用户体验的口碑。
商业化不是当下的重点。考虑早了,动作会变形。你看智谱到今天也不做那么多 To B 和 To G 了,大家都在卖 Token。上一代常用的那套做法现在反而变成了包袱。
语言模型、世界模型、生命模型
《智能涌现》:有媒体说你是 " 最孤独的 AI 创业者 ",现在你会觉得孤独吗?
王小川:自己选的路跟大家不一样,你不就孤独吗?从资本到人才上都会变得更难。羊群效应决定了大家还是会选更主流的道路,这是正常规律。
《智能涌现》:你怎么看现在 AI 应用创业公司的处境?
王小川:在做模型之外,很多创业公司没啥可干的了。做 Agent 的公司,壁垒在哪?倒腾点 Anthropic 的 Token,配置配置方案,今天能卖,明天能不能卖不知道。
不是说 Agent 没前途,而是它可能不是适合 VC 投的生意——赚小钱的公司很多,但长大变难了。
之前我和一个互联网大佬聊,他提到一个 " 去中化 " 的趋势——这个 " 中 " 是指中型公司。要么做巨头,要么做小而美的公司。
《智能涌现》:说到巨头,你去年初就公开说看好 Anthropic,那时候 Coding 还没爆发,你的判断怎么来的?
王小川:我觉得是 Dario 对技术的理解很深刻,这是一种审美层面的判断。后来事实也验证了—— Claude 在代码场景里确实打出来了。
《智能涌现》:那其他呢,OpenAI 你怎么看?
王小川:我觉得 Anthropic 和 Google 都会比它强。
《智能涌现》:你看到什么现象,让你有这个判断?
王小川:第一,Sam Altman 还带着上一代互联网的思路——强推应用、追 DAU、做订阅,甚至 Sora 还想做社交。他的策略是应用大于模型本身,跟 Anthropic 不在一个技术审美上。
第二,做 To C,Google 会比 OpenAI 强。Google 有搜索、有安卓、有 YouTube,出口能力和数据能力都更好,我觉得 Google 是以后会有代际的爆发和飞跃。
《智能涌现》:哪方面的爆发?
王小川:我觉得 Google 会走出新的架构——不只是语言模型代表的智力模型,还有物理模型、生命模型等等新路线。
其实 Demis Hassabis(Google DeepMind CEO)的心头最爱就是生命模型,后来才转到 LLM 这个战场来的。
以后 Google 肯定既做语言模型,又做生命科学。一个公司能同时做 AI、做无人驾驶、做蛋白质折叠——从人才储备、数据厚度、算力规模上,Google 都是顶配。
《智能涌现》:所以,你对大模型演变的终局怎么看?
王小川:我们做模型有三步走。第一步是智力模型,就是语言模型——这里的语言包括数学语言和代码语言,代码很重要,待会再讲。第二步是物理模型,或者叫世界模型,做具身智能。第三步是生命模型,比材料科学更往前走——材料科学讲的还是简单世界,而生命有超越复杂性的终极问题。
生命模型是我从第一天就想做的事。这三条线最终会合流——理解语言、理解物理世界、理解生命系统,这才是完整的智能。
而且你想,工作开始被 AI 替代之后,人追求什么?创造发明发现、健康、快乐——最后就这三个事。长生不老、健康、每个人活得更有意义,这些问题最终都指向生命模型。
欢迎交流
本文来自微信公众号" 智能涌现 ",作者:邓咏仪,36 氪经授权发布。


登录后才可以发布评论哦
打开小程序可以发布评论哦