对话王小川：离开通用人工智能的主干道之后

" 如果没有转型，继续走主流道路，你也会有同等程度的焦虑。" 王小川说，这次转型，让他真正回归到从创业第一天就最想做的事情：造 AI 医生。

访谈｜邓咏仪杨轩

文｜邓咏仪

编辑｜张雨忻

一年前，王小川带着百川智能来了一次激烈的 " 大刹车 "：大幅缩减通用模型团队，关闭金融等多条行业线，All in 医疗大模型。但与此同时，整个大模型行业却热闹非凡，大厂和创业公司轮番进行 " 轰炸式更新 " ——过去半年里，平均 3 天就有一个新版本的通用大模型面世。

而看起来沉寂的百川在做什么？5 月 22 日，王小川安静地交出答卷：新医疗大模型 M4，以及 Agent 产品 " 百小医 "。

过去 3 年里，百川逐渐从 " 要做中国最好的基础大模型 " 转向 " 同时押注多个落地场景 "、" 做 C 端超级入口 "、再到如今的 " 只做医疗 "，团队规模不断缩小，部分合伙人离开，原定的上市节奏也因而延迟。

这看似颠簸的路走对了吗？当我们在新产品发布前夕见到王小川时，发现他的状态反而更坦然了：" 继续卷通用模型，走主流道路，那是一种选择，即使上市了很风光，但焦虑也不会减少半分。" 他对《智能涌现》说，比起当时公司内外巨大的不理解，以及选择非共识道路的孤独感，他更难以接受的是：" 公司快成立两周年了，却不知道自己到底在干什么，创造什么价值。"

在互联网上一个十年，医疗并不是一个好生意——商业化路径漫长，反馈周期以年计。从大厂到初创公司，即使投入高达数十亿元，成功跑通 PMF 的产品都寥寥无几，更别提获得商业上的大成功。

在当时的背景下，很多公司的选择是给医生提效，或是打通挂号、药、保险的链路，以此跑通商业闭环。但王小川说，这些都不是当下最重要的事。他想明白一点：百川的 C 端产品必须以患者为中心，要增加医生的供给，" 我们要造更多的医生 "。

在这个思路下，百川在医疗的 B 端场景中有了更多落地进展：在北京儿童医院，百川两款 AI 儿科医生已在院内多学科会诊中正式 " 上岗 "。在很多诊疗方案中，AI 儿科医生与专家会诊结果吻合率达 95%，并开始向河北省 150 余家县级医院下沉。

同时，在 C 端，百川新上线的 Agent 产品 " 百小医 " 则在 App 和微信生态中共同提供服务。" 百小医 " 就像一个 "AI 家庭医生 "，不只是提供问答，会在患者就医前准备给医生的病情梳理，做处方分析，管理病例，还会定时提醒你吃药、做检查等等。

△图源：百川智能

王小川并不接受 " 医疗是更长、更慢的一条路 " 这个观点。" 这个想法本身就是一种时代惯性。" 他的逻辑是：如果 Coding Agent 能在几个月内成为史上增长最快的应用场景，就意味着很多旧边界已经被打破。

从通用大模型的白热化竞争中抽身，All in 医疗——对这个选择，王小川坦承，" 我的选择不一定对，也不一定错，但我觉得，AI 时代只要交付给用户足够重要的价值，商业化会是水到渠成的事。"

对于那些依然身处在同质化竞争中的 AI 公司来说，王小川的选择，至少是一条值得认真审视的路径：去找一个真正相信的问题，然后用足够长的时间回答它。

以下是王小川与《智能涌现》的对话：

All in 医疗有它的代价

《智能涌现》：今年年初，你们发了医疗大模型 M3，今天再接着发布新一代医疗大模型 M4，还有新 Agent 产品百小医，核心提升有哪些？

王小川：M4 是我们的闭源医疗大模型，通过 API 提供服务，一个核心亮点是走 Agent 架构，从简单的对话走向临床，里面有基于患者全生命周期的记忆能力。

另外的突破有几个：幻觉减少、循证能力增强——我们把指南做原子化拆解，甚至把专家共识也纳入进来；提问能力也有了很大提升——这个对医疗场景很关键，我们每提升两个点的提问能力，就能增加一个点的诊断准确率。

现在，在肿瘤这类复杂场景里，M4 能自己跑完整个 Agent workflow ——收集数据、校对冲突、调用基因变异数据库、出诊断建议。M4 能够自主决策，不同的子项肿瘤的情况它甚至能查基因库，像龙虾一样，做到主动提问和主动管理。

" 百小医 " 是百川的新 To C 产品，形态是一个在 App 和微信上的 bot，可以主动提供处方、病例分析，做全周期的健康数据管理。

《智能涌现》：你所指的 M4 模型 " 做得好 "，是怎么定义的？

王小川：在 OpenAI 发布的 HealthBench 测评集上，我们在 Hard 和 Professional 两个子集里都是最好的模型。我们没有对 benchmark 做特殊训练，所以，模型表现好就是好。这个评测集有 5000 个医患多轮对话场景，262 个人类医生编写了近 5 万条评价规则，不是刷榜能刷出来的。

《智能涌现》：今天最大的行业共识是 Coding，百川却在一年前就选择不走通用模型路线，All in 医疗，当时怎么想的？

王小川：AGI 大叙事没问题，但这里面肯定有泡沫，泡沫褪去之后珍珠会留下来。怎么去找这个珍珠？大家会押注各自的生态位。做百川到现在，我想做的东西其实没什么变化——当初的初心就是做生命模型，造医生，ChatGPT 的出现是这个目标的助力。

我之前想得太早，又想得太远了。2023 年的时候你跟大家讲造医生、做生命模型，会发现理解的人不多。

《智能涌现》：但在那个节点，不卷通用模型，是一种脱离主流赛道的选择，你有过担忧吗？

王小川：如果做主流，你也会有其他恐惧。我不是说我现在做得特别好，只是主流也有主流的问题，不同选择有各自的代价。

我们在 2025 年 4 月大调整后开始专注做医疗，也是因为当时临近百川成立两周年，我有巨大的紧迫感。当时公司特别重，从模型、医生到生命模型，再到商业化都在做。当时就是不知道自己在干嘛，在创造什么价值。

《智能涌现》：这个决定的代价是什么？

王小川：很多人在那个时候离开。有同学觉得做通用模型才是对的道路，投资人也有意见。当时有各种曲解，比如有人传小川可能对上市没想法，无所谓，反正自己财务自由了。

《智能涌现》：有创业公司也会选择先不考虑这么远，先赚到钱养梦想，上市也是一种路径。

王小川：我们那个时候也不缺钱啊。上市了，然后呢？

《智能涌现》：百川的一些前高层，以及你的一些投资人，他们都很难理解你的突然刹车。

王小川：可以想办法把 ARR、收入做起来，但在当时也不是我最想要的。

第一，你就没精力做业务了，你拿到收入跟你真正交付一个好的产品或服务不是一个维度的事。第二，业务单点还没突破的时候，搞矩阵化管理是特别危险的事，当时销售、产品、技术，每个人身兼数职，为多个产品服务。

这种状态和我对公司想实现的价值的判断是没法 match 的。如果我从内心就不相信这个事情的话，也很难做好。

《智能涌现》：那你怎么跟投资人解释？

王小川：很难解释。投资人肯定想上市，我只能继续把现在的事做好。

《智能涌现》：4 月调整完之后，团队规模、架构，包括百川整体的工作方法有什么改变？

王小川：我们人数压缩到不超过 300 人，层级扁平，现在就 10 多个人给我汇报。

我们现在就分几大块：一是做医疗模型本身；二是以 Agent 的形态做 AI 医生产品；三是做医院体系的合作，通过 AI 医生，把医院、卫健委等等体系联系起来，我们的目标是用 AI 做四级诊疗。

《智能涌现》：所以，你对这一段探索过程的反思会是什么？

王小川：最大的反思是不该开那么多条线。你要么做通用，要么做医疗，两个脚一块走是不行的。同时做商业、做技术、做医疗，一开始很难负担得住。

我们不是想取代医生

《智能涌现》：" 百小医 " 为什么会在微信里做 AI 医生 bot？

王小川：Bot 就是你微信上的一个朋友——你问他 " 该不该去医院 "，他说不用，你先观察；过两天他会主动来问你 " 有没有变严重 "，也会提醒你吃药，能够对个人和家庭健康进行主动和个性化管理。

日常的健康管理不是一两次问诊能解决的，是长期陪伴，助手类 APP 很难承载这种持续性。

《智能涌现》：很多人可能会问，用百川的助手看病，和用豆包看病，体验差距大吗？

王小川：我们在专业性文献的引用、溯源上，会比通用 AI 助手更丰富。但坦白讲，无论是什么领域，问答场景的体验很难形成断代式的差距。

在产品形态和体验上。这次发布的 " 百小医 " 是走双端架构：APP 端负责提供严肃的就医决策——针对病例、处方做分析报告、对比；微信 bot 端负责日常的提醒和执行，这是一个会主动跟进你健康情况的 AI 医生。

另外我们在底层做了一套永久性的记忆存储，不走上下文那套模式。这是一套有数据库结构的存储——用户上传的体检报告、对话里提到的症状病情、血压、用药情况都能被记录，做全生命周期的健康数据管理。记忆能力在医疗场景特别重要，通用模型很多时候根本不知道该存用户的什么数据。

《智能涌现》：如果和同样是做医疗方向的阿福相比呢？

王小川：我们的切入点不一样。我们做的是主动管理——你问完之后，过两天它会微信上主动来问你 " 有没有更严重 "，提醒你吃药、该复诊了。这种持续跟进的能力，App 很难承载，用户一上手就能感觉到不同。

《智能涌现》：美国 AI 医疗赛道的头部公司 OpenEvidence 估值已经 120 亿美元了，他们做是面向医生的 AI 临床决策支持工具，用顶刊论文辅助医生做诊疗判断。你们在中国能走这条路吗？

王小川：中国和美国的医疗市场有很大区别：给美国医生提效能直接多赚钱——他一天看 10 个病人变成看 15 个，这是保险公司付费的，按人头算，收入直接多 50%。但中国医生平均一天看 50-80 个病人，已经够忙了，提效的空间几乎没有。

《智能涌现》：那在中国做 AI 辅助诊疗，动力在哪儿？

王小川：中国优质医疗供给现在是严重不足，直接用通用 AI 助手给患者做 AI 咨询，这是很难进入医疗体系的，还容易带来新的医患矛盾——今年已经有三甲医生和我反馈，30 个病人里有 25 个都带着豆包来 " 对线 "，会对医生产生质疑。

现在国家在倡导主动健康管理和强基层，如果 AI 能融入医疗体系、做分级诊疗的前置环节，这是政策认可的方向，也是新物种的机会。

《智能涌现》：那百川是怎么提升医疗模型的智能的？

王小川：我们做的不是传统意义上的训练数据，更多是做强化学习的评价体系。

医生标的不是正确答案，是帮我们建立奖励函数做评测集——什么样的提问路径最终能导向好的诊断结果。

《智能涌现》：我们听说你们请了很多医生做数据标注，这部分很花钱。

王小川：跟医生打交道做数据标注，真的很难，但不是钱的问题，是说服他们、建立评价体系、让团队跟他配合，这些都要摸索，没人做过。

《智能涌现》：既然是全新的做法，那一定也会有人反对吧？

王小川：不少人觉得在中国做医疗 AI，要跟医生合作，要用医生的病例数据造 AI 分身。

《智能涌现》：什么样的 AI 分身？

王小川：就是很多 AI 医疗公司的做法——跟某个医生合作，拿他的病例数据训一个模型，本质上是复制这个医生的经验。肾病专家造个肾病模型，肿瘤专家造个肿瘤模型，每个人都想巩固自己的学术权威。你见过一个医生用另一个医生做的 AI 吗？

《智能涌现》：你们的 " 造医生 " 和这种做 AI 分身有什么不同？

王小川：分身是模仿学习——把病例喂进去，让 AI 学着像某个医生那样看病。但你拿病例训出来的模型，它会提问吗？

这代大模型造的是 " 人 "，不是上一代那种用来看 CT 片子的模式识别模型。我们走的是强化学习的路：模拟患者，激发模型提问，用最终的诊断结果做奖励函数，反向训练它该怎么提炼病例数据，问什么问题、该怎么推理。不是复制某一个医生，而是让 AI 学会医生思考的过程本身。

《智能涌现》：所以你们做的事情，本质上是把医生拉下神坛。

王小川：这是个危险的评价。我们不是要挑战医生的权威，而是要帮患者明明白白看病，以患者为中心，让他拥有知情权和决策权。

《智能涌现》：面对医生，你怎么一句话解释百小医的价值，来消解这种可能存在的对抗？

王小川：我说我能帮你做随访。

这是一个共赢的场景：很多病人去看完病，加上医生微信，回家之后问问题，等医生的回复往往要等到大半夜，因为医生太忙了。院后随访、复诊提醒、用药管理等等都是这样的场景，现在用 AI 医生就能帮医生分担这部分需求。

《智能涌现》：你们的目标用户是谁？

王小川：我们概括为 " 一老一小 " ——老人慢病多，小孩咨询多，这是最高频的场景。

比如，我把我妈和 AI 医生拉进群，AI 医生跟我妈对话的时候，也跟我沟通。就像家里请个保姆，不是只跟老人在一块，他也跟你有交流。

医疗是条更慢的路？这是上一代的认知

《智能涌现》：很多人会说，医疗是一个反馈路径很长的赛道。先用通用模型赚到钱，再长期养医疗这条线，不是更稳妥吗？

王小川：我不接受这个叙事，这里面有很多误解。医疗慢这是过去的经验形成的认知，不代表今天。

今天太多事情跟过去的规律不一样了。几个月时间，一个产品就能上亿用户、上亿收入规模。那为什么我们还要用老的方式看医疗？

百度三分之一的收入来自医疗，一天医疗相关的 query 量是上亿级别的。蚂蚁阿福也有 3000 万月活了。需求一直在那里，只是以前可能是我们还没做好供给。

《智能涌现》：你们原来做 To B、To G，到现在做 To 患者，这个变化是怎么发生的？

王小川：我确实有过很多反思，但我始终相信 AI 能造医生，这个信仰从第一天就刻在骨子里。我们在中间走过弯路，比如尝试让医生认可，就先做一个 AI 工具帮医生看片子、写论文；也试过做院内，先打进医院体系里，但这些路径都太长了。

大概去年 4 月我们就想清楚了，To 患者才是我们主线，这条路其实也是 To 医生。医生和患者不过是有不同需求的 C 端用户。

《智能涌现》：比如挂号、买药，这些也是 C 端用户的刚需，你们会做吗？

王小川：帮你挂号、帮你买药，那些是执行，是上一代互联网干的事，偏匹配、链接。我们不是不能做，但核心还是想做决策——比如你有三个处方选哪个？去什么科室？要不要去医院？执行更直观、更有获得感，但帮你做选择判断是更难也更宝贵的事。

《智能涌现》：但蚂蚁做阿福，后续可以把挂号、卖保险、卖药联系起来，这样不会比你们在商业化上跑的更快吗？

王小川：他们是从 " 药 " 和 " 险 " 出发，补前面的问诊环节，而我们是从 " 医 " 这端开始切的。站在药的思路去做医，跟独立做医，立场不一样，做出来的东西也不一样。

《智能涌现》：短期内，你希望能够达到什么产品和业务上的目标？什么时候会考虑商业化？

王小川：第一步是上岸——去年还有朋友问 " 百川还活着吗？" 得先让大家看到我们在做什么，第二步是在不同场景里积累技术口碑和用户体验的口碑。

商业化不是当下的重点。考虑早了，动作会变形。你看智谱到今天也不做那么多 To B 和 To G 了，大家都在卖 Token。上一代常用的那套做法现在反而变成了包袱。

语言模型、世界模型、生命模型

《智能涌现》：有媒体说你是 " 最孤独的 AI 创业者 "，现在你会觉得孤独吗？

王小川：自己选的路跟大家不一样，你不就孤独吗？从资本到人才上都会变得更难。羊群效应决定了大家还是会选更主流的道路，这是正常规律。

《智能涌现》：你怎么看现在 AI 应用创业公司的处境？

王小川：在做模型之外，很多创业公司没啥可干的了。做 Agent 的公司，壁垒在哪？倒腾点 Anthropic 的 Token，配置配置方案，今天能卖，明天能不能卖不知道。

不是说 Agent 没前途，而是它可能不是适合 VC 投的生意——赚小钱的公司很多，但长大变难了。

之前我和一个互联网大佬聊，他提到一个 " 去中化 " 的趋势——这个 " 中 " 是指中型公司。要么做巨头，要么做小而美的公司。

《智能涌现》：说到巨头，你去年初就公开说看好 Anthropic，那时候 Coding 还没爆发，你的判断怎么来的？

王小川：我觉得是 Dario 对技术的理解很深刻，这是一种审美层面的判断。后来事实也验证了—— Claude 在代码场景里确实打出来了。

《智能涌现》：那其他呢，OpenAI 你怎么看？

王小川：我觉得 Anthropic 和 Google 都会比它强。

《智能涌现》：你看到什么现象，让你有这个判断？

王小川：第一，Sam Altman 还带着上一代互联网的思路——强推应用、追 DAU、做订阅，甚至 Sora 还想做社交。他的策略是应用大于模型本身，跟 Anthropic 不在一个技术审美上。

第二，做 To C，Google 会比 OpenAI 强。Google 有搜索、有安卓、有 YouTube，出口能力和数据能力都更好，我觉得 Google 是以后会有代际的爆发和飞跃。

《智能涌现》：哪方面的爆发？

王小川：我觉得 Google 会走出新的架构——不只是语言模型代表的智力模型，还有物理模型、生命模型等等新路线。

其实 Demis Hassabis（Google DeepMind CEO）的心头最爱就是生命模型，后来才转到 LLM 这个战场来的。

以后 Google 肯定既做语言模型，又做生命科学。一个公司能同时做 AI、做无人驾驶、做蛋白质折叠——从人才储备、数据厚度、算力规模上，Google 都是顶配。

《智能涌现》：所以，你对大模型演变的终局怎么看？

王小川：我们做模型有三步走。第一步是智力模型，就是语言模型——这里的语言包括数学语言和代码语言，代码很重要，待会再讲。第二步是物理模型，或者叫世界模型，做具身智能。第三步是生命模型，比材料科学更往前走——材料科学讲的还是简单世界，而生命有超越复杂性的终极问题。

生命模型是我从第一天就想做的事。这三条线最终会合流——理解语言、理解物理世界、理解生命系统，这才是完整的智能。

而且你想，工作开始被 AI 替代之后，人追求什么？创造发明发现、健康、快乐——最后就这三个事。长生不老、健康、每个人活得更有意义，这些问题最终都指向生命模型。

欢迎交流

本文来自微信公众号" 智能涌现 "，作者：邓咏仪，36 氪经授权发布。

宙世代

一起剪

相关标签