HealthBench评测登顶榜单，王小川实现超越GPT-5.2

1 月 13 日，百川智能创始人王小川发布新一代医疗大模型 Baichuan-M3。

这位曾带领搜狗赴美上市的 " 技术少帅 "，在 AI 赛道深耕两年后告别通用模型混战，将所有筹码押注于容错率极低的 " 严肃医疗 " 赛道。" 我们没能力同时兼顾金融、娱乐、医疗等多个领域，只能深耕一条主线。" 这句话为百川的发展方向定调。账上约 30 亿元现金储备与 2027 年启动 IPO 的明确目标，为这份战略定力添了底气。

Baichuan-M3 是这份战略决心的技术落地。它一举在 OpenAI 权威医疗评测 HealthBench 中以 65.1 分登顶榜单，实现对 GPT-5.2 的超越。更关键的是，不依赖外部检索工具的前提下，其医疗幻觉率（生成错误医疗信息的概率）低至 3.5%，创下全球医疗大模型最低纪录，为严肃医疗应用筑牢安全底线。

百川技术负责人鞠强透露，公司约 80% 算力投向 " 事实感知强化学习 " 训练。区别于行业常见的外部工具修正模式，百川选择从源头解决问题：让模型学习过程中绑定医学事实，对无依据医疗判断明确 " 惩罚 "，同时保留推理探索能力。团队还针对性优化算法，让评价模型同步升级、在模型内部完成幻觉压制、改造算法适配长对话，最终让 Baichuan-M3 具备原生端到端严肃问诊能力，可主动追问病史、聚焦核心信息。

王小川的选择源于对国内医疗四大结构性难题的观察：

1、医生资源短缺；

2、医患信息不对等（患者承担决策后果却掌握最少信息）；

3、家庭医生体系缺失导致三甲医院拥挤；

4、医学存在认知盲区。

因此百川目标明确：不替代医生，而是做患者院外 " 决策帮手 "，解决 " 看病懵 " 痛点。他认为，未来医疗增量不在医院内，关键诊疗判断多在院外完成。

按规划，2026 年上半年百川将推出两款面向消费者的医疗 AI 产品，核心功能为梳理症状、解读医疗信息、明确就医步骤，严守不诊断、不开处方的监管红线。商业化采用 " 初期免费获客、后续按模块收费 " 模式，未来可探索订阅或医药合作。目前已锁定儿科、肿瘤领域，与北京儿童医院、中国医学科学院肿瘤医院达成合作，推进真实临床场景验证。

医疗 AI 赛道巨头环伺，百度健康、平安好医生等老牌玩家深耕布局，蚂蚁 " 蚂蚁阿福 " 等跨界力量入局，还有企业占据医学影像等细分赛道。面对竞争，百川的差异化优势在于领先的模型技术与聚焦高价值严肃医疗场景的定力。王小川指出，部分通用模型企业上市受益于技术红利与政策支持，而医疗 AI 核心价值是解决深层临床需求，需时间培育。

从 IOI 金牌清华特招的天才少年，到打造搜狗 " 三级火箭 " 并带领上市的 CEO，" 韧性 " 与 " 技术理想主义 " 是其标签。2023 年创立百川后，公司迅速完成多轮融资，累计融资额已近 75 亿元，却在通用模型热潮中收缩团队至 200 余人（峰值 450 人），新人需经他面试确认深耕医疗意愿。这源于他的长期执念：成立之初便在全员信中立志 " 用二十年助力生命科学与医学发展 "。

手握充足现金储备的王小川展现出足够的耐心，当前资金利息即可支撑公司体面运营，无需短期变现。从挑战搜索巨头到攻坚医疗 AI，他始终选择最难的路。

来源：星河商业观察

宙世代

一起剪