雷科技 07-24
国内首个!夸克健康大模型通过主任医师评测:行业上限更高了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

来源:雷科技 AI 硬件组 |   编辑:茶督掌柜

7 月 23 日,夸克健康大模型成功通过中国 12 门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。这是继 5 月通过副主任医师职称考试后,夸克健康大模型的又一次能力跃升。目前," 主任级 AI 医生 " 能力已经全面集成在夸克的 AI 搜索里,查询健康问题的时候,选择深度搜索就可以调用。

之所以是垂类大模型,原因很简单。一方面,垂类大模型相比通用大模型有更强的单一场景专业性,根据夸克公布的数据,在医疗场景下的性能比较,夸克健康大模型的答题正确率,全面超越了通用大模型 DeepSeek。这并不是说通用大模型性能不行,只是 " 术业有专攻 ",针对单一场景的垂类大模型,明显会更适合。

另一方面,对于专业领域,AI 大模型要面对的是各种各样的问题,这意味着单一的数据库回答并不可靠,尤其是医学领域。举个例子,每一位病人都是感冒,但不同的人会有不同的症状表现,症状的轻重也各有不同,甚至还有一定的并发症和过敏等因素伴随,医生就需要根据病人的症状描述 " 对症下药 "。

因此,垂类大模型不仅要 " 知识丰富 ",更要 " 会思考 ",夸克健康大模型以通义千问为基础,走出了一条面向垂直场景的工程化路线。夸克算法负责人表示:" 我们不是在训练 AI 回答医学问题,而是在训练它学会医学思维。"换句话说,医学垂类大模型不能是 AI" 闭门造车 ",更多的还是和真实医生一同共创。

(图片来自夸克)

而夸克健康大模型的核心突破之一,就是 " 慢思考 " 能力。这项能力融合了链式推理和多阶段临床演绎路径建模,驱动模型在面对复杂医疗问题时,能够分阶段、层层深入地推推导出最终回答。

所谓的 " 医学思维 " 并非单方面的知识库或者推理能力,夸克健康大模型的思考,是基于高质量训练数据的。为此,夸克构建了 " 双数据产线 + 双奖励机制 " 的工程体系,将医学数据划分为 " 可验证 " 和 " 不可验证 " 两类,分别对应诊断类任务和健康建议类任务。另外,在训练方法上,夸克引入了 " 过程奖励模型 " 和 " 结果奖励模型 ",确保推导过程和最终结果的合理性和准确性。

为了避免 AI 大模型为了高分而做题而应试行为,夸克健康大模型还设计了多阶段强化学习流程,通过真实医生标注、提问——思考——回答整组数据驱动强化学习,让夸克健康大模型成为了 " 不读死书 ",拥有真正医学思维的 AI 大模型。

得益于在医学领域的专业性,夸克健康大模型得到了不少专业医师的认可,比如安贞医院心脏外科主任医师谢进生表示,夸克在一些问题上回答的专业度比专业医生更强。同时夸克 AI 搜索吸引了一大批医学生和医生群体,目前平台在全国医学生中月活用户已突破 200 万,覆盖率过半,这就是夸克健康大模型在医学领域专业性的证明。

这次夸克健康大模型证明了自己更高的能力上限,但这不是 AI 大模型的终点。医学大模型除了要在专业领域上不断精进,从应用层面去看,更应该让更多普通用户享受到 " 人均专业医师 " 的专业咨询。

    

欢迎扫码添加小雷微信

记得备注想进群的手机品牌哦

跟小雷一起畅聊数码与科技

另外小雷建了几个粉丝群,欢迎扫码加入!

大家伙一块聊聊天,分享玩机技巧~

End

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 医学 医生 医疗 数据驱动
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论