近日,中国平安旗下平安科技携手平安好医生、北大医疗联合研发的平安 " 医疗大模型 3.5",在全球医疗 AI 权威评测集 HealthBench Hard(OpenAI 发布)中斩获全球最高分(57.27 分),超越百川(44.4 分)、Meta(42.8 分)、OpenAI(42 分)等多家头部科技企业位列排名榜首,刷新该基准的评分纪录。此前,中国平安金融大模型在行业权威大模型评测体系 CNFinBench 大语言模型公开榜单上同样位列综合第一。相关评测方表示,目前中国平安在 " 金融 "、" 医疗 " 两大专业领域的大模型技术能力均达到世界一流水平。
据了解,平安医疗大模型参与评测的 HealthBench 基准由 OpenAI 发布,由 60 个国家、26 个医学专业的 262 名医生共同构建,包含 5000 组高仿真多轮医疗对话,并设置 48,562 项由医生制定的评分标准系。其中,HealthBench Hard 被视为高难度子集,是 OpenAI 从 5000 组对话中筛选出 1000 组更具挑战性的案例,用于测试模型在复杂、不确定、高风险临床场景中的推理能力上限,也是 OpenAI 评估先进模型及医疗健康产品的重要参考。
复刻真实医生临床推理逻辑,AI 医疗大模型从 " 咨询 " 走向 " 诊疗 "
平安科技介绍,区别于通用大模型侧重标准化问答的训练逻辑,平安结合北大医疗集团、平安好医生等医疗自营旗舰业务的真实场景,依托长期积累的 " 筛、管、治、康 " 全病程服务闭环数据,持续推动医疗 AI 从传统的信息获取、健康咨询,进一步走向复杂病种辅助决策、多学科协同诊疗等更接近临床核心的应用场景,打造主动服务式 AI 大模型。
结合真实场景数据,AI 大模型复刻真实医生临床推理逻辑。针对临床普遍存在患者症状描述模糊、病情动态变化、关键信息缺失等难题,平安科技研发团队设计了由患者数字分身、自适应评估智能体、临床知识图谱组成的动态诊断模拟环境,将医生在不确定条件下的判断过程建模为 multi-turn RL 推理任务,为算法优化突破提供支撑。
锤炼顶尖算法能力,提高 AI 大模型可用性、准确度。针对医疗推理高复杂、低容错的特点,研发团队采用三阶段递进训练:静态框架内化构建具临床逻辑的知识体系、动态思维链探索实现复杂场景下的长链与跨学科推理,最终实现高阶推理能力跃迁。同时自研全链路幻觉控制引擎,融合上下文及语境学习、不确定量化等算法,实现从提示词、训练到推理阶段的全流程风险控制,不断降低幻觉率。
AI 赋能 " 四到 " 医疗体系 ( 到线、到院、到家、到企 ) 。推出平安灵眸、健康管家、AI-MDT、AI 康复等 AI 医疗产品,平安逐步构建了覆盖 " 筛查 - 管理 - 治疗 - 康复 " 的完整医疗链路,通过规模化、数据飞轮、真实世界对齐三项核心要素,实现医疗 AI 智能跃迁。在早筛环节 ," 平安灵眸 " 已构建 90 余种疾病筛查模型。目前 , 该产品已下沉至全国 1500 家基层医疗机构,累计完成 150 万次早筛,每年帮助 30 万客户实现风险早发现 ,。在管理环节 ," 健康管家 " 通过多智能体协同 , 打造了 " 社群运营 " 式健康管理体系,已构建起服务 200 万患者的国内最大慢病管理社区。通过 AI 主动干预,慢病患者的依从性提升了 5 倍,实现了从一次性咨询到长期健康效果管理的质变。
落地 MDT 多场景,AI 诊疗方案采纳率已达 85%
行业临床数据表明,接受规范 MDT(Multidisciplinary Team,多学科诊疗团队)会诊的肿瘤患者,五年生存率可提升 15%。但受限于顶级专家稀缺、医院流程限制、地域资源不均等问题,国内高质量 MDT 服务覆盖率长期偏低。响应市场和客户需求,中国平安依托医疗大模型,推出北大医疗 AI-MDT Pro 智能会诊系统,面向医生团队提供复杂病史自动整理、多学科诊疗方案生成、康复及随访方案辅助等能力,把稀缺的多学科诊疗能力通过 AI 产品化下沉,解决用户的就医难题。
平安科技介绍,北大医疗 AI-MDT Pro 智能会诊系统已落地北大医疗、平安好医生等机构真实场景,可充分考虑患者信息,给出化疗、靶向治疗、放疗、内分泌治疗的全流程建议,并明确用药剂量、周期、顺序。内部数据显示,平安的 AI 诊疗方案采纳率达到 85%;在乳腺癌等重症领域,AI 诊疗方案和主任专家一致性达到 92.5% 以上。平安首席技术官王晓航表示,平安的目标是将顶级的多学科诊疗能力,从中心城市大医院的稀缺资源,转化为触手可及的规模化普惠供给。
值得一提的是,2026 年 3 月,中国平安金融大模型 PingAnGPT-Qwen3-32B 在 CNFinBench 大语言模型公开榜单上综合排名第一,超越 DeepSeek-R1(671B)、Qwen3-235B-A22B、Kimi-K2(1000B)等开源大模型,以及 GPT-4o、Claude-Sonnet 4、Doubao-1.5-pro 等领先的闭源商业模型,在金融事实推理与计算、金融专业知识问答、金融合规与风险控制等多项关键指标表现卓越。2026 年 4 月,中国平安升级 AI" 快捷服务 ",为 2.52 亿客户打造 " 一句话能办事 " 的专属金融 AI 助手,能交易、能融资、能理赔、能救急,满足 " 一个入口、一站式解决 " 客户需求。该 AI 助手将 300 余项数字化服务全面封装,构建了主动服务能力,能够理解客户的个性化需求,让服务从 " 被动响应 " 走向 " 主动打理 "。
打造领先科技能力,专业服务守护心中的平安。中国平安表示,公司将坚持深化 " 综合金融 + 医疗养老 " 双轮并行以及科技驱动战略,秉承 "AI in ALL" 原则,深度扎根金融、医疗、养老等核心主业,持续推进模型优化迭代,进一步打造领先 AI 能力,深化场景化应用落地,重构业务效率、变革服务体验,不断满足人民群众对美好生活的向往。


登录后才可以发布评论哦
打开小程序可以发布评论哦