平安医疗大模型获全球医疗AI最高评分超越Meta、OpenAI金融、医疗专业大模型均达世界一流水平

近日，中国平安旗下平安科技携手平安好医生、北大医疗联合研发的平安 " 医疗大模型 3.5"，在全球医疗 AI 权威评测集 HealthBench Hard（OpenAI 发布）中斩获全球最高分（57.27 分），超越百川（44.4 分）、Meta（42.8 分）、OpenAI（42 分）等多家头部科技企业位列排名榜首，刷新该基准的评分纪录。此前，中国平安金融大模型在行业权威大模型评测体系 CNFinBench 大语言模型公开榜单上同样位列综合第一。相关评测方表示，目前中国平安在 " 金融 "、" 医疗 " 两大专业领域的大模型技术能力均达到世界一流水平。

据了解，平安医疗大模型参与评测的 HealthBench 基准由 OpenAI 发布，由 60 个国家、26 个医学专业的 262 名医生共同构建，包含 5000 组高仿真多轮医疗对话，并设置 48,562 项由医生制定的评分标准系。其中，HealthBench Hard 被视为高难度子集，是 OpenAI 从 5000 组对话中筛选出 1000 组更具挑战性的案例，用于测试模型在复杂、不确定、高风险临床场景中的推理能力上限，也是 OpenAI 评估先进模型及医疗健康产品的重要参考。

复刻真实医生临床推理逻辑，AI 医疗大模型从 " 咨询 " 走向 " 诊疗 "

平安科技介绍，区别于通用大模型侧重标准化问答的训练逻辑，平安结合北大医疗集团、平安好医生等医疗自营旗舰业务的真实场景，依托长期积累的 " 筛、管、治、康 " 全病程服务闭环数据，持续推动医疗 AI 从传统的信息获取、健康咨询，进一步走向复杂病种辅助决策、多学科协同诊疗等更接近临床核心的应用场景，打造主动服务式 AI 大模型。

结合真实场景数据，AI 大模型复刻真实医生临床推理逻辑。针对临床普遍存在患者症状描述模糊、病情动态变化、关键信息缺失等难题，平安科技研发团队设计了由患者数字分身、自适应评估智能体、临床知识图谱组成的动态诊断模拟环境，将医生在不确定条件下的判断过程建模为 multi-turn RL 推理任务，为算法优化突破提供支撑。

锤炼顶尖算法能力，提高 AI 大模型可用性、准确度。针对医疗推理高复杂、低容错的特点，研发团队采用三阶段递进训练：静态框架内化构建具临床逻辑的知识体系、动态思维链探索实现复杂场景下的长链与跨学科推理，最终实现高阶推理能力跃迁。同时自研全链路幻觉控制引擎，融合上下文及语境学习、不确定量化等算法，实现从提示词、训练到推理阶段的全流程风险控制，不断降低幻觉率。

AI 赋能 " 四到 " 医疗体系 ( 到线、到院、到家、到企 ) 。推出平安灵眸、健康管家、AI-MDT、AI 康复等 AI 医疗产品，平安逐步构建了覆盖 " 筛查 - 管理 - 治疗 - 康复 " 的完整医疗链路，通过规模化、数据飞轮、真实世界对齐三项核心要素，实现医疗 AI 智能跃迁。在早筛环节 ," 平安灵眸 " 已构建 90 余种疾病筛查模型。目前 , 该产品已下沉至全国 1500 家基层医疗机构，累计完成 150 万次早筛，每年帮助 30 万客户实现风险早发现 ,。在管理环节 ," 健康管家 " 通过多智能体协同 , 打造了 " 社群运营 " 式健康管理体系，已构建起服务 200 万患者的国内最大慢病管理社区。通过 AI 主动干预，慢病患者的依从性提升了 5 倍，实现了从一次性咨询到长期健康效果管理的质变。

落地 MDT 多场景，AI 诊疗方案采纳率已达 85%

行业临床数据表明，接受规范 MDT（Multidisciplinary Team，多学科诊疗团队）会诊的肿瘤患者，五年生存率可提升 15%。但受限于顶级专家稀缺、医院流程限制、地域资源不均等问题，国内高质量 MDT 服务覆盖率长期偏低。响应市场和客户需求，中国平安依托医疗大模型，推出北大医疗 AI-MDT Pro 智能会诊系统，面向医生团队提供复杂病史自动整理、多学科诊疗方案生成、康复及随访方案辅助等能力，把稀缺的多学科诊疗能力通过 AI 产品化下沉，解决用户的就医难题。

平安科技介绍，北大医疗 AI-MDT Pro 智能会诊系统已落地北大医疗、平安好医生等机构真实场景，可充分考虑患者信息，给出化疗、靶向治疗、放疗、内分泌治疗的全流程建议，并明确用药剂量、周期、顺序。内部数据显示，平安的 AI 诊疗方案采纳率达到 85%；在乳腺癌等重症领域，AI 诊疗方案和主任专家一致性达到 92.5% 以上。平安首席技术官王晓航表示，平安的目标是将顶级的多学科诊疗能力，从中心城市大医院的稀缺资源，转化为触手可及的规模化普惠供给。

值得一提的是，2026 年 3 月，中国平安金融大模型 PingAnGPT-Qwen3-32B 在 CNFinBench 大语言模型公开榜单上综合排名第一，超越 DeepSeek-R1（671B）、Qwen3-235B-A22B、Kimi-K2（1000B）等开源大模型，以及 GPT-4o、Claude-Sonnet 4、Doubao-1.5-pro 等领先的闭源商业模型，在金融事实推理与计算、金融专业知识问答、金融合规与风险控制等多项关键指标表现卓越。2026 年 4 月，中国平安升级 AI" 快捷服务 "，为 2.52 亿客户打造 " 一句话能办事 " 的专属金融 AI 助手，能交易、能融资、能理赔、能救急，满足 " 一个入口、一站式解决 " 客户需求。该 AI 助手将 300 余项数字化服务全面封装，构建了主动服务能力，能够理解客户的个性化需求，让服务从 " 被动响应 " 走向 " 主动打理 "。

打造领先科技能力，专业服务守护心中的平安。中国平安表示，公司将坚持深化 " 综合金融 + 医疗养老 " 双轮并行以及科技驱动战略，秉承 "AI in ALL" 原则，深度扎根金融、医疗、养老等核心主业，持续推进模型优化迭代，进一步打造领先 AI 能力，深化场景化应用落地，重构业务效率、变革服务体验，不断满足人民群众对美好生活的向往。

相关标签