余承东亲管华为大模型团队:我的字典里没有第二、只有第一

出品｜搜狐科技

作者｜张雅婷

在 AI 大模型领域稍显低调的华为，今天主动 " 亮剑 "。

在华为开发者大会（HDC 2026）上，华为常务董事、产品投资评审委员会主任、终端 BG 董事长余承东正式发布开源盘古 openPangu 2.0 大模型，并放话未来将带领盘古大模型走向世界第一。

" 之前盘古大模型因为各种各样的原因没做好，不应该。" 余承东坦言，他去年国庆节前夕开始负责大模型，会带领大家一路赶超，从中国第一，走向世界第一。

在余承东之前，华为盘古大模型由王云鹤执掌。王云鹤博士毕业于北京大学智能科学系，2018 年正式加入华为，去年 3 月接任华为诺亚方舟实验室主任、华为盘古大模型负责人。

不过，在去年 7 月，华为盘古 Pro MoE 开源模型陷入 " 抄袭风波 "。有 GitHub 用户发现，盘古 Pro MoE 与阿里 Qwen-2.5 14B 模型的注意力参数分布相似性高达 0.927 ( 1.0 为完全一致 ) ，引发外界对华为大模型能力的质疑。

这场风波最后以主帅易位收场。当盘古迎来了一位敢说真话、也敢打硬仗的指挥官，又将如何在 DeepSeek、豆包等大模型的包围中走出一条属于自己的路？

余承东执掌大模型团队，目标是世界第一

在本次开发者大会上，余承东正式对外宣布接手盘古大模型团队，目标是世界第一。

他表示，此前在全世界都不知道大模型为何物的时候，华为就发布了盘古大模型，可以说是这个行业绝对的全球先驱者。但后来因为各种各样的原因，没做好，不应该。

" 去年国庆节前夕，公司又让我来负责这个大模型，我会带领团队一路赶超，我的字典里没有第二、只有第一。我们会从中国第一，走向将来的世界第一。从追赶到超越需要时间，但在过去我所带领的所有业务都实现了这一目标。"

他还提到，华为虽然比不了互联网公司上亿的超高薪水，但也是汇集了一批优秀 AI 人才。他们不是特别关注个人利益，而是更有理想、有追求、有梦想，敢于不断奉献和努力。

此外，在 AI 领域，算法、算力、数据三样缺一不可，需要强大的工程能力来支撑和保障，而华为有强大的工程能力。

不过，为什么华为没有像美国一些厂家那样，发布上万亿甚至几十万亿参数的更大规模模型呢？

余承东坦言，第一个原因是算力，美国一些企业拥有几十万卡甚至上百万卡的高性能算力资源 "。华为虽然有昇腾算力，但华为的算力大部分支持了国内企业的需要，留给自己的数量非常有限，算力不足以支撑几十万亿参数模型的训练。

第二个原因是内存价格大涨，AI 算力成本非常高。非常大的模型做推理，吞吐率和时延就会急速发展。所以华为开发几百 B 的模型，就更加高效。

据了解，在本次发布会上，华为正式发布开源盘古 openPangu 2.0 大模型。openPangu 2.0 采用稀疏 MoE 架构，搭载 512K 上下文窗口，分为 Pro 和 Flash 两个版本。

其中，旗舰级的 openPangu 2.0 Pro 总参数量达到 505B，激活参数量为 18B；而面向轻量化部署的 openPangu 2.0 Flash 总参数量为 92B，激活参数仅为 6B。

在硬件生态协同方面，openPangu 2.0 原生针对昇腾芯片进行了深度调优，单卡推理吞吐率可达业界主流开源模型的 2 倍。

在鸿蒙体系中，openPangu 2.0 对 Agent 任务进行了专项优化，执行速度与精准度更优，资源消耗更低。开源方面，华为计划从 6 月 30 日起分批开放 7 大核心组件。

盘古大模型此前为何 " 掉队 "？

在余承东执掌之前，盘古大模型由王云鹤负责。

王云鹤在 2018 年博士毕业后正式入职华为，2021 年底升任算法应用部部长，后于 2025 年 3 月接棒姚骏，成为诺亚方舟实验室主任，全面负责盘古大模型的研发。

不过在王云鹤主导的这一年来，盘古大模型的成果相较于国内其他公司而言并没有特别惊艳。并且在去年的套壳事件中，外界对王云鹤以及盘古大模型的质疑更是达到了顶峰。

去年 6 月 30 日，华为宣布开源其盘古大模型核心组件 ( Pangu Pro MoE ) ，包括 70 亿参数稠密模型和 720 亿参数的混合专家模型，表示这是构建昇腾生态的关键举措。

然而在 7 月 6 日凌晨，一位自称是盘古大模型团队的员工在 GitHub 上发布长文《盘古之殇：华为诺亚盘古大模型研发历程的心酸与黑暗》，表示盘古大模型在开发过程中确实存在套壳、续训、洗水印的现象。

该员工表示，王云鹤领导的小模型实验室多次通过套壳其他公司开源模型，包括 Qwen、DeepSeek 等，来冒充盘古自研成果。" 外行领导内行，使得领导完全对于这种扯淡的事情没有概念，他们只会觉得肯定是有什么算法创新。"

比如，将 Qwen 1.5 110B 续训、加层后包装成盘古 135B V2，连代码类名都未改。盘古 Pro MoE 72B 是套壳 Qwen 2.5 的 14B 续训，为了洗掉千问的水印，团队还故意训练了脏数据。

在盘古抄袭风波之后，华为云进行大规模组织架构调整。去年 8 月，华为云 CEO 张平安发文宣布组织架构调整，重点围绕产品部、公有云服务部及研发部等核心团队，涉及数十个下层部门与组织。有媒体称，云 EI（企业智能）产品线下的盘古大模型相关部门被明确撤销。

身处风暴眼中，王云鹤同样难以在华为继续 " 立足 "。今年 3 月，王云鹤在朋友圈发文官宣离职，后投身于 Agent 创业。

而随着王云鹤的离开、华为老将余承东的接手，盘古大模型也顺势迎来了一段新的征程。

运营编辑 | 曹倩 审核｜孟莎莎

宙世代