出品|搜狐科技
作者|张雅婷
在 AI 大模型领域稍显低调的华为,今天主动 " 亮剑 "。
在华为开发者大会(HDC 2026)上,华为常务董事、产品投资评审委员会主任、终端 BG 董事长余承东正式发布开源盘古 openPangu 2.0 大模型,并放话未来将带领盘古大模型走向世界第一。
" 之前盘古大模型因为各种各样的原因没做好,不应该。" 余承东坦言,他去年国庆节前夕开始负责大模型,会带领大家一路赶超,从中国第一,走向世界第一。
在余承东之前,华为盘古大模型由王云鹤执掌。王云鹤博士毕业于北京大学智能科学系,2018 年正式加入华为,去年 3 月接任华为诺亚方舟实验室主任、华为盘古大模型负责人。
不过,在去年 7 月,华为盘古 Pro MoE 开源模型陷入 " 抄袭风波 "。有 GitHub 用户发现,盘古 Pro MoE 与阿里 Qwen-2.5 14B 模型的注意力参数分布相似性高达 0.927 ( 1.0 为完全一致 ) ,引发外界对华为大模型能力的质疑。
这场风波最后以主帅易位收场。当盘古迎来了一位敢说真话、也敢打硬仗的指挥官,又将如何在 DeepSeek、豆包等大模型的包围中走出一条属于自己的路?
余承东执掌大模型团队,目标是世界第一
在本次开发者大会上,余承东正式对外宣布接手盘古大模型团队,目标是世界第一。
他表示,此前在全世界都不知道大模型为何物的时候,华为就发布了盘古大模型,可以说是这个行业绝对的全球先驱者。但后来因为各种各样的原因,没做好,不应该。
" 去年国庆节前夕,公司又让我来负责这个大模型,我会带领团队一路赶超,我的字典里没有第二、只有第一。我们会从中国第一,走向将来的世界第一。从追赶到超越需要时间,但在过去我所带领的所有业务都实现了这一目标。"
他还提到,华为虽然比不了互联网公司上亿的超高薪水,但也是汇集了一批优秀 AI 人才。他们不是特别关注个人利益,而是更有理想、有追求、有梦想,敢于不断奉献和努力。
此外,在 AI 领域,算法、算力、数据三样缺一不可,需要强大的工程能力来支撑和保障,而华为有强大的工程能力。
不过,为什么华为没有像美国一些厂家那样,发布上万亿甚至几十万亿参数的更大规模模型呢?
余承东坦言,第一个原因是算力,美国一些企业拥有几十万卡甚至上百万卡的高性能算力资源 "。华为虽然有昇腾算力,但华为的算力大部分支持了国内企业的需要,留给自己的数量非常有限,算力不足以支撑几十万亿参数模型的训练。
第二个原因是内存价格大涨,AI 算力成本非常高。非常大的模型做推理,吞吐率和时延就会急速发展。所以华为开发几百 B 的模型,就更加高效。
据了解,在本次发布会上,华为正式发布开源盘古 openPangu 2.0 大模型。openPangu 2.0 采用稀疏 MoE 架构,搭载 512K 上下文窗口,分为 Pro 和 Flash 两个版本。
其中,旗舰级的 openPangu 2.0 Pro 总参数量达到 505B,激活参数量为 18B;而面向轻量化部署的 openPangu 2.0 Flash 总参数量为 92B,激活参数仅为 6B。
在硬件生态协同方面,openPangu 2.0 原生针对昇腾芯片进行了深度调优,单卡推理吞吐率可达业界主流开源模型的 2 倍。
在鸿蒙体系中,openPangu 2.0 对 Agent 任务进行了专项优化,执行速度与精准度更优,资源消耗更低。开源方面,华为计划从 6 月 30 日起分批开放 7 大核心组件。
盘古大模型此前为何 " 掉队 "?
在余承东执掌之前,盘古大模型由王云鹤负责。
王云鹤在 2018 年博士毕业后正式入职华为,2021 年底升任算法应用部部长,后于 2025 年 3 月接棒姚骏,成为诺亚方舟实验室主任,全面负责盘古大模型的研发。
不过在王云鹤主导的这一年来,盘古大模型的成果相较于国内其他公司而言并没有特别惊艳。并且在去年的套壳事件中,外界对王云鹤以及盘古大模型的质疑更是达到了顶峰。
去年 6 月 30 日,华为宣布开源其盘古大模型核心组件 ( Pangu Pro MoE ) ,包括 70 亿参数稠密模型和 720 亿参数的混合专家模型,表示这是构建昇腾生态的关键举措。
然而仅隔四天,有 GitHub 用户发布报告指出:通过 "LLM 指纹 " 技术分析,盘古 Pro MoE 与阿里通义千问 Qwen-2.5 14B 模型的注意力参数分布相似性高达 0.927 ( 1.0 表示完全一致 ) ,远超业内 0.7 以下的正常差异范围,且在开源代码中发现了阿里的版权声明。
面对质疑,当时盘古团队回应表示," 盘古开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。"
然而在 7 月 6 日凌晨,一位自称是盘古大模型团队的员工在 GitHub 上发布长文《盘古之殇:华为诺亚盘古大模型研发历程的心酸与黑暗》,表示盘古大模型在开发过程中确实存在套壳、续训、洗水印的现象。
该员工表示,王云鹤领导的小模型实验室多次通过套壳其他公司开源模型,包括 Qwen、DeepSeek 等,来冒充盘古自研成果。" 外行领导内行,使得领导完全对于这种扯淡的事情没有概念,他们只会觉得肯定是有什么算法创新。"
比如,将 Qwen 1.5 110B 续训、加层后包装成盘古 135B V2,连代码类名都未改。盘古 Pro MoE 72B 是套壳 Qwen 2.5 的 14B 续训,为了洗掉千问的水印,团队还故意训练了脏数据。
在盘古抄袭风波之后,华为云进行大规模组织架构调整。去年 8 月,华为云 CEO 张平安发文宣布组织架构调整,重点围绕产品部、公有云服务部及研发部等核心团队,涉及数十个下层部门与组织。有媒体称,云 EI(企业智能)产品线下的盘古大模型相关部门被明确撤销。
身处风暴眼中,王云鹤同样难以在华为继续 " 立足 "。今年 3 月,王云鹤在朋友圈发文官宣离职,后投身于 Agent 创业。
而随着王云鹤的离开、华为老将余承东的接手,盘古大模型也顺势迎来了一段新的征程。
运营编辑 | 曹倩 审核|孟莎莎


登录后才可以发布评论哦
打开小程序可以发布评论哦