文汇 4小时前
从“百模大战”到“十个手指头能数过来”,我们为什么还要“死磕”基础大模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

2023 年,中国人工智能(AI)行业上演了一场 " 百模大战 ",截至当年年底,全国拥有 10 亿参数以上的大模型有近 80 个、100 亿参数级的大模型逾 10 个,场面一度繁荣至极。两年多过去,当初的喧嚣已逐渐平息。据业内人士透露,还在持续研究基础大模型的企业已不足 10 家,其中包括商汤科技、稀宇科技、阶跃星辰等几家上海企业。

2025 年,各种 AI 应用层出不穷,写文案、情感陪伴、重塑供应链……当甜美的果实已唾手可得,为什么上海 AI 企业还在 " 死磕 " 基础大模型?

Gemini 3 成为爆款源于一次逆风坚守

2025 年,AI 领域的高潮一波接一波。11 月,谷歌发布新一代人工智能模型 Gemini 3,在最能体现大模型整体实力的 LMArena 排行榜上,它以 1501 分稳居第一;在 " 地狱难度 " 的数学能力测试中,它以 23.4% 的得分率远超竞争对手,而 OpenAI 的 GPT-5.1 等模型得分率仅在 1% 左右。

这被视作谷歌在 AI 领域的一场 " 绝地反击 ",也彻底扭转了其在大模型竞赛中落后的风评。在 2022 年底 ChatGPT 引爆生成式 AI 浪潮后,被业内公认为 AI" 优等生 " 的谷歌一度陷入被动,产品迭代节奏滞后、市场信心动摇,有人不客气地评价它 " 起了个大早,赶了个晚集 "。

上海模速空间内 AI 应用层出不穷。受访者提供

逆风局中,谷歌没有跟风 OpenAI 的 " 模仿学习到强化学习 " 路线,而是继续坚持自己的 " 理解生成一体化 " 路线,这与谷歌将大模型定义为提升效率的超级工具,而非情感伴侣有关。在生成式 AI 的长跑中,谷歌试图以耐力超越对手。凭借着出色的理解和推理,Gemini 3 在应用市场上表现强劲,截至去年 11 月,其全球月活跃用户同比增长 170%。

坚持是大模型研究的 " 稀有品质 "。国内 " 百模大战 " 期间,复旦大学计算机科学技术学院教授邱锡鹏就注意到大模型同质化问题严重。在他看来,这些大模型虽然名字、作用不同,但背后都是 " 一张脸 ",更令他焦虑的是,该领域的基础研究却在萎缩。以自然语言处理为例,2015 年前,这个领域有对话、问答、机器翻译等各种方向,那时的学者互相分享自己的研究,并从别人那里获得灵感,而当大家都涌向语言模型这条赛道时,更多的可能性被扼杀了。

基础大模型决定应用能力上限

" 我们会一如既往坚持基础大模型研究。" 阶跃星辰副总裁李璟说。这家成立不到 3 年的沪上 AI 企业已累计发布 22 款基座模型,其中包括拥有强大视觉感知和复杂推理能力的新一代基础大模型 Step 3。

阶跃星辰选择 " 死磕 " 基础大模型的逻辑相当简单:基础大模型的能力决定了应用的上限,目前大模型技术尚未收敛,如果过早将资源押注应用开发,一旦底层技术发生根本性变革,之前的研发将很快被新技术所取代。

在成立第十个年头、生成式 AI 成为产业主线的背景下,商汤于 2024 年底启动业务与组织架构分拆,推出 "1+X" 战略:将偏向应用层的智能驾驶 " 绝影 "、家庭机器人 " 元萝卜 "、智慧医疗 " 善萃 "、智慧零售 " 善惠 " 等业务整合为 "X 创新业务 ",自身则进一步聚焦生成式 AI 与视觉 AI 双引擎这 "1" 核心。

商汤元萝卜下棋机器人。受访者提供

这一调整并非技术路线的试探,而是商汤在完成 AI 代际转换之后,对核心能力与资源配置的再聚焦。生成式 AI 对商汤而言,已不再只是技术层面的突破,而是成为驱动公司未来增长的核心业务。

2025 年,AI 世界热点转换,世界模型成为焦点。美国斯坦福大学教授李飞飞领导的 World Labs(世界实验室)推出 3D 世界生成模型 Marble,并直言 AI 的下一个 10 年属于空间智能。同年,商汤也推出 " 开悟 " 世界模型 3.0,在业内人士看来,该模型在对真实世界的建模能力上表现出色,其生成的视频具备很强的时间与空间一致性,有能力与 Marble 展开直接竞争。更令人惊讶的是,商汤早在 2024 年就已推出这一模型。 

" 不同的声音 " 正在复苏

产品覆盖 200 多个国家和地区、个人用户超 2 亿、月活用户超 2700 万——在个人用户端风生水起的 Minimax(稀宇科技)也没有放弃基础大模型的研发。

去年 10 月,稀宇科技掀起一场 AI 技术的 " 全家桶 " 发布,文本大模型 M2、视频模型海螺 2.3、语音模型 Speech 2.6 和音乐模型 Music 2.0,标志着中国 AI 企业在全模态技术领域的全面突破。

Minimax 在港交所上市。受访者提供

其中,仅有 10B 激活参数的 M2 大模型在全球权威测评榜单 Artificial Analysis(AA)上取得历史性突破——总分冲入全球前五、开源第一,跻身全球文本模型第一梯队。更令人称奇的是,M2 的综合成本只有名列全球大模型 "S 级 " 梯队中的 Claude 4.5 的 8%,推理速度却是后者的近两倍。这种 " 高智能,更实惠 " 的理念正在从根本上改写 AI 领域的 " 算力游戏 " 规则。

有意思的是,AI 赛道上 " 不同的声音 " 正在复苏。复旦大学计算与智能创新学院教授张军平就提醒,现在 AI 的研究路径可能走反了,人类智能的进化应先从 " 感知 " 开始,再发展 " 认知 ",也有人仍坚信能从以 IBM 沃森机器人为代表的 "AI 符号主义 " 技术路线中寻得新突破。

创新成果越是唾手可得,爆款越有可能出自冷门,这正是颠覆式创新的神奇之处。历史经验告诉人们,需要有组织的科研去捕捉 " 异常 ",甚至颠覆已有体系。所以,为什么上海 AI 企业仍要 " 死磕 " 大模型?因为技术尚未收敛,一切皆有可能。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 谷歌 人工智能 商汤科技 上海
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论