此前,一款新模型以 "Owl Alpha" 的匿名代号接入全球大模型 API 路由平台 OpenRouter,上线后总调用量迅速跻身全球前三,其中在 Hermes、Claude Code、OpenClaw 三大 Agent 场景下的月调用量分别位列全球第一、第二和第三位,使用量上几乎是 DeepSeek V4 Flash 的两倍。
而这款新模型正是 " 美团 " 的。
6 月 30 日,美团正式发布新一代基础大模型 LongCat-2.0,这款总参数规模达 1.6 万亿的混合专家架构模型,在峰值规模超过 5 万张的国产算力卡集群上,完成从预训练到推理的全流程落地,是在国产算力上完成的最大训练任务之一。

国产大模型厂商正在把 "OpenRouter 匿名登榜、圈内猜谜、官宣认领 " 玩成一套标准发布 SOP。
从技术规格来看,LongCat-2.0 采用 MoE 混合专家架构,总参数达到 1.6 万亿,但每个 Token 实际激活的参数约为 480 亿,动态范围覆盖 330 亿至 560 亿,兼顾了模型能力与推理效率。其独创的零计算专家机制能够识别助词、标点等简单文本并跳过无效运算,仅针对复杂内容调动算力资源,相比传统稠密大模型大幅提升了算力利用率。
预训练阶段,模型使用了超过 30 万亿 Token 的多语种数据,覆盖通用文本、代码、技术文档等多个领域,原生支持 100 万 Token 的超长上下文窗口,可一次性处理百万字级别的输入内容,解决了长文本处理中常见的信息遗忘问题。在代码能力方面,LongCat-2.0 在 SWE-bench Pro 评测中取得 59.5 分的成绩,在部分编码与 Agent 工具调用任务中表现突出。
而最受行业关注的,是 LongCat-2.0 全程依托国产算力完成全流程训练的突破。整个训练过程峰值调用了超过 5 万张国产算力卡,未使用海外高端 GPU,从零完成了万亿级模型的预训练、微调与推理部署全链路。此前行业普遍认为,国产芯片在单卡性能、软件生态和大规模集群调度稳定性上存在瓶颈,难以支撑万亿参数模型的完整训练。
美团团队与国产算力厂商联合攻克了硬件故障容错、通信延迟优化、性能损耗控制等多项技术难题,最终将整体性能损耗控制在较低水平,验证了国产算力支撑超大规模 AI 训练的可行性。按照规划,美团还将在多平台同步开源 LongCat-2.0 的 Infra 框架、推理引擎、模型参数等核心技术,向全球开发者社区回馈技术成果。
对于本地生活行业而言,这款万亿模型的落地意味着服务效率的新一轮升级。
不同于主打通用对话的大模型,LongCat-2.0 从设计之初就深度绑定本地生活场景,依托美团积累的海量真实交易与履约数据进行专项优化。
在 C 端,美团旗下的 AI 助手 " 小团 "" 小美 " 已接入外卖、到店、酒店旅游等核心业务,升级后将具备更强的复杂指令理解能力,用户仅通过自然语言描述需求,即可完成餐厅预订、酒店下单、门票购买等多环节的服务闭环。今年五一假期期间,相关 AI 服务已累计服务过亿人次用户。
在 B 端,模型能够帮助商户自动分析经营数据、生成营销方案、优化菜单结构,甚至结合多模态能力生成宣传内容;在履约侧,大模型作为底层推理引擎,可优化骑手路径规划、订单智能分配与极端天气下的运力调度,进一步提升配送效率与用户体验。对美团自身而言,自研大模型也能大幅降低大规模调用外部 API 的成本,在日均数千万单的业务体量下,算力成本的优化空间十分可观。
放在更广阔的 AI 产业视角下,LongCat-2.0 的发布有着超出企业自身的产业价值。
一位大模型行业人士在接受采访时表示:" 在国产芯片上训练出大 MoE 还是很厉害的。" 他指出,国产芯片集群训练曾长期面临稳定性不足、软件生态不完善等瓶颈,美团的突破证明了国产算力路线的可行性。行业分析师郭涛认为,此前国内企业未能实现万亿级模型全栈国产化,既有技术路径依赖的因素,也受限于大规模算力集群的工程难度与早期对国产算力稳定性的顾虑,而 LongCat-2.0 的落地将打消部分市场疑虑,激励更多团队加大国产算力适配投入,推动行业技术路径多元化与自主可控体系的构建。
社区反馈显示,LongCat-2.0 测试版本接近 Claude Opus 4.6,落后于 Claude Opus 4.8。
从更深层的意义来看,LongCat-2.0 的诞生不是单一企业的技术突破,而是整条国产 AI 产业链协同验证的结果。
来源:星河商业观察


登录后才可以发布评论哦
打开小程序可以发布评论哦