新京报贝壳财经讯(记者陈维城)6 月 30 日,美团正式发布新一代基础大模型 LongCat-2.0。依靠国产算力完成训练、推理全流程的万亿参数大模型。
据悉,LongCat-2.0 采用 MoE 架构,总参数规模 1.6 万亿,每个 Token 激活参数约 480 亿,原生支持 1M 超长上下文,可一次处理百万字级输入。模型深度适配 Claude Code、OpenClaw、Hermes 等主流 Harness。
今年 4 月底,美团曾发布 LongCat-2.0-Preview 版本,并以匿名的方式,接入全球最大的大模型 API 路由平台 OpenRouter。OpenRouter 数据显示,截至 6 月底,LongCat-2.0-Preview 的总调用量已跻身全球前三。
2023 年起,美团就与国产算力厂商共同推进 " 模芯协同 " 研发,从早期的小规模验证到超大规模稳定训练,逐步攻克了万卡级容错恢复、NPU 确定性计算、算力利用率提升等核心难题,验证了大规模国产训练的可行性。
LongCat-2.0 的训练、推理成本消耗,低于全球其他万亿参数级别的大模型。LongCat 官方宣布,将于近期在多平台同步开源 Infra 框架、推理引擎、模型参数等核心技术。
编辑 杨娟娟
校对 王心


登录后才可以发布评论哦
打开小程序可以发布评论哦