新京报 3小时前
美团发布LongCat-2.0大模型,总参数规模1.6万亿
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

新京报贝壳财经讯(记者陈维城)6 月 30 日,美团正式发布新一代基础大模型 LongCat-2.0。依靠国产算力完成训练、推理全流程的万亿参数大模型。

据悉,LongCat-2.0 采用 MoE 架构,总参数规模 1.6 万亿,每个 Token 激活参数约 480 亿,原生支持 1M 超长上下文,可一次处理百万字级输入。模型深度适配 Claude Code、OpenClaw、Hermes 等主流 Harness。

今年 4 月底,美团曾发布 LongCat-2.0-Preview 版本,并以匿名的方式,接入全球最大的大模型 API 路由平台 OpenRouter。OpenRouter 数据显示,截至 6 月底,LongCat-2.0-Preview 的总调用量已跻身全球前三。

2023 年起,美团就与国产算力厂商共同推进 " 模芯协同 " 研发,从早期的小规模验证到超大规模稳定训练,逐步攻克了万卡级容错恢复、NPU 确定性计算、算力利用率提升等核心难题,验证了大规模国产训练的可行性。

LongCat-2.0 的训练、推理成本消耗,低于全球其他万亿参数级别的大模型。LongCat 官方宣布,将于近期在多平台同步开源 Infra 框架、推理引擎、模型参数等核心技术。

编辑 杨娟娟

校对 王心

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

美团 核心技术 hermes 开源 新京报
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论