快科技 11 月 4 日消息,昨日,美团 LongCat(龙猫)团队正式推出全新开源大模型 LongCat-Flash-Omni。
该大模型总参数规模高达 5600 亿,实现全模态能力突破,登顶开源领域最先进水平(SOTA)。

今年 9 月 1 日,美团正式发布 LongCat-Flash 系列模型,并开源了 LongCat-Flash-Chat 和 LongCat-Flash-Thinking 两大版本。
此次 LongCat-Flash-Omni 是系列全新家族成员。它也是业界首个实现 " 全模态覆盖、端到端架构、大参数量高效推理 " 于一体的开源大语言模型,首次在开源范畴内实现了全模态能力对闭源模型的对标。

该模型的核心突破在于破解了 " 大参数与高效率 " 的行业矛盾。
该模型总参数达 5600 亿(激活参数 270 亿),却依托 LongCat-Flash 系列创新的 ScMoE 架构(含零计算专家)作为 LLM 骨干,结合高效多模态编解码器和 " 分块式音视频特征交织机制 ",最终实现低延迟、高质量的音视频处理与流式语音生成。
模型支持 128K tokens 上下文窗口及超 8 分钟音视频交互,在多模态长时记忆、多轮对话、时序推理等能力上具备显著优势。

实测显示,其图像理解性能与闭源全模态模型 Gemini-2.5-Pro 相当,且优于开源模型 Qwen3-Omni。短视频理解性能超越同类模型,长视频处理能力比肩 Gemini-2.5-Pro。
落地体验上,LongCat 官方 App 现已正式发布,支持联网搜索,还可以发起语音通话(视频通话功能敬请期待)。



登录后才可以发布评论哦
打开小程序可以发布评论哦