又一国产万亿参数模型开源！养“龙虾”实力超GPT-5.4

会修 bug、会做财务分析、还会开发 3D 游戏。

作者 | 王涵

编辑 | 心缘

智东西 5 月 15 日报道，今天，蚂蚁百灵开源旗舰级思考模型 Ring-2.6-1T，该模型于 5 月 9 日发布，引入了可调节的 Reasoning Effort 机制，支持 high 与 xhigh 两种推理强度，开发者可以根据任务特性动态分配推理资源。

其中，high 模式面向高频 Agent 工作流获得更高效率，适合多轮对话、工具协作与任务拆解；xhigh 模式则面向数学竞赛、科研分析等高难任务。

基准测试方面，high 模式下，其在评估 OpenClaw 框架适配能力的 PinchBench 得分 87.60，高于 GPT-5.4 xHigh 和 Gemini-3.1-Pro high；在考察长程任务自主推进能力的 Tau2-Bench Telecom 测试中达到 95.32 分的成绩，Agent 场景执行能力较强。

xhigh 模式下，Ring-2.6-1T 在数学推理能力测试 AIME 26 中得分 95.83，与 DeepSeek V4 Pro Max 持平；在研究生级别科学推理能力测试 GPQA Diamond 中，该模型得到 88.27 分，表现略逊于 Kimi-K2.6 Thinking 等同类模型。

在训练层面，Ring-2.6-1T 采用异步（Async）强化学习训练架构，将策略采样与参数更新解耦为独立流水线，解决了传统同步训练中 GPU 资源等待、训练吞吐不足的问题，并支持更长周期的持续训练。在此基础上，百灵将此前在 Ring-1T 中验证过的 " 棒冰算法 " 引入异步 RL 训练，解决训练不稳定问题。

目前，该模型权重文件已同步上线 Hugging Face、ModelScope 平台，并已开放体验通道。

开源地址：

Hugging Face：

https://huggingface.co/inclusionAI/Ring-2.6-1T

ModelScope：

https://modelscope.cn/models/inclusionAI/Ring-2.6-1T

体验地址：

Ling Studio：https://ling.tbox.cn/chat

01.

能开发 Web 工具、做财务分析

还能开发 3D 游戏

在 OpenRouter 限时一周免费的 API 体验期间，已有不少开发者分享了对 Ring-2.6-1T 的真实调用反馈。

开发者关注到该模型在真实任务中的规划与执行能力：从会议纪要整理、内容计划生成，到 React 管理后台重构、复杂状态处理、代码生成和 Three.js 交互页面开发，Ring-2.6-1T 能够主动拆解任务、规划步骤，并根据上下文持续推进。

在 5 月 9 日模型发布之时，智东西第一时间对其进行了体验：蚂蚁万亿参数思考模型来了！实测 AIME 真题难不倒，会写爽文、规划出行

今天，百灵团队放出了 7 个落地实操案例：

在 Pi Coding Agent 中，Ring-2.6-1T 可以搜索互联网上的 Web 设计风格，并生成大量符合不同风格的交互式介绍。

在 OpenCode 中，用户可以使用 Ring-2.6-1T，在真实项目仓库中定位并修复一系列样式适配相关的 bug，并产出相关文档。

此外，在 Pi Coding Agent，用户还可以让 Ring-2.6-1T 检索典型的 3D 框架和游戏场景，并生成这些场景和游戏。

在 Agentic 方面，Ring-2.6-1T 可以生成用于提升其他任务效能的 Web 工具，并使用 Agent Skill 优化这类工具的表现。

在 Kilo Code 中，用户还可以用 Ring-2.6-1T 编写脚本，综合运营 macOS 的 OCR 能力、脚本执行和模型推理能力，全自动分析家庭财务账单，从发票图片到可交互分析演示。

在深度研究场景中，Ring-2.6-1T 可以通过 Agent Skill 编写深度研究 Agentic Workflow。模型可以严格遵循通过 Skill 文档定义的 Workflow，研究上百个来源，综述成为一份风险调研和投资相关的建议书。

此外，Ring-2.6-1T 还能自行开发个性化学习助手，检索和规划学习内容、知识图结构，并根据用户反馈自行调整介绍难度和方式。

02.

异步训练 + 棒冰算法

提高 GPU 利用率

传统同步 RL 训练中，策略生成（rollout）与梯度更新紧耦合，容易导致以下问题：

1、GPU 等待：GPU 资源利用率低，大量算力浪费在等待同步上；

2、训练吞吐不足：训练周期被拉长，迭代速度受限；

3、长周期训练不稳定：长周期训练中容易出现策略崩溃或奖励信号退化。

Ring-2.6-1T 采用异步（Async）强化学习训练架构，将策略采样与参数更新解耦为独立流水线。由此，采样与更新并行执行，GPU 利用率与训练效率均有所提升。并且，该训练架构适配大规模、长时间的持续训练，可以避免同步瓶颈导致的训练中断。

在此基础上，百灵团队还将推理大模型 Ring-1T 中的棒冰算法应用到异步 RL 训练中，解决训练不稳定问题。

03.

结语：用更少 token 完成任务

百灵追求真实生产环境使用

近一个月内，百灵迭代发布并开源了多款模型，覆盖 Ling 语言模型和 Ring 推理模型。

此前，Ling-2.6-flash 的匿名测试版本 "Elephant Alpha" 上线 OpenRouter 后，连续多日位列 Trending 榜首，日均 tokens 调用量达到 100B 级别。

虽然模型尺寸不同、能力侧重也不同，其系列模型都在强调用更少的 token 完成高质量的任务输出。相较于追求更大的参数规模或更高的单点分数，百灵更强调 " 真实生产环境使用 "。

宙世代

一起剪

相关标签