
会修 bug、会做财务分析、还会开发 3D 游戏。
作者 | 王涵
编辑 | 心缘
智东西 5 月 15 日报道,今天,蚂蚁百灵开源旗舰级思考模型 Ring-2.6-1T,该模型于 5 月 9 日发布,引入了可调节的 Reasoning Effort 机制,支持 high 与 xhigh 两种推理强度,开发者可以根据任务特性动态分配推理资源。
其中,high 模式面向高频 Agent 工作流获得更高效率,适合多轮对话、工具协作与任务拆解;xhigh 模式则面向数学竞赛、科研分析等高难任务。

基准测试方面,high 模式下,其在评估 OpenClaw 框架适配能力的 PinchBench 得分 87.60,高于 GPT-5.4 xHigh 和 Gemini-3.1-Pro high;在考察长程任务自主推进能力的 Tau2-Bench Telecom 测试中达到 95.32 分的成绩,Agent 场景执行能力较强。
xhigh 模式下,Ring-2.6-1T 在数学推理能力测试 AIME 26 中得分 95.83,与 DeepSeek V4 Pro Max 持平;在研究生级别科学推理能力测试 GPQA Diamond 中,该模型得到 88.27 分,表现略逊于 Kimi-K2.6 Thinking 等同类模型。

在训练层面,Ring-2.6-1T 采用异步(Async)强化学习训练架构,将策略采样与参数更新解耦为独立流水线,解决了传统同步训练中 GPU 资源等待、训练吞吐不足的问题,并支持更长周期的持续训练。在此基础上,百灵将此前在 Ring-1T 中验证过的 " 棒冰算法 " 引入异步 RL 训练,解决训练不稳定问题。
目前,该模型权重文件已同步上线 Hugging Face、ModelScope 平台,并已开放体验通道。
开源地址:
Hugging Face:
https://huggingface.co/inclusionAI/Ring-2.6-1T
ModelScope:
https://modelscope.cn/models/inclusionAI/Ring-2.6-1T
体验地址:
Ling Studio:https://ling.tbox.cn/chat
01.
能开发 Web 工具、做财务分析
还能开发 3D 游戏
在 OpenRouter 限时一周免费的 API 体验期间,已有不少开发者分享了对 Ring-2.6-1T 的真实调用反馈。
开发者关注到该模型在真实任务中的规划与执行能力:从会议纪要整理、内容计划生成,到 React 管理后台重构、复杂状态处理、代码生成和 Three.js 交互页面开发,Ring-2.6-1T 能够主动拆解任务、规划步骤,并根据上下文持续推进。
在 5 月 9 日模型发布之时,智东西第一时间对其进行了体验:蚂蚁万亿参数思考模型来了!实测 AIME 真题难不倒,会写爽文、规划出行
今天,百灵团队放出了 7 个落地实操案例:
在 Pi Coding Agent 中,Ring-2.6-1T 可以搜索互联网上的 Web 设计风格,并生成大量符合不同风格的交互式介绍。
在 OpenCode 中,用户可以使用 Ring-2.6-1T,在真实项目仓库中定位并修复一系列样式适配相关的 bug,并产出相关文档。
此外,在 Pi Coding Agent,用户还可以让 Ring-2.6-1T 检索典型的 3D 框架和游戏场景,并生成这些场景和游戏。
在 Agentic 方面,Ring-2.6-1T 可以生成用于提升其他任务效能的 Web 工具,并使用 Agent Skill 优化这类工具的表现。
在 Kilo Code 中,用户还可以用 Ring-2.6-1T 编写脚本,综合运营 macOS 的 OCR 能力、脚本执行和模型推理能力,全自动分析家庭财务账单,从发票图片到可交互分析演示。
在深度研究场景中,Ring-2.6-1T 可以通过 Agent Skill 编写深度研究 Agentic Workflow。模型可以严格遵循通过 Skill 文档定义的 Workflow,研究上百个来源,综述成为一份风险调研和投资相关的建议书。
此外,Ring-2.6-1T 还能自行开发个性化学习助手,检索和规划学习内容、知识图结构,并根据用户反馈自行调整介绍难度和方式。
02.
异步训练 + 棒冰算法
提高 GPU 利用率
传统同步 RL 训练中,策略生成(rollout)与梯度更新紧耦合,容易导致以下问题:
1、GPU 等待:GPU 资源利用率低,大量算力浪费在等待同步上;
2、训练吞吐不足:训练周期被拉长,迭代速度受限;
3、长周期训练不稳定:长周期训练中容易出现策略崩溃或奖励信号退化。
Ring-2.6-1T 采用异步(Async)强化学习训练架构,将策略采样与参数更新解耦为独立流水线。由此,采样与更新并行执行,GPU 利用率与训练效率均有所提升。并且,该训练架构适配大规模、长时间的持续训练,可以避免同步瓶颈导致的训练中断。
在此基础上,百灵团队还将推理大模型 Ring-1T 中的棒冰算法应用到异步 RL 训练中,解决训练不稳定问题。
03.
结语:用更少 token 完成任务
百灵追求真实生产环境使用
近一个月内,百灵迭代发布并开源了多款模型,覆盖 Ling 语言模型和 Ring 推理模型。
此前,Ling-2.6-flash 的匿名测试版本 "Elephant Alpha" 上线 OpenRouter 后,连续多日位列 Trending 榜首,日均 tokens 调用量达到 100B 级别。
虽然模型尺寸不同、能力侧重也不同,其系列模型都在强调用更少的 token 完成高质量的任务输出。相较于追求更大的参数规模或更高的单点分数,百灵更强调 " 真实生产环境使用 "。


登录后才可以发布评论哦
打开小程序可以发布评论哦