鞭牛士 1小时前
刚刚!小米“天才少女”罗福莉发表新论文,直指AI Agent痛点
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

3 月 16 日消息,小米 AI 实验室研究员罗福莉,也就是很多人口中的 " 天才少女 ",又发论文了。

论文名叫 ARL-Tangram: Unleash the Resource Efficiency in Agentic Reinforcement Learning。作者之一,就是罗福莉。

如果只看标题,这篇论文似乎只是一个偏工程的研究:如何让 AI Agent 的强化学习训练更省算力。

但如果把它放在最近几个月 AI 的发展脉络里,

就会发现它其实正好落位在 OpenClaw、Claude Code、Devin 这一波 Agent 浪潮的底层。

而要理解这篇论文所讲的东西,

需要我们先下一个定义,AI 正在从 " 模型时代 " 进入 "Agent 时代 "

过去几年,大多数 AI 系统的结构其实非常简单。

输入一段内容,模型计算,然后输出结果。

从 ChatGPT 到图像生成模型,本质都是同一个逻辑:

输入→模型→输出

整个系统的核心资源也很单一,那就是 GPU。

因此过去几年 AI 的竞争基本围绕模型参数规模、训练数据、GPU 算力三件事来展开。

但随着 AI Agent 的出现,计算结构突然变得复杂起来。

一个典型的 Agent 任务可能是这样的:

思考→搜索信息→写代码→运行代码→分析结果→再修改

在这个过程中,AI 不再只调用模型本身,还会不断调用各种工具。

要用 GPU 去做模型推理,要用 CPU 去执行代码,要用 API 去处理搜索、数据库,可能还要用浏览器进行网页操作 ......

于是,一个 Agent 系统的资源结构就变成了:

GPU+CPU+API+ 存储 + 网络

这已经非常接近一个完整的软件系统。

" 帮我整理今天的 AI 新闻并做成 Excel。"

一个 Agent 就会搜索网页、抓取信息、总结内容、生成表格、保存文件,

整个过程涉及浏览器、Python、文件系统、模型推理。

这是 Agent 计算模式的典型例子,龙虾 OpenClaw 也是这么做的,

而最近 Anthropic 更新的 Claude Code,也在逐渐向同样的方向发展。

/loop:让 AI 自动循环执行任务

CLAUDE.md:提供长期记忆

Session Spawning:手机远程启动电脑上的 AI 编程任务

连不少开发者看完更新后的第一反应都是 " 这不就是官方版龙虾吗?"

当远程操控、自主执行和长期记忆组合在一起时,AI 不再只是一个聊天工具,而更像一个持续运行的数字员工。

好用,确实是好用,但真正的问题也就在其中,

算力怎么调度?

在传统模型训练中,资源基本只有 GPU。

但在 Agent 系统里,不同任务会不断切换资源类型:

有时需要 GPU,有时需要 CPU,有时需要 API

如果资源管理方式不合理,就会出现大量浪费。

论文里给出的典型例子中有一项数据,

在某些 AI 编程任务中,CPU 的真实利用率只有 47%。

剩下的算力基本处于闲置状态。

对于正在进行大规模训练的 AI 公司来说,这种浪费意味着巨大的成本。

基于此,罗福莉等人的论文提出了一种新的系统:Tangram。

它的核心思路很像操作系统的进程调度。

传统系统的资源分配方式是任务级调度:

一个 Agent 任务开始时,就会占用 CPU 或 GPU,直到任务结束。

而 Tangram 采用的是动作级调度。

也就是说,只有当某个具体操作需要资源时,系统才会分配资源。

写代码→ GPU

编译代码→ CPU

运行测试→ CPU

搜索资料→ API

这样不同 Agent 的任务可以共享资源。

实验结果显示,这种调度方式带来明显提升:平均任务时间缩短 4.3 倍,训练效率提升 1.5 倍,外部资源成本降低 71%,

对于正在进行大规模 Agent 训练的团队来说,这种效率提升非常关键。

如果把最近几个月的技术动向连起来,会看到一条越来越清晰的路线。

OpenClaw 解决的是 Agent 的运行框架问题,

Claude Code、Devin 解决的是 Agent 在真实任务中的应用问题,

而罗福莉等人做 Tangram 这样的研究,则开始解决 Agent 的底层计算问题。

这说明 AI 行业正在经历一个结构性变化,

竞争的焦点正在从模型能力转向 Agent 系统能力。

这也正是为什么 OpenClaw、Claude Code、Devin 会在今年突然变得如此重要。(转载自 AI 普瑞斯)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 小米 天才少女 gpu 龙虾
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论