量子位 16小时前
腾讯开源智能体新框架:不用训练无需充值,用开源模型实现SOTA Agent
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智能体(Agent)正成为大模型落地的关键载体。无论是研究探索还是实际应用,高效、易用、可复现的智能体框架,都是推动智能体生态发展的基础设施。

然而,研究者和开发者却常常遇到一些难题:例如上手门槛高、依赖环境复杂、实验难以复现,以及动辄需要训练模型或者充值海外昂贵的闭源模型 API 才能取得可靠的效果表现

为此,腾讯优图实验室正式开源Youtu-agent  ——一个简单而强大的智能体框架,兼顾极简设计与高性能表现,既能服务科研基线需求,也能支撑实际应用构建,最重要的是不需要训练模型、不依赖闭源 API,就能取得极佳的效果表现

在多个挑战性基准上,Youtu-agent 已展现出领先的性能:

WebWalkerQA:基于 DeepSeek-V3.1 达到71.47%准确率,刷新开源效果 SOTA;

GAIA(文本子集):基于 DeepSeek-V3 Pass@1 达到72.8%,不用充值 Claude/GPT 等闭源模型,验证了强大的研究和应用潜力。

这意味着,Youtu-agent 在完全开源可复现的条件下,已经接近甚至超越部分依赖付费工具的智能体框架。

开箱即用

总体来看,Youtu-agent 具有以下核心亮点

1、开源友好 & 成本敏感

完全基于开源生态,不依赖封闭模型,适配可访问、低成本的部署环境。

2、灵活架构

构建于 openai-agents 之上,兼容 DeepSeek、gpt-oss 等多类模型 API 与工具集。

3、自动智能体生成

基于 YAML 配置和 " 元智能体 " 对话机制,用户只需描述需求,即可一键生成并运行智能体配置。

4、简洁高效

模块化 + 异步化设计,支持 streaming、tracing 与 agent-loop,高效调试与扩展。

更关键的是 Youtu-agent 并非实验室里的 " 纸上框架 ",而是面向真实场景的即用型智能体工具。

研究团队梳理了四个典型案例,覆盖文件管理、数据分析、学术研究与广域综述,展示了框架的灵活性与实用性。

案例 1:本地文件管理

在助教批改作业的场景中,用户只需将学生提交的文件放入指定文件夹。Youtu-agent 启动后会依次扫描所有文件,首先判断格式是否为 PDF。

如果是 PDF,则根据规则自动重命名为 " 学号 - 姓名 " 的规范格式;如果不是 PDF,则将其归档到独立的文件夹。整个过程无需人工干预,从文件识别到命名再到分类归档,一气呵成。

案例 2:数据分析

当面对 Kaggle 数据集中的 cat_breeds_clean.csv 文件时,用户只需给出路径。Youtu-agent 读取 CSV 内容,经过数据清洗和统计分析后,会自动生成结构化的结论与趋势,并转化为一份直观的 HTML 报告。

这个过程中,原始数据被逐步转化为高价值的信息:从表格读取、到统计提取、再到结果可视化,形成完整的流水线。

案例 3:论文分析

在科研工作中,研究者只需输入一篇 PDF 论文。Youtu-agent 首先解析文档内容,抽取核心部分;随后调用搜索工具,在外部检索与其相关的研究工作;最后将论文解读与外部成果整合,生成一份 Markdown 报告。

整个过程就像一个 " 论文助理 ":先读懂论文,再去查找对照,最后写出一份条理清晰的研究笔记。

案例 4:Wide Research

当用户输入一个广域主题时,Youtu-agent 便进入复合模式。它先调用搜索工具,收集大量分散的信息;再使用文档处理工具进行整理;最后由智能体进行分析与总结,生成一份结构化的 Markdown 综述。

这个过程相当于把 " 调研 " 自动化:从需求提出,到海量资料收集,再到报告成型,整个链条由多个子智能体协同完成。

设计原则:DITA

Youtu-agent 的研究员提出了DITA 原则,总结智能体设计的四个关键维度:

Demand(需求):明确任务目标,来源于系统提示词中的 requirements 或用户输入的 intention。

I/O(输入输出):定义任务的输入形式(如 CSV、PDF、str)与输出形式(如 HTML 报告、Markdown)。

Tools(工具):根据任务选择或生成合适的工具,例如搜索工具、文件处理工具。

Agent Pattern(范式):决定智能体的交互模式,例如 single agent、plan-and-execute、compound。

自动化 Agent 生成

除了 DITA 框架之外,Youtu-agent 还特别强调了一个核心亮点:自动化 Agent 生成

在传统方式中,用户往往需要自己手动编写 prompt、配置工具和参数,这不仅对初学者来说存在较高的使用门槛,而且即使是有经验的用户,也要投入大量的时间成本。Youtu-agent 的解决思路是将这一过程进行标准化与自动化。

具体来说,它采用统一的 YAML 配置格式,将 Agent 的输入输出、工具调用和交互范式用结构化的方式加以描述;同时引入了一个 "meta-agent",用户只需提出任务需求,系统就会通过与用户的交互澄清意图,并自动生成完整的配置文件。生成的配置可以直接加载并运行,从而实现一键测试与使用。

在使用体验上,用户只需先运行 python scripts/gen_simple_agent.py,meta-agent 会根据需求生成相应的配置;随后再运行 python scripts/cli_chat.py — stream — config generated/xxx,就能立即启动并测试生成的 Agent。这一机制大幅度降低了 Agent 的定制难度,让初学者可以快速上手,同时也帮助高阶用户节省了繁琐的配置和调试时间。

# 第一步:生成配置 python scripts/gen_simple_agent.py# (交互式对话,meta-agent 会澄清需求并输出配置)

# 第二步:运行测试 python scripts/cli_chat.py --stream --config generated/xxx

快速上手

对于研究人员 / 模型训练师,Youtu-agent 可以作为比 ReAct 更强的开源基线,一键评估脚本助力实验与消融研究。

对于应用开发者,Youtu-agent 可以充当经过验证的脚手架,轻量上手即可构建真实智能体应用。

对于 AI 爱好者,Youtu-agent 具备丰富示例与可调试性,能让开发与探索直观高效。

那么这个智能体框架要怎么用?很简单,Youtu-agent 在 GitHub 上开源了完整代码和示例,只要三步就能跑起来:

第一步:获取代码

在命令行输入:

git   clone   https://github.com/TencentCloudADP/Youtu-agent.gitcd   Youtu-agentuv   sync    # or, `make sync`cp   .env.example .env    # config necessary API keys...source   ./.venv/bin/activate

第二步:跑一个最简单的智能体

Youtu-agent 内置了配置模板,只要写一个 YAML 文件,就能定义你的智能体行为。项目中提供了一个搭载搜索工具的基础 agent 模板 configs/agents/default.yaml,你可以运行下面的代码一键体验:

python scripts/cli_chat.py   --stream   --config   default

第三步:探索更多示例

你也可以尝试运行官方示例中的更多实用案例,部分示例要求 Agent 具备联网搜索能力,因此需要在 .env 文件内提前配置 tools 模块内的工具 API:

# tools# serper api key, ref https://serper.dev/playgroundSERPER_API_KEY=< 访问注释内的地址,获取 API Key># jina api key, ref https://jina.ai/readerJINA_API_KEY=< 访问注释内的地址,获取 API Key>

例如希望 Agent 围绕 "DeepSeek V3.1 新特性 " 主题,自动联网检索信息并生成 SVG 介绍图片,可以直接运行下面的代码:

python examples/svg_generator/main.py

# fetch and download the frontend packagecurl   -LO https://github.com/TencentCloudADP/Youtu-agent/releases/download/frontend%2Fv0.1.5/utu_agent_ui-0.1.5-py3-none-any.whl   # install frontend packageuv pip install utu_agent_ui-0.1.5-py3-none-any.whl

运行 web 版本的 SVG 图片生成命令:

python examples/svg_generator/main_web.py

例如,对于 "deepseek-v3.1 有哪些亮点更新 ?" 这一问题,agent 自行从网络搜索相关信息,最终生成如下的图片:

更进阶的,还可以用脚本一键跑基准评测:

python   scripts/run_eval.py — config_name ww — exp_id demo — dataset WebWalkerQA — concurrency   5

完成评测之后,可以在分析平台上检查实验结果:

更多用法,详见仓库文档 ~

仓库:https://github.com/TencentCloudADP/Youtu-agent

文档 : https://tencent.github.io/Youtu-agent/

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

开源 腾讯 效果 数据分析 文件管理
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论