硅星人 03-13
OpenAI的全新Agent开发工具,想把Agent生态全抓在自己手里
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

Agent 的热潮还在继续。OpenAI 以 " 构建 Agent 的新工具 " 为标题发布了一系列新的 API 平台功能,直指下一代 AI 应用开发标准。

一个特别重要的变化是引入了新的 Responses API。全新的 Responses API,提供了 Agent 的构建模块,这些 Agent 能够帮用户进行搜索、查阅文件并在电脑上执行任务。

OpenAI 此前已推出 Deep Research 和 Operator 等 Agent 功能。但不同的行业和应用场景千差万别,企业和开发者需要打造不同的 Agent,为此,Responses API 通过提供构建模块,帮助开发者来解决这些需求。

Responses API 配备了一个网页搜索工具,使用的是和 ChatGPT 相同的搜索模型。开发者在使用 GPT-4o 和 GPT-4o mini 时,可以通过这个工具获取实时的网络信息和引用内容。

Responses API 还具备 Computer Use 功能,可以使用 OpenAI 的 Operator 模型来能够分析屏幕,代替用户执行任务。此外还提供了一个文档搜索工具,能够快速检索大量文档。OpenAI 将其定位为帮助客服人员快速查找常见问题解答,或者帮助律师助理检索历史案例。

对于开发者而言,Responses 意味着只需要很少代码就能向 AI 提出更复杂的问题。比如一些原本需要一百行代码的工作,现在只需三行即可完成。通过 Responses API,开发者还能更清楚地了解模型在做什么——它调用了哪些工具,为何调用它们,以及在调用前后做出了哪些决策。

该 API 现已面向所有开发者开放,按 OpenAI 的标准 token 和工具费率计费。

除了推出 Responses API,OpenAI 还发布了 Agents SDK,一个能够 " 编排 " 单个或多个 AI Agent 工作流程的开源工具。

Responses API 是使用模型和工具来完成特定任务的基本单元,而 Agents SDK 让多个这样的基本单元协同工作,以解决更复杂的任务。

目前有超过三百万开发者在使用 OpenAI 的 API,被开发者广泛使用的是 Chat Completions API 将类似 ChatGPT 的功能嵌入到自己的应用中。Responses API 和 Agents SDK 是对 OpenAI 现有开发者工具的补充。Completions 主要涉及文本对话,这次的 Responses API 可以理解为 Chat Completion API 的升级版。

Responses 与基于 Chat Completions 构建的软件是向后兼容的。OpenAI 也将继续支持 Completions API。新模型的能力不依赖于内置工具或多次模型调用时,Chat Completions 会继续更新,但要想使用那些便捷的工具,需要升级到 Responses。OpenAI API 团队表示,未来大多数开发者会选择 Responses。

即将被淘汰的是 Assistants API,这是一个在 2023 年 OpenAI DevDay 推出测试版,OpenAI 还计划在 2026 年年中用 Responses API 取代现有的 Assistants API。

API 需要预见开发者未来几年可能需要的功能,不难拆解出 OpenAI 关于未来功能的核心侧重点,新的 API 极大地扩展了开发者构建 Agent 的能力,为 AI 工程师、AI 设计师、AI 审计员、AI 会计师铺平道路,这些新工具不仅提供了技术便利,更体现了 OpenAI 的平台战略。

把开发者留在 OpenAI 上

大模型推理能力的提升,推动了 Manus 等 Agent 应用的兴起,这些应用展示了能够完成收集资料分析股票、自动浏览简历并进行有条理的筛选分析等任务。 在这次更新的官方博文中,OpenAI 也对 Agent 给出了两个新的定义:我们将 Agent 视为能够独立为用户完成任务的系统。

另外一个更加具体的定义来自 SDK 文档:Agent,配备指令和工具的大语言模型。这也暗示了 OpenAI 实现 Agent 的方法,Agent 本质上是经过特定指令增强并能访问工具的 LLM。

在 AI 市场,OpenAI 的 Chat Completions API 已成为事实上的行业标准,众多公司为了降低开发者切换成本,纷纷提供与之兼容的接口,使其成为 AI 应用开发的通用基准。

然而竞争并未停歇,随着 Agent 的崛起,市场竞争格局正在重塑——谷歌和 Anthropic 等巨头也已进军 AI Agent 赛道。

Anthropic 在 2024 年 11 月推出了 MCP 开放协议,帮助 AI Agent 无缝访问工具和数据库,而无需为每个系统编写代码。其核心目标是解决 AI 模型与数据孤岛的隔离问题,通过提供统一协议替代碎片化的自定义集成。MCP 使用客户端 - 服务器架构,AI 应用(如 Claude Desktop 或 IDE)通过 MCP 客户端连接到 MCP 服务器,前者提供数据源或工具的访问。

截至 2025 年 3 月,MCP 已取得显著进展:10 余款工具(包括 Claude Desktop、Cursor、Continue)已集成 MCP;社区贡献超过 1000 个 MCP 服务器,涵盖文件系统、GitHub、Google Drive 等领域;微软合作伙伴 Block 和 Apollo 已将 MCP 用于内部系统。Gartner 预测到 2026 年,30% 的企业 AI 项目将采用标准化协议(如 MCP)集成外部资源。

MCP 的独特之处在于其专注于 AI Agent 与外部系统的工具和数据源的调用,而 OpenAI Responses API 更侧重集成化开发,直接提供封装完善的功能模块。

对比来看,OpenAI 的 API 是专有解决方案,MCP 是开放标准。两者都致力于增强 AI 系统的功能,但它们在实现方式和应用层次上有所不同。使用 OpenAI 的 Agent 工具开发,就好像在特定游戏引擎中开发游戏扩展包 ,功能强大但只能在该生态系统内运行;而 MCP 则像开放的网络协议,任何遵循这个标准的系统都能互相通信,不论使用什么编程语言或运行在什么平台上。这更像是两家公司在同一行业趋势下的平行发展。

OpenAI 通过引入 Responses API,简化工具使用、代码执行和状态管理的工作流程,凭借这些功能,OpenAI 设想 Responses API 成为 Agent 应用的基础,消除了对多个外部集成的需求。

面对来自本土乃至中国竞争对手的竞争,OpenAI 需要让开发者持续留在自己平台上构建应用。技术优势不再绝对的 OpenAI,似乎已将打造开发者生态系统提升为核心战略重点。

这只是 OpenAI 全面构建 AI Agent 平台的第一步,公司表示计划在未来几个月内推出更多工具和集成,以帮助开发者更有效地部署、评估和扩展 Agent 应用。

十几年前,应用开发需要大量技术投资。随后,苹果和谷歌将其平民化,引爆了数百万应用的市场爆发。如今,这一剧本正在 AI 领域重演—— MCP 和 Agent SDK 等技术正在大幅降低 Agent 应用的开发门槛,或许类似的爆发即将到来。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

deep mini 开源
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论