IT时报 07-25
AI Agent是2025年最大风口还是泡沫?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

  AI 市场格局或将风云突变

作者/   IT 时报记者   贾天荣

编辑/   钱立富  孙妍

ChatGPT 不仅能 " 说 ",更开始 " 做 " 了。

7 月 18 日凌晨,Sam Altman 携四位 OpenAI 研究员在直播中正式发布 ChatGPT Agent ——一款通用型 AI Agent。这让许久未有 " 大动作 " 的 OpenAI,再次引发关注。

从功能来看,ChatGPT Agent 与市面上已有的 Agent 产品相差不大,能做表格、查资料、执行任务,但仍有许多人将其视为 OpenAI 的又一次 " 王炸 ",因为它验证了一个正在成为主流的新方向——模型即 Agent。

今年以来,越来越多的大模型公司押注 " 模型即 Agent" 概念,xAI、月之暗面(Kimi)、零一万物、阿里云先后推出的新产品,都或多或少与它有关。

什么是 " 模型即 Agent"?为何大模型公司都趋之若鹜?

" 模型即 Agent"

通往 AGI 的必经之路?

2025 年之前,大模型和 Agent 似乎走的是两条路。

惯常的解释是,大语言模型像一个知识渊博的助手,能够回答问题和生成文本,但缺乏主动性和执行力;"Agent 智能体 " 则更像一个目标明确、具备独立思考能力的虚拟员工,不仅能够理解需求,还能主动行动、执行任务,甚至与外部环境互动。

以去年广受关注的全球首款通用 AI 助手 Manus 为例,它通过调用多个底层模型,实现了从规划到执行、再到输出的闭环能力,就像将多个工具整合在一个智能体内,虽然是个 " 缝合怪 ",但 " 缝合 " 水平还不错。

不过,彼时便有业内人士指出,通用智能体的壁垒并不高。面壁智能联合创始人、CEO 李大海曾提到:" 每当大模型版本迎来质的飞跃时,往往会吞没上一代模型所支撑的全部应用生态。"

2025 年," 模型即 Agent" 的路径越来越明显。

所谓 " 模型即 Agent",是指大模型本身成为 Agent 的核心大脑和驱动引擎,与过去依赖复杂工作流编排或外部模型整合不同,AI 将从单纯的 " 能说会道 " 进化为 " 能做会干 ",这种转变使得 AI 成为能够实际帮助用户完成任务的智能助手。

以 ChatGPT Agent 为例,不同于 Manus,它在单一模型内部完成了所有技能调用与任务执行的全过程。在这一过程中,用户可以实时看到 AI 在虚拟电脑上的操作路径,体验它从理解需求、选择工具、执行操作到交付结果的全过程。这种 " 可观察、可互动 " 的 Agent 形态,正是 OpenAI 在技术底座上的独特创新。

此前,全球公认编程能力最强的大模型是 Anthropic 的 Claude 4 系列,它在编程、推理和 Agent 方面 " 树立了全新标准 ",能够处理复杂且长时间运行的任务,甚至很多智能体的背后就是 " 套壳 "Claude 4。

这也让 Claude 4 成为 " 众矢之的 "。7 月 9 日,马斯克旗下的人工智能初创公司 xAI 发布新一代大模型 Grok 4,包括单智能体、多智能体两个版本,具备工具使用、实时搜索等功能,对标的正是 Claude 4 Opus。

国内不少大模型公司业已转向。

去年年底,面壁智能联合清华大学发布了新一代主动 Agent 交互范式,Agent 不再是简单的指令执行者,而是升级为具有 " 眼力见 " 的智能助手。李大海认为,模型本身而非工作流,才是未来 AI 智能体的发展方向," 模型即 Agent,模型即产品,模型即交互 "。

今年 7 月 11 日,月之暗面时隔半年推出新一代基座模型 Kimi K2,据官方介绍,Kimi K2 是一款具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,模型自身就集成了自主决策和执行任务的能力,能够作为智能体解决复杂任务。

7 月 23 日清晨,阿里开源全新的通义千问 AI 编程大模型 Qwen3-Coder,同样强调 Agent 能力,尤为擅长解决多步骤的长任务,不仅能通观全局自主安排工作内容,支持 Agent 调用各种工具深入钻研,最终解决复杂编程任务。

" 幻觉或许不是坏事 "

这些大模型公司,为什么都押注 " 模型即 Agent"?

" ‘模型即 Agent ’这个概念体现了我们对 AI 认知的根本转变,不仅仅是技术架构的变化,更是人机协作关系的变化。" 特赞科技 Tezign 创始人及 CEO 范凌告诉《IT 时报》记者,在他看来," 模型即 Agent" 的核心价值在于大语言模型可以模拟真实用户行为,AI 不仅能回答问题,更能主动构建用户画像、驱动决策流程。

比如,如果将《哈利 · 波特》所有故事输入到大语言模型里,那大语言模型可以变成 " 哈利 · 波特 ",甚至模拟哈利 · 波特来想问题。

这种逻辑的更迭会给行业带来一个显著的变化,就是 Agent 要从 " 工具思维 " 向 " 协作伙伴思维 " 转变,甚至会对以往的一些 AI 认知形成冲击。" 以前人们担心幻觉,但实际上幻觉反而可能是好事,当我们需要 AI 能够主动思考时,那么在推理层面,要从现在的‘收敛优先’转向‘发散优先’,尽可能让 AI 的思维更开放。" 范凌认为,这条路是能走通的,但当下的关键在于找准应用场景。

中金研报指出,基础大模型仍是决定 Agent 能力上限的关键,大模型的编程及智能体能力是各家厂商竞争关注的焦点。

不过,相较难度更大的 " 模型即 Agent",C 端 Agent 具有更大的市场想象空间,类似 Manus 的多智能体协作模式——通过不同角色的智能体分工,实现多样化任务处理,在当前更为普遍。

ChatGPT Agent 发布后,Manus 第一时间放出 10 个实测案例,试图通过财务建模、生活规划、行程安排、消费购物、航班筛选等不同场景任务,证明 ChatGPT Agent 在任务闭环和可视化交付上并不占优。

不过,无论是 ChatGPT Agent,还是 Manus,当前业内普遍共识是,通用智能体的应用仍处于早期阶段,处于业务场景探索和技术验证的过程中。

Gartner 也认为,这一市场仍存在 " 泡沫 " 问题,预计到 2027 年底,超过 40% 的智能体项目将被取消。

范凌对此表示认同。他认为,正如任何新技术的发展过程一样,Agent 领域也会经历 " 过度期待 " 和 " 理性回归 " 的周期," 生存的关键在于 Agent 是否能解决商业核心问题,同时要在技术和成本之间找到平衡。在 Atypica.AI 实践中,我们发现,AI 能够直接交付结果时,用户的付费意愿显著提升 "。

市场格局已变

AI 技术还在加速奔跑,但现实情况是,2025 年以来,大模型公司所处的市场格局已经发生巨大的变化。

年初,DeepSeek 凭借低成本、高性能的开源模型强势入场。去年备受关注的 " 六小虎 " ——智谱 AI、MiniMax、月之暗面、阶跃星辰、百川智能和零一万物,融资、流量以及市场份额方面都出现了不同程度的变化。除智谱 AI 和阶跃星辰外,其余几家公司自 2024 年下半年以来便未再获得融资。

与此同时,用户流失、高管出走、裁撤业务线等消息也伴随而来,特别是零一万物和百川智能,早早放弃了基座大模型训练,并进行了战略收缩,百川智能聚焦于 AI 医疗,而零一万物则重点押注 AI 行业落地。

能够直接 " 动手 " 的智能体,成为全球科技圈最快形成共识的第二个风口,市场咨询机构 Gartner 将 AI Agent 列为 2025 年十大战略技术趋势之首。

对于如何实现 AI Agent,有人向左,有人向右。

图源:unsplash

早在今年年初,《IT 时报》记者就 Agent 的未来采访了多位行业专家,泛微副总裁杨国生彼时接受《IT 时报》记者采访时表示,通用大模型应用于垂直领域时,其稳定性难以令人满意,这意味着,在 B 端市场,精准度尤为关键," 需要大量的工程技术介入,才能确保其真正实现企业级应用的效果 "。

如今半年过去,Agent 仍然是风口,但似乎又不是那个 Agent。

" 今年以来,Agent 领域出现了根本变化。" 范凌指出,在特赞的 Atypica.AI 实践中,他发现很多人仍将 Agent 视为传统工具的升级版,但实际上,Agent 的内涵早已发生了变革,尤其随着大模型的推理能力得到显著提升后,可以结合多种工具调用直接给出执行结果,Multi-Agent(多智能体)将是一个更大的机会。

不过范凌也认为,通用 Agent 并不能 " 包打天下 ",当技术遇到未被满足的需求,就有了生长的土壤,垂直 Agent 的价值在于它能解决特定的行业痛点。

便捷与风险并存

与此同时,一些风险也不容小觑。

从技术角度看,AI 模型可能面临偏差风险。例如,算法歧视可能导致不公平结果,训练数据不足或应用不当也可能导致模型失效。此外,网络安全问题也不容忽视,DeepSeek 便曾遭遇过 DDoS 攻击。

《IT 时报》记者也注意到,OpenAI 在发布 ChatGPT Agent 后,随即发布了长篇警告,提示用户使用 AI Agent 可能带来的风险。虽然 ChatGPT Agent 在处理复杂任务方面表现强大,但 OpenAI 强调,产品的潜在风险仍然存在。例如,不法分子可能尝试 " 诱骗 "AI 代理提供不该提供的私人信息,或采取不当行动。

为此,OpenAI 加强了对高风险任务的控制,推出了多项安全措施:关键操作必须经过用户明确授权;高风险任务(如发送邮件)需要启用 " 监督模式 ",要求用户全程监控;对于银行转账等高风险指令,AI 会主动拒绝执行;用户可以随时清除浏览数据并注销会话,或在不联网的情况下禁用连接器。

达观数据 CEO 陈运文也坦言,AI Agent 的全民普及仍面临瓶颈。大众对其功能和价值的理解不深,接受度较低,且专业人才匮乏,尤其缺少既懂技术、产品,又熟悉商业和生态的复合型人才。同时,在伦理、法律与安全方面,AI 决策往往缺乏可解释性,责任归属不清晰,且存在隐私泄露和被攻击的风险。

无论如何,ChatGPT Agent 仍需在解决实际问题上更进一步,AGI(通用人工智能)依然是众所瞩目的 " 星辰大海 ",而屡次跳票的 GPT-5,是 " 全村的希望 "。

排版/ 季嘉颖

图片/ Manus   Anthropic   即梦 AI   unsplash  

来源/《IT 时报》公众号 vittimes

E   N   D

请加「星标」不错过我们

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

阿里云 技能 零一万物 创始人
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论