新眸 02-05
2025,AI Agent还在起跑线
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

未来几年,有关智能体的讨论会愈加密集,但比起这个,如何解商业化这道难题更加紧迫。

作者|李小东

当 2024 年全球科技峰会的话题从 " 大模型参数竞赛 " 转向 " 智能体落地场景 " 时,行业似乎完成了一次集体认知跃迁。人们意识到,AI 的价值不再是参数量的天文数字,而在于能否像水一样渗入真实世界的缝隙。

过去两年,随着混合专家架构(MoE)、神经符号系统等技术范式的迭代:智能体不再依赖 " 暴力训练 ",而是通过知识注入与逻辑推理的结合,逐步逼近人类专业能力。 全球科技巨头与初创公司纷纷将资源投向 AI Agent,人们甚至开始产生一种错觉——智能体很快会进入成熟期

这种感觉的背后,源于行业对 " 智能体 " 定义的微妙重构。相比马文 · 明斯基时代的 " 自主生命体 " 理想,在大模型取得突破性进展的当下,留给 AI 应用落地窗口期愈发紧迫,对智能体的界定,虽然同样具备能够   " 自主感知并采取相应行动 "   的特征,但更多是把它视作 AI 应用落地最重要的一种产品形态。

从 Anthropic、Google DeepMind 到 OpenAI,从字节、百度等头部大厂,到 kimi、智谱等 AI 新势力,各家公司都在探讨如何利用这项技术去颠覆现有的行业格局,让智能体真正成为打通 AI 从实验室到实际场景落地的利器。

然而看似繁荣的落地案例,大多仅是技术长跑中的零星里程碑:特斯拉 Optimus 机器人能分拣零件,但面对传送带突发卡顿仍需要人类救场;Anthropic 的 Computer Use 让用户可以指挥 Claude 操作电脑,但面对复杂流程,也只有 15% 的操作成功率。

这些情况并非个例。当前大多数智能体集中在高度结构化的环境中运行,而人类世界的复杂性远超实验室预设的边界。站在 2025 年的节点,这个被赋予 " 颠覆生产力 " 使命的技术,仍处于爆发前夜。

笃信行业的人会认为,当大模型完成技术启蒙,算力基建逐步完善,智能体正在打开一个比移动互联网更庞大的市场——结合麦肯锡与 Gartner 研究预测,到 2027 年,智能体将渗透至大部分的企业工作流,释放万亿美元经济价值。我们看到的不是技术天花板,而是一个领域新的起跑线,技术、商业与社会的碰撞刚刚开始,真正的变革将在混沌中重塑规则。

01

智能体爆发前夜

在很多人的印象里,AI 智能体能够实现工作流程的自动化,其实早在多年以前,就有企业已经开始尝试使用基于规则的系统来处理简单任务,比如一些系统可以根据预设的知识库,自动回答客户的基本问题。

最接近智能体形态的产品是 IBM Watson 这类规则引擎驱动的专家系统和 Siri 等单点交互工具,但这些依靠预设规则和简单决策树运行的相对初级的程序,局限性非常明显:当面对复杂业务场景时,系统需要工程师编写数以万计的 if-then 规则,任何业务规则的细微调整都可能引发蝴蝶效应,导致整个系统需要推倒重来。

真正革命性的突破发生在 2015 年前后。随着深度学习技术的发展,AI 开始具备自主学习和环境适应能力。谷歌 DeepMind 团队的 AlphaGo 就是典型的例子,在 2016 年击败围棋世界冠军,标志着人工智能从 " 机械执行者 " 向 " 策略制定者 " 的蜕变。

彼时的智能体,作为基于计算机程序和算法构建的智能实体,也逐渐具备了基于数据自我迭代的能力,但由于 " 算法泛化能力不足 " 与 " 场景理解碎片化 " 的技术局限性,还没有达到完全自主决策的程度。AlphaGo 虽然在围棋领域超越人类,却无法将这种能力迁移至其他场景。这种专家系统式的智能,本质上仍是戴着镣铐跳舞。

直到大模型的出现。

2020 年 GPT-3 横空出世,智能体进入了一个新的认知革命,体现在两个方面:AI 认知的泛化,千亿参数构建的大模型能理解跨行业的术语与业务逻辑;人机交互方式的改变,人们可以通过对话来生成结果。

2022 年底,ChatGPT 破圈,验证了大模型作为 " 通用认知引擎 " 的可能性,次年多模态大模型爆发,被视为智能体的 " 成人礼 ",GPT-4、Gemini 等模型展现的跨模态能力,让智能体初步具备人类的多感官协同。

在这样的背景下,具备持续学习能力的 AI Agent,在一定程度上有望突破工具属性,成为具备商业思维的 " 数字员工 ",也就是大家现在所理解的 " 企业智能助手 " 的雏形。

与此同时,大模型 API 调用成本从 GPT-3 的每千 tokens 0.06 美元,降至 GPT-4 Turbo 的 0.01 美元,意味着中小企业也能负担智能体部署。包括麦肯锡在内的多家研究机构测算并得出结论,大模型推动智能体部署成本下降 60-80%。

智能低门槛、高适配、强进化的应用特征,让不少为了摆脱商业化困境的 AI 玩家,将智能体当作新的突破口。

而人们对智能体的终极期待,是构建一套 " 企业认知中枢 " ——它不仅是执行命令的工具,更是沉淀知识、优化流程、预测风险的核心引擎。这一愿景在过往受限于技术碎片化与成本壁垒,而如今,大模型的泛化能力、多模态融合与成本下降,终于让商业社会看到了破壁的机会。

02

行业现状冰火两重天

Anthropic CEO Dario Amodei 曾断言,未来 2~3 年内,AI 可能在几乎所有任务上超越人类,五年内智能体将渗透 90% 的企业工作流。智能体之所以成为风口,本质是市场对 " 第二代数字化转型 " 的豪赌,如果说 2000-2020 年实现了业务流程数字化,当下正进入 " 用智能体重构业务本质 " 的新阶段。

根据 CB Insights,2023 年,全球 AI 初创公司融资总额达到 425 亿美元。而伽马数据则显示,过去的一年里,全球 AI 产业融资金额超 4000 亿元,同比增长超 77%,其中智能体相关的初创企业融资占比尤其显著。

但资本市场的狂热与产业实践的谨慎形成微妙张力。综合各类机构调研,2024 年全球仅小部分智能体部署项目实现盈利,多数企业仍在为 " 如何让 AI 理解业务逻辑 " 焦头烂额。这种矛盾映射出一个现实:智能体从技术演示到商业闭环之间仍有巨大鸿沟。

从技术布局看,头部公司的探索方向已现分野。

例如 OpenAI 的 Sam Altman 押注 " 通用智能体 ",试图通过 GPT 构建可适应任意场景的认知引擎,刚刚正式发布的 "Operator" 能让智能体接管用户电脑操作,例如自动编写代码并调试运行,但是否能避免此前 Anthropic computer use 所暴露的控制能力脆弱性,还需要进一步验证;

而微软 CEO 纳德拉选择深度嵌入路线,将 Copilot 植入 Office、Teams 等产品矩阵,试图把智能体变成企业工作流的 " 隐形中枢 ",但在供应链管理等复杂场景中,其智能体因缺乏行业知识库支持,也曾引发过合规危机。

具体到智能体的商业化路径,不同类型的公司也呈现出不同的思路:以 OpenAI、谷歌和字节跳动为首的平台基建型玩家,和以 Anthropic 为代表的垂直深耕型选手。平台型与垂直型智能体公司的分野,本质上映射出技术普惠与深度价值的两条进化路径。

OpenAI 的 GPTs 上线三个月即吸引超 300 万开发者,用户通过自然语言指令创建各种智能体,这种 " 对话即开发 " 的模式将生态扩张速度提升 10 倍,但繁荣背后暗藏隐忧——据 SimilarWeb 监测,GPTs 商店中近 70% 的智能体生命周期不足 30 天,同质化工具泛滥导致用户付费意愿持续走低。

用生态化的平台来聚拢开发者,这种玩法在互联网早期就已显现,本质上是科技巨头之间的军备竞赛。然而,平台型玩家虽占据流量与开发者优势,却难免广度稀释精度的悖论——当微软 Copilot 企业版用户抱怨其生成的财务报告频繁出现会计准则误用时,OpenAI 工程师坦言 " 通用模型在专业场景的知识深度,不足人类专家的 1/10"。

垂直型路径则选择向产业纵深处掘金,为了和 OpenAI 等公司差异化竞争,Anthropic 在发布 Computer Use 之外,Anthropic 把目光锁定在金融、医疗等对合规审查、风险评估的要求极高的领域,以满足这些刚需场景为切入点,提供 " 宪法 AI" 约束,用 Claude API 满足客户的私有化部署。

不同于 OpenAI 的 " 通用模型 + 生态扩张 ",Anthropic 采用 " 可控性 + 行业适配 " 方案,这么做的原因并非通过平台的形式来卖铲子,而是在自身技术优势的基础上,满足行业在 AI 时代对安全、精准、定制化服务日益增长的需求。

聚焦细分领域且能快速落地的方案,对于科创型公司来说更具实践意义,国外 AI 科技公司 LangChain 调查了从工程师、产品经理到商业领袖和高管共计 1300 多企业人士,调研的企业里,超过一半用 Agent 来进行研究和总结的工作,其他依次为个人生产力工具、客户服务、代码生成等方面。

在过去的两年里,各类 AI 智能体产品,在全球各行各业释放出极大的潜力。主打金融、法律文档智能分析的 Hebbia.ai、为企业客户定制 AI 客服的 Sierra,以及职业教育领域的 Sana Labs 等,都有不错的增长。

资本的疯狂涌入,推动这些新玩家们的融资规模与估值双双飙升。但与此同时,市场卷起的巨大泡沫,一些智能体初创公司的 PS Ratio(市销率)甚至超过 50 倍,远超此前 SaaS 行业平均水平。拿 Sierra 来说,这家成立不到两年的公司,估值已经达到 45 亿美金,成为智能体初创企业中最火热的投资标的之一。

垂直化也意味着规模天花板,Gartner 数据显示,专注金融合规的智能体公司年均营收增速仅为平台型企业的 1/3,且客户获取成本持续攀升,部分赛道已出现用 80% 资源争夺 20% 头部客户的残酷内卷。

从平台型到垂直型,两种路径的角力实则指向产业根本矛盾:通用智能体的开放生态能快速铺量却难挖深井,垂直解决方案虽能创造高毛利但复制成本陡增

于是在这种情况下,一些公司已悄然调整战略,Anthropic 在 Claude API 中开放 " 宪法规则自定义 " 接口,允许企业将内部合规条款植入模型,这种 " 可拆卸的垂直化 " 或许预示着未来智能体市场的终局形态:平台提供基础认知引擎,垂直模块则像 App Store 中的专业应用般自由组合,最终在开放与封闭、普惠与深度的平衡中重塑商业。

但这些,还仅仅是一种预测。

03

智能体还在起跑线

回到智能体本身,行业领袖的反应更为冷静。Meta 的扎克伯格坦言:" 我们高估了短期进展,低估了长期挑战——让智能体真正理解人类意图,可能还需要十年。" 英伟达黄仁勋则预测," 只有当智能体开始改造企业利润表时,真正的革命才刚开始。"

两者观点看似矛盾,前者警示短期高估,后者强调长期革命性,但这些判断的背后,其实都是对当下智能体技术瓶颈和商业化局限下的认知。

当前智能体的自然语言交互能力虽已突破语法层面,但在深层语义理解上仍存缺陷,在动态环境和跨系统的协作协作,智能体仍存在各式各样的可靠性不足。在商业化层面,不少公司面临成本和收益失衡,波士顿咨询调研显示,企业智能体项目中不到 20% 达到预期 ROI,多数企业仍在 " 试水 " 阶段。

如果将视线放到国内,情况将会更加复杂。

事实上,国内和国外的智能体发展,一开始差异并不明显,但现在差别越来越大。具体表现为,国外在智能体领域的融资规模不断攀升,产品力不断增强,部分超级公司正在崛起;而国内目前大多还停留在概念阶段,这种情况和当年 SaaS 行业很相似。

从中国信通院发布的《2024 年人工智能发展报告》来看,在金融、医疗、制造等领域的智能体公司数量庞大,但受限于高部署成本和商业化落地难度,企业级市场的盈利项目占比屈指可数。

这一差距背后,是技术路径、产业生态和商业逻辑的多重差异。

目前国外大部分智能体产品的交付,仍沿用软件定制开发或按时订阅的商业路径,主要得益于其 SaaS 化基因,有成熟的软件生态基础,另一方面,智能体对传统线下生产和运营流程的替代更加精细,可替代的人力环节更多,智能体能解决更多实际问题,因此拥有广阔的发展空间。

商业发展的本质,是要缩短传统流程,并尽可能降低成本,当成本比原来降低更多时,新的模式就会取代旧模式。但相比之下,国产 AI 的发展并非是因为软件生态成熟,有了 AI 后如虎添翼;恰恰相反,国内软件生态原本就不够完善:既缺乏类似 Hugging Face 的模型库、Databricks 的数据处理平台,行业内的 API 标准化也表现不足,增加了企业的集成成本。

这种情况导致在 AI 领域,国内还需要去弥补软件生态方面缺失的功课。更棘手的是,企业客户习惯为 " 功能模块 " 付费,但拒绝为 " 决策能力 " 溢价。一些头部厂商的智能体一旦报价超过客户预期的范围,客户流失率甚至能达 90%。

所以在 2025 年的节点,清醒认识到,伴随 AI 从玩具编程工具,但如果要把智能体从生产力工具变成真正的生产力,这场变革还未抵达交卷的程度,它不会遵循摩尔定律的节奏跃进,而是要在试错与迭代中蹒跚前行。

— END   —

更多内容,点击下方关注

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 起跑线 机器人 至大 科技巨头
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论