文 | 新芒 X
今天看到这么一个观点,说很少有新兴技术能够比代理人工智能 ( Agentic AI ) 为组织提供更多机会来加速生产力和转变业务运营,其前景甚至超过了其表亲生成人工智能 ( GenAI ) 。
另外还看到华泰证券的一个报告,称生成式 AI 正迈入以 AI 智能体为主导的新发展阶段。
这里所说的代理人工智能,其实也就是我们常见的智能体的概念。最近我也参加过多场活动,也上手实测了不少主打智能体的 AI 产品,很明显感觉到智能体概念的持续升温。
清晰的感知到,这或许就是自从 ChatGPT 问世后,躁动了许久的 AI 领域,一路进化的最新态势。今天就试图带大家去探寻一下,这幅更宏大的全球智能体发展图景。
一:从 " 博学大脑 " 到 " 全能打工人 ":智能体究竟是什么?
要理解智能体(Agent)为何被寄予厚望,我们首先要弄清它与我们熟悉的生成式 AI(GenAI)的根本区别。
如果说以 ChatGPT 为代表的 GenAI 是一个知识渊博、有问必答的 " 大脑 ",那么 AI 智能体就是为这个大脑装上了 " 手和脚 ",让它从一个 " 对话者 " 变成一个 " 行动者 "。
GenAI 工具受其编程逻辑的约束,擅长根据指令生成内容,但它的行动力到此为止。而智能体则被赋予了更高级的能力:
它被委托一个目标,然后可以自主地进行理解、规划、调用工具,并与环境交互以达成这个目标。
举个简单的例子,比如我之前实测的一句话生成一部三五分钟,甚至 10 分钟的超清视频大片。剧本、分镜、配乐、画面生成……这些需要耗费人类团队数周的工作,智能体一次性就能完成 。
业内专家提出了一个清晰的智能体进化路径,大致可分为几个阶段:从最初只能进行简单问答的 L1 级聊天助手,到需要人类预设流程的 L2 级工作流智能体,再到能够像领域专家一样自主规划任务的 L3 级推理型智能体。而当前竞争最激烈的,则是 L4 级的多智能体系统,它能够让多个专长不同的智能体协同作战,像一个团队一样解决跨领域的复杂问题。
从这个进化路径可以看出,AI 的发展方向正从追求单一模型的 " 更大、更强 ",转向构建一个能够协同作战的 " 智能生态系统 "。
这正是智能体概念持续升温的根本原因——它标志着 AI 正从一个 " 工具 ",向一个真正的 " 合作伙伴 " 和 " 数字劳动力 " 转变。
全球巨头 " 亮剑 ",智能体赛道的 " 现在进行时 "
智能体的浪潮并非空谈,放眼全球,科技巨头们早已重兵布局,争相亮出自己的 " 王牌 ",将这个未来概念加速推向 " 现在进行时 "。
微软:将智能体植入生产力的每一个角落
微软的战略是 " 无处不 Copilot"。它正致力于将 Copilot 从一个应用内的助手,升级为一个能够横跨 Windows 操作系统、Office 365 全家桶、Teams 协作平台和 Azure 云服务的 " 超级智能体 "。
未来的 Copilot 将不再仅仅是帮你写邮件或总结文档,而是能理解 " 为下周的销售会议准备一份完整的报告 " 这样的复杂指令,然后自主地从 Excel 调取数据、在 PowerPoint 中生成图表、从 Teams 的聊天记录中提取要点,并最终为你整合成一份完整的演示文稿。
此外,微软还开源了 AutoGen 这样的框架,旨在帮助开发者构建强大的多智能体应用,其目标是打造一个庞大的、协同工作的 AI 智能体网络,将智能体能力深度融入到数字工作的每一个环节。
谷歌:以多模态通用 AI 定义未来交互
谷歌则将赌注押在了多模态和通用性上。其在 I/O 大会上惊艳亮相的 Project Astra 计划,便是一个最好的例证。
Astra 的目标是打造一个能看、能听、能说、能记忆、能理解复杂情境的通用 AI 代理。在演示中,它能通过手机摄像头实时识别周围环境,理解代码,甚至记住物品的存放位置,展现了其作为 " 日常生活全能助手 " 的巨大潜力。
这背后是谷歌 Gemini 模型的强大能力,尤其是其天生的多模态理解和 " 工具使用 "(Tool Use)能力,使其可以调用各种 API 来执行现实世界的任务。
对企业用户,谷歌则提供了 Vertex AI Agent Builder,帮助他们快速构建面向特定业务场景的智能体。
OpenAI:通往 AGI 之路的关键里程碑
作为引领本轮 AI 浪潮的先锋,OpenAI 将智能体视为实现通用人工智能(AGI)的关键路径。其推出的 GPTs 可以看作是构建智能体的初步尝试,让用户可以为特定任务创建自定义的 ChatGPT 版本。
但 OpenAI 的野心远不止于此。其正在积极研发能够自主操作计算机桌面环境、使用浏览器、操作各种软件来完成复杂任务的下一代智能体。这种智能体将能够像人类一样与数字世界交互,从预订机票到管理复杂的项目,真正成为人类能力的延伸。
NVIDIA:为智能体时代提供 " 军火库 "
在这场竞赛中,NVIDIA 扮演着不可或缺的 " 军火商 " 角色。它不仅为全球 AI 公司提供算力强大的 GPU,更重要的是,它正在构建一个完整的智能体开发和运行平台。
其推出的 NIM(NVIDIA Inference Microservices)等工具,让开发者可以轻松地将模型打包成可调用的服务,这是构建智能体的基石。
最近,NVIDIA 甚至发布了专为人形机器人设计的 "GR00T" 项目,展示了其将智能体能力从数字世界延伸到物理世界的雄心。
当然,在这场全球性的竞赛中,中国的科技力量同样不容小觑。诸如百度、360 等公司也已推出了面向公众的、能够处理复杂任务的多智能体平台,显示了这一领域的全球同步发展态势。
" 数字员工 " 照进现实,智能体如何颠覆百行千业
那说了这么多高大上的技术,这些 "AI 智能体 " 到底会怎么改变我们的工作和生活呢?简单说,就是各行各业都会迎来一批不知疲倦、能力超强的 " 数字员工 "。
比如说,我们都烦透了和那些只会说 " 请问有什么可以帮您 " 的机器人客服打交道。未来的智能体客服就不一样了,它们会有更大的自主权,能像真人一样,调取你的资料,理解你的问题,真正帮你把事情给办了。
在公司内部,这些 " 数字员工 " 更是大显身手。管仓库的智能体可以 24 小时盯着库存,一旦发现要断货,它自己就能重新安排发货路线和时间。
对于程序员小哥来说,很多繁琐又重复的编程工作也可以甩给 AI 智能体了,它们能帮忙写新功能、检查代码、还能实时抓 Bug。甚至在一些超酷的领域,比如 " 数字孪生 "(就是给一个真实机器在电脑里建个一模一样的模型),智能体可以分析各种数据,模拟机器运转,提前告诉你哪会出故障,甚至还能组团帮忙安排修理。
当然,有好处也有风险。最直接的挑战就是网络安全。你想啊,当黑客也用上了 " 智能体黑客 ",他们就能发动又快又猛的自动化攻击。这就逼着我们必须得有自己的 " 安全智能体 " 战队,未来网络世界的攻防,很可能就是两拨 AI 智能体之间的较量了。
听起来是不是感觉未来已来,但又有点遥远?确实,这条路虽然前景光明,但脚下还有几个坎儿要过。
最大的一个问题是,现在各家公司做的智能体,互相之间还不太会 " 说普通话 "。它们缺少统一的标准和接口,导致没法很顺畅地跨平台、跨公司合作。这个问题一旦解决,智能体的能力可以说是 " 无所不能 " 了。
前路漫漫亦灿灿,挑战与未来展望
所以,我们现在正处在一个非常关键的起步阶段。虽然那些全能 AI 助理的视频看起来像魔法一样神奇,但要让它真正普及开来,还需要很多努力
那我们该怎么办?专家的建议很实在:
谨慎地开始,但现在就得开始。我们每个人和每个公司都应该去主动了解和探索,看看这些 AI 智能体到底能为我们做什么,尤其要找到那些能实实在在带来回报的用法。你可以先从一些小的试点项目开始,给你的 AI 智能体一把 " 钥匙 ",让它在数字世界里先跑起来,积累经验。
回到最初的问题:智能体是 AI 进化的最新态势吗?答案是肯定的。它标志着 AI 从一个被动的 " 内容生成器 ",进化为一个主动的 " 任务执行者 "。这是一个根本性的飞跃。
现在,正是我们探索智能体的最佳时机。我们需要借鉴已有的成功案例,从小处着手,开始构建和试点,让智能体获得 " 数字化的实践钥匙 "。
只有亲自下场探索,才能真正理解其潜力与边界,引领你的个人生活和组织发展,成功跨越学习曲线,从理想迈向成功。
登录后才可以发布评论哦
打开小程序可以发布评论哦