未央网 03-20
从AI到IA,得Agent者得天下
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

技术分水岭:算力、算法和数据的能效博弈

随着大模型的快速更迭,人类已经走上了通往人工超级智能(ASI)的快车道。大数据技术的成熟为 AI 提供了海量生产要素,GPU 技术的发展为 AI 解放了生产力,算法革新为 AI 突破了算力与数据的瓶颈。随着 DeepSeek、GPT o1、Grok 等大语言模型在模型算法、训练参数和算力堆叠这几棵技能树上的不断精进,我们已经来到了 AI 技术发展的十字路口:一次算力、算法和数据的能效博弈。

如果参考摩尔定律,算力的发展会最先触及到能效天花板,基础大模型依赖堆叠算力的时代终将结束。这并不是 " 算力无效论 ",更多的参数和算力一定意味着更好的模型效果,但是边际效应递减会让技术发展在算力上的投入趋于平稳。这点从当前 AI 巨头的产品更迭路径就可见一斑:随着 xAI Grok 的推出,算力堆叠带来的效果提升已初现疲态,OpenAI 等其他几家 AI 巨头已经开始探索 AI Agent 等应用领域,推出智能代理产品。

合成数据和私域数据是下一个大模型时代的数据突破口。虽然我们正处于数据大爆发的信息时代,但得益于大数据技术和算法突破带来的数据处理效率飞跃,AI 发展已经面临数据枯竭的问题。早在 ChatGPT 刚刚问世时,Sam Altman 就警告 " 我们已经处在当前大模型时代的尾声 "。人类互联网历史上被保留下来的各种高质量语料,已经在 GPT-3/4 中被消耗殆尽。大模型参数数量仍然可以继续膨胀下去,但对应数量的高质量数据却越来越稀缺,因此增长参数数量带来的边际效益也会逐渐降低。

算法更像是 AI 发展的 " 催化剂 ",它能够突破算力和数据的约束,实现非线性进化。算法领域的突破往往意味着 LLM 的突破,例如 Transformer 下的 ChatGPT,MoE 下的 DeepSeek。然而,随着模型复杂度的增加,算法的改进空间逐渐缩小。一般认为算法突破可能需要结合更多跨学科的研究成果,例如神经科学启发深度学习,认知科学启发注意力机制,但未来还会有多少 "Transformer 时刻 ",终究难以预测。

基础大模型的发展在算力、算法和数据的能效博弈中趋于平稳,成为通往 ASI 的坚实基础设施;技术资源逐步转向专业领域的数据价值提取和 AI 智能体的场景落地;" 应用落地 " 将成为下一个 AI 时代发展的主旋律。

应用大爆发:多智能体协同开创 Agent 时代

AI Agent 的发展是从 " 问答机器人 " 到 " 智能助手 " 的进化。Agent 的核心在于 " 任务执行 ",使 AI 不局限于给出建议,而是可以执行具体的任务,例如网上下一笔订单,或者执行一笔交易。从简单任务到复杂任务的演进,往往需要不同模型、不同智能体之间的协同配合。我们将这种 " 多智能体协同 " 的概念定义为 InterAgent(IA),它是技术架构的革新,更是对产业应用范式的重构。我们相信 IA 将推动 AI 实现从单一智能到群体协作、从工具辅助到自主执行的跨越式发展,成为推动 Agent 时代全面爆发的核心驱动力。

在技术层面,Anthropic 的 MCP 协议使不同数据源、模型、工具得以链接,为多智能体协同(IA)提供了标准化协议。MCP(Model Context Protocol,模型上下文协议)定义了应用程序和模型之间上下文交换信息的方式,使 Agent 开发变得更加便捷简单,也使多 Agent 体协同变得更加一致和高效。

图 1. 通付盾 MCP AI 插件服务

在应用层面,随着 Dify、elizaOS 等 Agent 框架的逐步成熟,AI Agent 在 " 智能助手 " 这一角色上功能愈发完善。Manus 的横空出世更是掀起了对于 " 通用智能体 " 的讨论热潮。一方面,作为一款通用型 AI 助手,Manus 提供的示例展示了将大模型的逻辑推理能力转化为实际生产力的能力,商业潜力巨大;另一方面,鉴于其未开放任何公开测试渠道,Manus 的技术创新真实性、营销策略和实际价值创造能力也备受争议,尤其是其主打的 " 通用 Agent" 概念,在当前 AI 技术发展趋势下,还有相当的局限性。相较于 Manus 的通用宏大叙事,Dify 等 Agent 应用平台已经在多个领域有了实际的落地应用,这得益于社区共建的力量。相较于一个通用的大模型,针对特定应用场景的专属工作流更加有生命力,这种生命力来源于商业的本质——价值创造。想象一家企业创建一个 AI Agent 进行客户触达和销售,为了最大化利润一定会使用最高质量的数据以及最优秀的专家经验来训练 Agent,私域数据和行业 know-how 所带来的信息壁垒使其效果必将远优于通用 Agent 模型。再想象一个 AI Agent 市场,汇集了各个领域的优秀 Agent(因为市场为 Agent 创造者提供了足够的激励),Agent 之间进行市场化竞争,只有价值创造能力更好的 Agent 可以生存。优秀的 Agent 可以吸引更多用户,更多用户会提供更多数据进一步推动 Agent 进步,形成正向循环。

图 2. 通付盾链上会 AI 插件平台(左)、AI Agent 插件市场(右)

AI 应用时代以智能体(Agent)为应用核心,以多智能体协同(InterAgent,or IA)为技术核心;协助构建智能体的基础设施将获得巨大商业回报,其关键词是 " 垂直领域 "" 社区激励 " 和 " 开放平台 "。

模型的未来:小模型引领新时代 " 图灵测试 "

DeepMind 联创苏莱曼在他的著作《浪潮将至》中提出了一种新时代的 AI" 图灵测试 ":给一个 AI 10 万美元,看它是否能在亚马逊上通过学习来做交易,并最终赚到 100 万美元。这是一个非常有趣的概念,相较于技术基线,对于使用者来说 AI Agent 更重要的是它的行动能力,也就是价值创造的能力。商业成功就是新时代的 " 图灵测试 ",并且这种测试专为 Agent 而生。技术的发展往往由商业模式驱动,我们相信模型技术未来的发展方向也将由基础大模型向专业领域效果更好、盈利能力更强的专家领域小模型发展。从技术角度看小模型的技术框架已经成熟。与一般认知不同,小模型的技术起源其实要远早于大语言模型,其雏形可追溯至 20 世纪 60 年代的专家系统,其核心思想是通过知识库和推理机制模拟人类专家的决策能力。2010 年前后备受瞩目的 MoE 框架(也直接启发了 DeepSeek 的算法革新)也是专家模型的基础框架,通过动态路由机制将输入分配给不同的子模型(专家),在保证性能的同时减少计算量,为小模型的模块化设计奠定基础。大模型的成熟也为小模型的质量提升提供条件,通过知识蒸馏、模型剪枝等技术,小模型在保持性能的同时可以大幅压缩规模。从商业模式上看属于小模型的商业土壤已经完备。小模型效能比出色,部署推理成本仅大模型的数分之一,但结合专家知识库却可以实现远优于大模型的表现效果。数据孤岛反而赋予了数据更高的商业价值和竞争壁垒,随着小模型的商业化应用成熟,高价值数据可以实现真正的数据要素化,为企业发展提供新型商业模式和盈利空间。值得一提的是,分布式数字身份和小模型技术的结合可以在数字空间内创造出高价值商业模式。通过小模型,各领域的私域数据可以最大化发挥商业价值,模型的数字身份就成了数据要素确权的关键。当前分布式数字身份技术已较为成熟,如何让每一个小模型、每一个 AI Agent 拥有数字空间的可信身份甚至是账户体系,是 AI Agent 商业应用探索拓新的关键命题。在一些特定领域,小模型则有着不可比拟的竞争优势。例如能源、军工、医疗等数据敏感行业,数据需要进行本地化处理甚至需要实现端侧推理,这都是大模型所无法实现的。以电网业务为例,使用 AI Agent 搭配专家领域小模型,在业务风控场景可以实现更智能,更人性化的风控干预;在营销场景可以实现自动化市场线索收集、活动运营以及精准营销获客;在分布式光伏、端侧设备管理等场景,可以大幅提升调度效率,降低运营成本。再比如金融风控、法律、教培等行业,专家经验宝贵且私密,本地知识库结合自定义工作流可以很好地保护这部分内容不被用户逆向获取。

图 3. 通付盾电网业务安全多 AI Agent 协同矩阵

图 4. 通付盾银行业 AI Agent 智能风控平台

商业成功是新时代的 " 图灵测试 ",小模型是 AI Agent 突破新时代 " 图灵测试 " 的最佳路径。分布式商业和分布式智能也将因小模型的发展而大放异彩。

本文系未央网专栏作者 :汪德嘉 发表,内容属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 大数据 催化剂 机器人 效果
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论