智东西 1小时前
数十亿AI员工上岗倒计时!云计算一哥“没有魔法,只有真能解决问题的Agent”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西​

作者 | 李水青

编辑 | 漠影

2025 年的大模型产业正在经历一场静默的分化。一边,少数明星模型的参数竞赛依然激烈;另一边,一个更根本的转变已在基础设施层悄然发生:

AI 的价值实现路径,正从 " 模型能力展示 " 转向 "Agent 实际部署 "。

亚马逊云科技 CEO 马特 · 加曼(Matt Garman)在今日凌晨举办的 2025 re:Invent 主题演讲中直言:"Agent 的出现使我们在 AI 轨迹上发生了变化——从一个技术奇迹的时代,转向真正获得价值的时代。"

他的判断基于一组反差强烈的数据:一方面,生成式 AI 引发全球狂欢,Amazon Bedrock 已服务超过 10 万家企业,其中 50 多家客户处理了超 1 万亿 tokens;另一方面,许多企业仍未看到 AI 投资带来相匹配的业务回报。

Garman 在讲解 Amazon Bedrock 落地情况

"Agent 是企业从 AI 投资中获得实质性商业回报的地方。"Garman 揭示了一个关键转折点," 我相信,在未来每个公司内部和每个可以想象的领域都会有数十亿的 Agent。"

一场重新定义 AI 价值实现的竞赛已经打响。在亚马逊云科技 2025 re:Invent 的舞台上,AI 芯片性能飙涨 600%,构建 AI Agent 的四大技术支柱同步升级,Agent 部署的全栈战争已经升级 …… 到底什么才是企业抓住这场变革红利的抓手?

云计算一哥的一招一式,都给了我们解答 Agent 变革时代之问的绝佳参考。

Garman 在讲解 Agent 部署的所需要素

一、重新定义 AI Infra:自研芯片与「AI 工厂」的双重革命

算力竞争已进入云巨头自主可控、性能狂飙的阶段。亚马逊云科技在 2025 re:Invent 上亮出了其最尖端的武器:基于自研 3nm 芯片的 Amazon EC2 Trainium 3 UltraServers 服务器正式全面推出,而下一代 Trainium 4 芯片的性能参数更令人震撼。

" 如果看看今天在 Amazon Bedrock 上运行的所有推理,大多数实际上已经由 Trainium 驱动了。"Garman 透露。更令人印象深刻的是,亚马逊云科技已部署超过 100 万颗自研 Trainium 芯片,而上一代 Trainium 2 的量产速度是其此前芯片的 4 倍。

最新性能数据揭示了这场算力革命的紧迫程度:基于首款云端 3nm AI 芯片 Trainium 3,亚马逊云科技最新推出的 Amazon EC2 Trainium 3 UltraServers 服务器,最极致的配置将 144 颗 Trainium 3 芯片互连,提供 362PFLOPS(FP8)算力和超过 700TB/ 秒的总带宽。

该服务器提供相比前代 Trainium 2 的 4.4 倍的计算性能、3.9 倍的内存带宽提升,而能效比指标——每兆瓦电力处理的 AI token 数量——提升了 5 倍。

Amazon EC2 Trainium 3 UltraServers 服务器性能情况

更值得一提的是,对于下一代 Trainium 4,亚马逊云科技承诺了更大幅度的飞跃:预计提供 6 倍的 FP4 性能,4 倍的内存带宽,2 倍的内存容量,并支持通过 NVLink Fusion 和 UALink 进行扩展,专为全球最大的模型训练需求而生。

但芯片性能只是故事的一半。亚马逊云科技同时推出了更具战略意义的 Amazon AI Factories(AI 工厂)服务——允许企业在自己的数据中心部署专用 AI 基础设施,同时享受亚马逊云科技的全套服务和管理。

这一举措直击企业生成式 AI 出海和全球化部署中的核心痛点:数据主权、合规要求与性能需求的平衡。企业可以在本地维护数据控制权,充分利用既有空间与电力资源;同时获得与公有云相同的先进 AI 能力,无缝接入从 Trainium、英伟达 GPU 到 SageMaker 和 Bedrock 的全栈 AI 服务。

二、模型生态的多元主义:自研模型超 GPT-5.1,中国模型占 1/4 席位

与追逐 " 万能模型 " 的潮流相反,亚马逊云科技选择了多元化的模型战略。" 我们从不相信会有一个模型统治一切。"Garman 明确表示," 相反,会出现很多伟大的模型。"

这一理念在 Amazon Bedrock 平台上得到充分体现。过去一年,Amazon Bedrock 平台提供的模型数量翻倍,2025 re:Invent 上新增的 18 款全托管开源模型也包含 4 款中国顶尖模型,中国模型占 1/4 席位,包括千问、DeepSeek、Kimi 及 MiniMax 多家模型已上线 Amazon Bedrock 平台。

对中国企业而言,这意味着在出海和全球化过程中,可以获得更贴近本土技术特点的生成式 AI 支持。对全球用户而言,这代表了更广泛的技术选择。

亚马逊云科技最新推出的自研的 Amazon Nova 2 系列模型则展示了另一种可能。四款新型号覆盖了从轻量推理到复杂多模态的全场景需求:

Amazon Nova 2 Lite:是一款快速且经济高效的推理模型,拥有不错的指令遵循、工具调用、信息提取、代码生成等能力,在上述四大领域的能力基本全面超越了 Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash 等轻量级模型,仅在编程能力上略逊于 GPT-5 mini。

Amazon Nova 2 Pro:是 Nova 系列中最智能的推理模型,支持文字、图像、视频、语音四种模态输入和文本模态输出,适用于高度复杂的工作负载,尤其是 Agent 场景。在两项 Agent 基准测试中,其表现已经超过了 GPT-5.1(high)、Gemini 3 Pro Preview(high)等前沿模型。

Amazon Nova 2 Sonic:下一代语音转语音模型,能为 AI 应用提供实时、类人的对话式 AI 体验。在语音理解和推理任务上,其性能已经超过了 GPT Realtime、Gemini 2.5 Flash 等。

Amazon Nova 2 Omni:是业界首个支持文本、图像、视频和音频输入,并支持文本和图像生成输出的推理模型。不过,亚马逊云科技尚未公布其基准测试成绩。

Amazon Nova 2 Omni 发布现场

可以看到,特别是在 Agent 关键能力的基准测试中,Amazon Nova 2 Pro 展现了令人印象深刻的性能,这直接回应了企业对于生成式 AI 在实际业务场景中可靠性的关切。

尤其是在企业出海的场景中,选择至关重要(Choice Matters)。AI 的未来不会仅由 1 个模型统治,过去一年 Amazon Bedrock 上提供的模型数量已经翻倍,DeepSeek、Qwen 等中国模型也在支持范围之内,这位中国企业的出海业务部署 Agent 提供了丰富选择。

三、数据与模型深度融合:开放训练模型打破 "RAG 局限 "

" 你的数据是独一无二的,这就是你与竞争对手的区别。"Garman 反复强调这一观点。然而,传统的数据与模型结合技术如 RAG(检索增强生成)只能帮助模型更有效地导航数据,无法让模型真正 " 理解 " 企业的深层次领域知识,这也成为 Agent 价值释放的 " 拦路虎 "。

亚马逊云科技的革命性的解决方案是:Amazon Nova Forge 服务,该服务引入了 " 开放式训练模型(Open Training Model)" 的概念。

亚马逊云科技推出 Amazon Nova Forge 服务

通过这项服务,企业可以在模型训练的任意阶段,将自己的专有数据与亚马逊的训练数据集混合,创建名为 "Novellas" 的定制模型。这一方法解决了传统微调中的核心矛盾——在教授模型新领域知识的同时,避免其 " 遗忘 " 已掌握的核心推理能力。

Amazon Nova Forge 还提供了使用远程奖励函数和强化学习微调的能力,以进一步改进模型,让企业可以将真实环境集成到训练循环中。由于基础模型已经理解业务,这些后训练技术实际上会变得更加有效。

索尼是这一服务的早期采用者。通过对 Amazon Nova 2 Lite 模型进行微调,索尼创建了深度理解自身业务和运营的定制模型,在引用一致性和文档依据等任务上表现优于基准模型,目标是将合规审查和评估流程的效率提升 100 倍。

可以看到,对于寻求通过生成式 AI 实现差异化竞争优势的企业而言,这一能力至关重要。它意味着企业可以构建真正理解自身业务逻辑、流程和知识的 Agent,而非仅仅使用通用的 AI 工具。

四、回归一件事:没有魔法,只有可部署的 Agent

2025 re:Invent 上最引人注目的发布,或许是三类 " 前沿 Agent" 的推出。这些 Agent 代表了 AI 能力的一次阶跃式提升:自主、大规模可扩展且能长期运行,也给广大开发者打了个样。

三类前沿 Agent 展示了 AI 重塑软件开发和运营的潜力:

Kiro autonomous agent 彻底改变了开发范式。它与市面上常见的代码补全助手不同,而是能够自主处理复杂任务,如升级关键库时,自动识别所有受影响服务,分析使用模式,按规范更新代码,运行完整测试,并一次性创建所有合并就绪的拉取请求。亚马逊内部的一个案例显示,原本需要 30 名开发者 18 个月完成的重架构项目,使用 Kiro 后仅需 6 人 76 天完成。

亚马逊云科技推出 Kiro autonomous agent

Amazon Security Agent 是一个持续、主动、内置的 AI 安全专家。将安全实践从 " 事后检查 " 变为 " 持续嵌入 "。它能在设计阶段审查文档,编码过程中扫描漏洞,并将渗透测试从昂贵的一次性活动转变为按需的持续验证过程,从而确保安全性。

Amazon DevOps Agent 重新定义了运维响应机制。当警报触发时,它能立即诊断根本原因,提供修复方案,使工程师能够专注于决策而非排查。这一能力对于保障全球化业务的连续性至关重要。

Agent 开发的基础设施同样得到加强。Amazon Bedrock AgentCore 自 SDK 预览版发布以来,5 个月内下载量超过 200 万次。新增的两项功能直接应对企业部署 Agent 的核心关切点:

Amazon AgentCore Policy(预览版):为 Agent 与企业工具及数据的交互提供实时确定性控制。

它允许开发者在 Amazon AgentCore Gateway 工具调用运行前拦截,使用带有细粒度权限的策略,为 Agent 行为定义明确的界限,如使用哪些工具、如何使用工具,开发者也可以通过自然语言创建标准,如 " 报销金额大于 1000 美元时,就阻止退款 " 等。

亚马逊云科技推出 Amazon AgentCore Policy

Amazon AgentCore Evaluations(预览版):根据实际行为持续检查 Agent 质量。

这是一项全托管服务,开发者可以使用内置评估器来衡量常见的质量维度,如正确性、帮助性、工具选择准确性、安全性、目标成功率和上下文相关性,还可以创建基于模型的定制评分系统,根据自己选择的提示和模型进行业务定制评分。

亚马逊云科技推出 Amazon AgentCore Evaluations

除了上述更新,Garman 还在最后 10 分钟公布了 25 个新发布,包括搭载第五代 AMD EPYC 处理器的 X8i Instances、搭载英特尔至强 6 的 C8ine Instances、EC2 M3 Ultra Mac Instances 等覆盖计算、存储、数据库、大数据、安全等多个领域的新品,这些都为企业 Agent 部署提供了稳定坚实的支撑。

结语:AI 进入 Agent 时间,价值落地之战打响

当 AI 进入 Agent 时间,2025 re:Invent 的舞台展示了亚马逊云科技对 Agent 时代的全面布局,这不再是一场单点技术的竞赛,而是全栈能力的比拼,其正在构建一个支持 Agent 从实验到落地生产的完整平台。

当下,每个产业人士都在见证生成式 AI 从技术演示走向商业价值,价值落地之战已打响。云巨头的这种 " 全家桶 " 式的全栈能力,或许正是企业将 AI 投资转化为实际业务回报所需要的基础设施。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 云计算 芯片 亚马逊云 amazon
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论