Agent之战，微软把家底都押上了

文 | 世界模型工场

6 月 2 日，微软办了一场眼花缭乱的 Build 2026 开发者大会。

自研大模型、系统级安全沙箱、企业数据层、开发者工具、AI 硬件……新产品、新功能一口气发了 20 多个。

但这些产品全都指向一件事：Agent。

在全行业都在拼 Agent 的当下，微软显然急了。

让企业级 Agent 放心上岗

如今 Agent 是 AI 行业最热的词，但要做好 Agent 并不容易。

一个真正能干活的 Agent，首先要拿到权限。

它需要权限读取你的文件，需要知道你在做什么、和谁协作、有什么待办，需要在帮你发出邮件之前确认不会闯祸。

权限给少了，Agent 就只能停留在建议阶段。但权限给多了，风险又会迅速放大。

这不是某一个 Agent 产品就能解决的问题，尤其是在企业级工作环境中，一个能干活的 Agent，需要的是一整套基础设施。

这正是微软 Build 2026 发布会最值得关注的地方，它在给企业级 Agent 搭建了一套 " 上岗 " 的地基。

此次微软发布的所有东西，本质上都是建设这套基础设施：

底层是芯片和云，往上是模型，再往上是安全执行环境，然后是上下文数据，最上面是用户看得见的 Agent 应用，每一层都有对应的发布。

丨 Agent 产品层：用户直接感知和使用。

Scout 是本次最核心的 Agent 产品之一。它可以常驻在 Microsoft 365 工作流中，并与 Teams、Outlook、OneDrive 等办公应用协同。

它可以像同事一样接收指令，浏览你的邮件、日历、工作消息，自动处理会议冲突、起草回复、推进任务。

Agent 365 则更像企业管理 Agent 的控制台，用来统一管理 Agent 的身份、权限、策略和风险。

另外一款 Agent 产品，是 GitHub Copilot 发布的全新桌面应用，提供统一的 " 我的工作 " 视图，多个编程 Agent 可以并行运行在独立的代码分支上。

丨上下文层：让 Agent 知道你在做什么。

Agent 要替你干活，前提是它得读懂你的工作环境。

微软发布的 Microsoft IQ 体系，把 Work IQ、Fabric IQ、Foundry IQ 等能力串起来，让 Agent 理解企业里的邮件、会议、文档、组织关系、业务数据和工作流。

丨安全执行层：让企业敢用 Agent。

Agent 越自主越危险，这是企业大规模部署 Agent 最大的顾虑。

微软的答案是 MXC（Microsoft Execution Containers）。

它是由 Windows 执行安全边界的 Agent 运行时 / 沙箱能力，让开发者和企业管理员可以限制 Agent 能访问什么、能操作什么，并把 OpenClaw 等本地 Agent 放进受控环境中运行。

Windows 365 for Agents，则是给 Agent 配了一台受控的 Cloud PC，让它可以在云端 Windows 环境里操作应用、浏览器和企业系统。

丨开发平台层：让 Agent 从 demo 走向生产。

有了底层基础设施，下一个问题是，开发者怎么把 Agent 真正做出来、部署上线、并且持续迭代？

为此，微软推出和升级了 Foundry、Microsoft Agent Framework、Foundry Toolboxes、Rayfin、GitHub Copilot App。

企业可以在这里选择模型、接入工具、定义工作流、观察 Agent 调用了什么、失败在哪里。

丨硬件层：给 Agent 配上本地算力。

Agent-first 硬件原型 Project Solara，是这次比较有想象力的发布。

微软展示了两个概念参考设计：

一个是 badge device，类似胸牌 / 可穿戴设备，让 Agent 跟随用户离开桌面，进入会议、移动办公、免手持场景。

另一个是 desk device，类似桌面 Agent 伴侣设备，强调常驻、环境感知、随时可用。

这表明微软不想让 Agent 只活在软件里，也想提前卡位 AI 硬件入口。

丨模型层：为 Agent 提供自研模型。

这次最值得单独说的，是模型层。以上这些层，都需要一个可控的模型层来驱动。

微软这次推出了七款完全自研的 MAI 模型，覆盖推理、编程、图像、语音、转录。

其中，最重要的是推理模型 MAI-Thinking-1。

微软称，这是 Microsoft AI 的第一个自研推理模型，拥有 350 亿活跃参数和 256K 上下文窗口，面向复杂多步骤指令、长上下文推理和代码生成。

微软还特别强调，自研模型从零训练，未使用第三方前沿模型蒸馏。

这句话是在告诉市场，微软不只是 OpenAI 的最大渠道商，它也有自己的模型底座。

MAI 不一定是为了和 GPT、Claude 正面硬拼，但可以给微软自己的 Agent 提供一个成本可控、可调度的模型底座。

微软不可复制的优势

微软一次性发布了这么多款产品，其实就是在回答一个现实问题：

企业到底怎样才能放心用 Agent？

微软的答案是，模型要可控，上下文要打通，Agent 要有身份，权限要可配置，执行环境要隔离，行为要可审计，硬件入口也要提前布局。

这才是这次 Build 2026 的真正主线。

对企业用户来说，这套体系解决了他们此前不敢放手使用 Agent 的核心顾虑。

为什么微软能做得这么彻底？

因为它有一个别的公司很难模仿的优势，就是它已经在企业里了。

微软的 Office、Teams、Outlook、GitHub、Azure，这套组合覆盖了全球数亿企业员工和开发者一天里几乎所有的工作界面。

处理邮件在 Outlook，开会在 Teams，文件在 SharePoint，代码在 GitHub，身份权限在 Entra，设备管理在 Intune，云服务在 Azure。

微软推 Agent，不需要重新找用户，也不需要说服企业换工具，Agent 只需要沿着这张已经铺好的网络用起来。

没有哪家公司像微软一样，能同时坐拥企业工作流的每一个关键节点。

这种结构性优势，是后来者无法在短时间内复制的。

企业级 Agent 竞争激烈

但优势不等于安全，微软同样站在压力之下。

企业级 Agent 市场竞争非常激烈，OpenAI、Anthropic、Google、Salesforce 等厂商，都在往同一个方向涌。

原因很简单，这是 AI 真正变现的地方，企业愿意为降本增效的工具付钱。

在这场竞争中，微软其实已经晚了。

第一层压力来自 OpenAI、Anthropic 等模型厂商。

从 2023 年起，OpenAI、Anthropic 就开始推进企业级 AI 业务。

如今 Anthropic 的 Claude Code 在开发者里建立了相当高的心智占有率，Anthropic 主导推出的 MCP 协议正在成为 Agent 连接外部工具的事实标准。

更关键的是，OpenAI、Anthropic 的模型能力在推理、编码、多步骤任务上仍处于第一梯队，这是企业选择 Agent 底层的核心考量。

但模型能力是微软始终未能建立的护城河。

对于那些更看重 Agent 够不够聪明的企业，微软的综合平台优势，并不能完全弥补模型能力上的差距。

第二层压力来自 Google。

Google 的打法和微软几乎类似，同样靠自己的企业办公生态带 Agent 入场。

Gemini for Google Workspace 已经深度嵌入 Gmail、Docs、Drive、Meet，面向的恰好是微软在大企业里最强的那些场景。

Vertex AI Agent Builder 让企业在 Google Cloud 上构建和部署自定义 Agent，A2A 协议推动多 Agent 协作标准化。

但 Google 还有额外筹码，搜索和实时信息能力可以让 Agent 读懂世界，没有哪家公司比 Google 更擅长这件事。

在 Google Workspace 的重度用户群体里，微软并不天然占优。

第三层压力来自垂直领域的蚕食者。

Salesforce 推出的 Agentforce 把 Agent 能力深度嵌进 CRM 流程，直接在销售、客服、营销这些高频企业场景里落地。

ServiceNow 的 Now Assist 则在 IT 服务管理、HR 流程、企业工单这些内部运营场景里，构建 Agent 闭环。

这些 SaaS 软件平台的威胁，不是正面竞争微软的底座，而是在微软平台覆盖不到的垂直领域，把客户锁定。

等微软的 Agent 生态成熟时，这些场景的入口已经被占了。

写在最后

微软在 Build 2026 上展示的这张蓝图，逻辑上是自洽的，覆盖也足够全面。

但蓝图和落地之间永远有距离，真实企业环境里能跑成什么样，还需要时间验证。

不过有一点是确定的，微软迈出这一步，Agent 的可用性在企业和开发者眼里又往前推了一步。

对整个行业来说，这场竞争加速了，对所有人都是好事。

宙世代

一起剪

相关标签