Techweb 05-28
微软、谷歌下场围剿Cursor ,AI编程格局生变
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

AI 编程领域开始进入混战模式,大厂也在开启 " 降维打击 "。

近期,先是 OpenAI 宣布 Codex Agent 编程模式,微软正式开源 GitHub Copilot Extension for VS Code 项目,而后谷歌就公布其 AI 编程 Agent 工具 Jules 私有预览版,紧接着大模型创企 Anthropic 也正式发布新一代模型:Claude Opus 4 和 Claude Sonnet 4,作为面向 AI 编程能力的最强模型加持。

这些动作背后其实都在共同指向一类对手:当前最热门的 AI 编程助手 Cursor、Windsurf 等,这些风头正劲的创业企业在别人的规则下,如何继续玩下去?对于微软和谷歌等大厂而言,AI 编程有利于补强云服务生态黏性。对于同时提供 B 端和 C 端服务的大模型公司,提供擅长编码任务的模型 + 下探到 Agent,可能是在大模型商业化路径上的一次重大机会点。

异步 + 混合

微软对于 AI 编程的布局更为体系化,围绕生态布局,而谷歌从近期的打法上看,则更围绕产品服务。

对于微软而言,GitHub Copilot 是自 2021 年起作为主流集成开发环境 IDE 如 VS Code 的插件而提供给用户。因此开源 GitHub Copilot Extension for VS Code 的核心第一步其实就先将插件开源。据微软团队所述,接下来几个月内,还要将 GitHub Copilot 扩展的 AI 功能引入到 VS Code 开源存储库。也就是说,后续开发者基于 VS Code 无需插件就可以体验到 GitHub Copilot 功能。

对于这一点,微软的解释是:通过开源 GitHub Copilot 插件,能够与更大的社区合作,并更快推向市场,与 AI 编程软件开发生命周期保持一致。

微软此举可能意在与 Cursor 竞争,毕竟 Cursor 是对 VS Code 进行魔改了,虽然耗费了大量技术和工程能力,但从结果上看,Cursor 获得了大量用户的欢迎,这显然对微软 VS Code 的开源生态带来了不小触动。

此前 Wing VC 合伙人 Zachary DeWitt 在其专栏中提醒道:" 微软也可能简单地切断 Cursor 和竞争对手与 VS Code 核心 API 的连接或更改条款,使其更难在更新的基础上构建。Cursor 对 VS Code 的依赖显示了建立在他人平台上的不稳定性。"

如今来看,大企业支持开源的核心目的是构建自己的生态圈,吸引高质量开发者和高质量代码贡献,但这并不意味着开源不会存在商业冲突。从最近修改 VS Code 插件许可协议就能明显看出微软的不满,着手生态战是必然。

再看谷歌。如果不是 I/O 大会,外界对谷歌的印象还停留在:遭遇美国司法部的反垄断诉讼案,以及对 AI 搜索市场的格局影响性上。

最近半年,谷歌对 AI 编程也在暗戳戳布局,先是对其 AI 编程助手 Gemini Code Assist 进行免费,又或者推出新的人工智能集成开发环境 Firebase Studio。不过直到现在,谷歌还没有推出一款能够引领此次 AI 编程潮流的重量级产品。

去年 12 月,伴随 Gemini 2.0 大模型发布亮相,谷歌就发布了 AI 编程 Agent 代理 Jules。此次升级后,Jules 则基于 Gemini 2.5 Pro 大模型,针对编码能力进行优化。

据谷歌官方介绍,Jules 可以将复杂的任务分解成更小的步骤,根据用户指令进行调整,并运行单元测试来验证其工作。Jules 并非一款简单的代码自动补全工具,其功能覆盖了从开发到测试的多个环节,能够在云端启用虚拟机、复制 GitHub 仓库、规划多步骤开发任务,并自动执行包括 Bug 修复、版本升级、测试编写以及代码优化等操作。最终,Jules 会生成 Pull Request(PR)供开发者审查,确保代码质量与项目进度。

不过,此次 Jules 升级后最大的不同的是聚焦 " 异步任务 " 编码,这与此前所熟知的 " 实时协作 " 不同。例如,Cursor 和 Windsurf 这些工具通常与开发人员需要实时协作,在输入代码时提供代码建议或重构代码,本质上充当了 IDE 角色。而 " 异步任务 " 则意味着开发者无需逐行交互地工作,而是为 Agent 分配一个特定的、可能很复杂的编码任务,然后 Agent 将接管该任务,在后台进行独立处理,并在完成工作后呈现。

值得注意的是,微软本周宣布 GitHub Copilot 升级为全功能编程 Agent,同样具备 " 异步任务 " 的自主代理模式。Copilot Agent 最初于今年 2 月推出预览版。

调用 Copilot Agent 后,开发者可分析整个代码库、跨文件编辑、生成和运行测试、修复错误,甚至建议终端命令,并在代码投入生产之前帮助解决这些问题,所有这些都只需一个提示即可完成。

目前 Agent 功能是直接嵌入到 GitHub Copilot 中,一旦用户分配任务,该 Agent 就会开始工作。

不过这在谷歌看来,二者产品还是有所不同:Copilot Agent 类似于单个开发人员独自执行计划,而 Gemini 则采用 " 混合 Agent" 方法,需要多个专业 Agent(如开发人员、测试人员和安全分析师)协同工作。这些 Agent 本质上是 " 彼此对抗的合作者,以便检查彼此的工作 ",类似于聊天室里的虚拟团队。

同样在本周,OpenAI 发布 Codex Agent 版本,由新模型 codex-1 加持(codex-1 是 OpenAI o3 的一个版本,针对软件工程进行了优化),不仅能在云端沙盒环境中安全地并行处理多项任务,而且通过与 GitHub 无缝集成。

OpenAI 认为,异步多 Agent 将成为生产高质量软件的默认方式,实时和异步这两种模式将融合成一个统一的工作流程,让开发者能够在 IDE 和日常工具中与 AI 无缝协作。为此针对 Agent 模式,OpenAI 也在计划构建一套工具,能同时支持实时协作和异步任务。

从当前几家的行动路径上看,异步 + 混合这种模式,由于更接近于自主编码的早期愿景,也正成为接下来 AI 编程产品的探索方向之一。

当大模型厂商下场做编程应用

当然,眼下眼热的可不只是微软、谷歌等大厂,大模型厂商也在暗自发力。

AI 编程作为 OpenAI ChatGPT 的一大优势,也是超过 1500 万人订阅的核心原因之一。尤其是 OpenAI 的 Codex,最初它只是一个编程模型,但现在来看它能提供的已经是一个能够在独立沙箱中编写代码、修复错误并回答代码库问题的编程助手。

Anthropic 的 Claude 模型也在遵循这一节奏。此前,基于 Claude 进行软件开发已经占其所有交互的十分之一以上,Claude 3.5 Sonnet 就因为擅长编码任务,并且对软件工程原理的出色掌握和应对复杂编程挑战的能力而被开发人员广泛使用,包括 Cursor 等 AI 编程产品就主要基于 Claude 3.5 Sonne 提供服务。而微软为了不依赖 Codex,也在今年宣布为开发者引入多模型选择,其中就包括 Claude 3.5 Sonnet。

据 Anthropic 首席科学官贾里德 · 卡普兰 ( Jared Kaplan ) 表示,Anthropic 去年年底就停止了对聊天机器人的投资,转而专注于提高 Claude 执行复杂任务的能力,甚至编写整个代码库。

而此次 Anthropic 将 Claude Opus 4 和 Claude Sonnet 4 升级,均针对编程能力进行了优化。与此同时,Anthropic 还发布 AI 编程助手 Claude Code,通过与 VS Code 和 JetBrains 等主流 IDE 集成,并基于自家的 Claude Opus 4 模型,可直接嵌入到用户业务流中。

结合当前水平来看,AI 编程产品发展具有以下四个阶段:

一是预测文本,用于简单的代码补全。

二是聊天,用于编码任务的人工智能辅助对话。

三是协作 " 氛围编码 ",使用人工智能进行广泛、协调的代码更改。

四是 Agent 代理模式,人工智能在后台自主运行,可能在没有直接监督的情况下做出改变。

显然,具备了编程模型能力的大模型厂商很快也都会走完这一轮产品迭代。当微软有了 GitHub Copilot Agent,谷歌上线 Jules,Anthropic 这类大模型厂商的动作可能不远了。

可能现在最慌的还是 Cursor、Devin 等上层应用厂商了。Cursor 其实也在留有后手,值得一提的是,去年 Cursor 的开发商 Anysphere 推出了自研 Cursor-Fast,其代码生成能力据称介于 GPT-3.5 与 GPT-4 之间。

当 AI 编程竞赛进入混战模式,模型能力正成为一切不确定性中的确定因素。从第一性原理出发,模型性能的强弱决定了竞争力,尽管开发者可根据场景选择最适合的基础模型,但最终只会选择一两个好的大模型。(杨丽)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

编程 微软 ai 谷歌 开源
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论