硅星人 10-07
OpenAI苹果化:ChatGPT就是iOS ,几分钟造出的Agent要代替App
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

当地时间 10 月 6 日,OpenAI 在旧金山举办 DevDay 2025 开发者大会。在大会正式开场前 5 小时,AMD 与 OpenAI 的合作消息公布,OpenAI 将在未来数年部署高达 6GW(千兆瓦)的 AMD Instinct GPU。AMD 已向 OpenAI 发行最高 1.6 亿股认股权证,行权条件与芯片部署进度及股价里程碑挂钩,如果 OpenAI 全额行权,可能获得 AMD 约 10% 的股权,AMD 股价一度暴涨 30%。

有开发者吐槽 " 又被资本操作抢戏 ",也有人认为这是刻意编排,先讲底层算力,再讲上层工具,恰好符合 OpenAI 从芯片到模型到应用的一体化叙事。

回到这次 DevDay 上,OpenAI 发布了 Apps SDK(在 ChatGPT 内构建应用的完整框架)、AgentKit(快速构建 AI Agent 的工具套件)、Codex 正式版以及 GPT-5 系列和 Sora2 等模型的 API。Sam Altman 开场公布了一组增长数据,开发者数量从 2023 年的 200 万增长到 400 万,翻了一番。ChatGPT 的周活跃用户从 1 亿飙升至 8 亿,增长了 8 倍;API 每分钟处理的 token 量从 3 亿暴涨到 60 亿,这是 20 倍的增长。

8 亿周活意味着超级应用,这个体量已经具备了成为平台的基础设施。DevDay 中 Apps SDK 是最值得关注的重点,它标志着 ChatGPT 更像一个平台和操作系统了。Altman 的判断很直接,AI 已经从人们玩耍的东西,变成了人们每天构建的东西。这次 DevDay 的目标,就是让更多开发者能直接在 ChatGPT 上构建应用和 Agent,并且在这个拥有 8 亿用户的平台上开发和分发。

OpenAI 开始苹果化了。

Apps SDK:在 ChatGPT 内做应用

OpenAI 曾经尝试过让开发者在 ChatGPT 上构建应用,那就是 2023 年推出的 GPTs。但 GPTs 本质上只是 Prompt 模板,能力有限且生态混乱,已经被 OpenAI 放弃。去年底 Anthropic 推出了 MCP 开放标准,试图为 AI 应用互操作性提供统一框架,而今天发布的 Apps SDK,则是 OpenAI 基于 MCP 标准,再次尝试让 ChatGPT 成为一个应用平台。

Apps SDK 是一个完整的开发框架,让开发者能在 ChatGPT 内部构建真正的交互式应用。开发者可以用 TypeScript 或 JavaScript 编写后端逻辑,通过 MCP 接口连接数据、触发操作,并渲染完全交互式的用户界面。这不是简单的 API 调用,而是在 ChatGPT 对话框里运行的 " 小程序 "。

举几个现场演示的例子就能明白它的能力,Coursera 应用可以在对话中嵌入视频播放器,用户边看课程边向 ChatGPT 提问;Zillow 能展示可筛选的交互地图,用户说 " 找带院子的三居室 ",地图实时过滤结果;Canva 则能直接根据对话生成海报,并把海报转换成完整的 PPT。

OpenAI 还推出了应用对话(Talking to Apps)机制。Apps SDK 提供了一套 API,允许第三方应用将内部上下文实时暴露给 ChatGPT。当你在 Coursera 应用里看到视频第 5 分钟,ChatGPT 知道你正在学什么章节,当你在 Zillow 地图上点开某套房子,ChatGPT 能准确理解你关注的是哪个地址、什么价位。深度集成让对话式交互真正有了实用价值。

现场演示中,当演示者说 "Spotify,给我周五派对做个歌单 ",ChatGPT 自动调出 Spotify 应用,屏幕上显示 " 使用 Spotify 生成此答案 " 的提示,几秒后歌单就出现在对话框里,可以直接点击播放。整个过程流畅自然,就像在 iOS 上切换 App 一样。

首批合作应用包括 Booking.com、Expedia、Figma、Spotify、Zillow、Canva 和 Coursera,未来几周还会加入 DoorDash、Uber、Target、OpenTable 等。Apps SDK 今天开放预览版,开发者可以在 Developer Mode 中测试应用。今年晚些时候,OpenAI 将开放正式提交通道,并提供应用目录供用户浏览。

面向 Apps SDK 开发者的设计规范配图

Altman 还透露了商业化计划,Apps SDK 未来将支持新的 Agentic Commerce Protocol,允许用户直接在 ChatGPT 内部即时结账。

很多人会问 GPTs 不是已经失败了吗,Apps SDK 会重蹈覆辙吗?GPTs 门槛接近零代码,但能力也被局限,回复始终是一条条消息。

Apps SDK 则是代码为中心。开发者需要在自己的服务器上编写真正的应用代码,实现 MCP 服务器接口,声明 OAuth 2.0 登录和交互式 UI 组件。ChatGPT 只是把 App 嵌入对话流里,真正的逻辑、状态管理和数据存储都在开发者手中。Apps 可以弹出富交互组件(地图、表单、视频播放器)、长时间保持 session,并可在后台自行拉取和推送数据。换句话说,GPTs 是模板,Apps in ChatGPT 是完整的小程序。

GPTs 和 GPTStore 既不像 App Store 那样标准化,也不像插件那样通用,多数 GPT 缺乏区别化价值,用户难以形成持续使用习惯,开发者又难以变现、用户难以发现优质内容,最终生态陷入空转。

Apps SDK 则完全不同。开发者必须通过实名验证、服务器验证和功能测试才能上架。审核前置,并引入了年龄分级和权限管理,类似 App Store 的标准。Altman 还暗示会有更正式的收入分成方案。

在 ChatGPT 上,一个新的 iOS 的雏形就这样长了出来。

AgentKit:8 分钟造出的 Agent

Apps SDK 构建的是 ChatGPT 的应用生态,而 AgentKit 则是 OpenAI 给开发者提供的 Agent 开发工具箱。Altman 的判断是,AI 已经从 " 你提问的系统 " 进化到 " 能为你做很多事情的系统 ",也就是 Agent。但他也坦言,符合定义的 Agent 成功落地的很少。

AgentKit 是一个完整的工具套件,包含四个核心组件:

Agent Builder,这是一个可视化画布平台,让开发者能像使用 Canva 一样拖拽设计 Agent 的逻辑、步骤和工作流。它建立在 OpenAI 的 Responses API 之上,支持 if-else 逻辑节点、循环、用户审批节点、文件搜索和数据转换等模块化组件。开发者可以从预设模板开始(如客服机器人、数据增强、文档对比),也可以从零搭建自定义流程。

ChatKit,一个可嵌入的聊天界面组件。开发者可以把这个界面集成到自己的网站或应用中,带来 ChatGPT 级别的对话体验,同时保留自己的品牌、工作流和产品特色。它能处理流式响应、管理对话线程、显示模型思考过程,让集成聊天 UI 的复杂工作变得简单。

Connector Registry,一个企业级的连接管理中心。管理员可以通过控制面板统一管理 Agent 如何连接内部工具和第三方系统,设置权限、监控使用情况,同时保证安全性和合规性。

Agent Evals(评估工具),提供性能测量和优化能力。包括逐步追踪评分(Trace Grading,理解 Agent 的决策步骤)、评估数据集、自动化提示词优化,以及在 OpenAI 平台上直接对外部模型运行评估的能力。

在现场 OpenAI 工程师 Christina Huang8 分钟的演示中。她从零开始,用 Agent Builder 构建了一个名为 Ask Froge 的 DevDay 网站 Agent。快速地将一个静态的会议网站创建一个智能问答助手,以提升用户体验。

她先设置了 Agent 的基本指令,然后添加了预构建的 Guardrails(防护栏)用于 PII 信息掩码,接着连接了 DevDay 的日程数据,最后加入了自定义 Widget 来显示会议时间表。整个过程不到 8 分钟,Agent 就部署到了 DevDay 官网,观众可以现场访问使用。

企业案例中,零售巨头 Albertsons 用 AgentKit 构建了帮门店经理分析销量的 Agent,当某个品类销量下降(比如冰淇淋),系统会基于季节性趋势、历史数据和外部因素(天气、节假日)给出诊断和建议。营销软件公司 HubSpot 则用它改进了 Breeze AI 客服工具,Agent 能整合知识库、查找当地治疗方案和保险政策细节,生成更有针对性的回复。Box、Canva 和 Evernote 也已开始使用该平台。

Altman 说这是我们当初造第一个 Agent 时希望拥有的工具。降低门槛的逻辑很清晰,让更多人能造 Agent,OpenAI 才能抢占 Agent 开发生态的制高点。

而这个生态的门槛因为模型能力提升而足够低的时候,app 就会被 agent 们替代。

Codex 和模型更新

除了应用和 Agent,OpenAI 还宣布了一系列基础设施更新。

Codex 正式可用,OpenAI 的软件工程 Agent Codex 结束研究预览,进入通用可用(GA)阶段。Codex 现在运行在专门训练的 GPT-5-Codex 模型上,这个模型在代码重构和代码审查等 Agentic 编程任务上表现更出色。自 8 月初以来,Codex 的日均消息量增长了 10 倍,已处理超过 40 万亿个 token。

过去两三个月里,开发者社区能明显感觉到 Codex 很火。一方面,OpenAI 用 GPT-5-Codex 把 "AI 代码这条垂直赛道往前推了一步,在代码质量和推理能力上形成优势,另一方面,Codex 提供了价格透明、场景统一、稳定可预期的开发体验。相比之下,不少开发者抱怨 Claude Code 存在限流、质量波动等问题,甚至有人已经把主要精力转到 Codex 上。这次正式发布,是 OpenAI 在代码生成领域持续发力的一步。

OpenAI 展示了内部数据,工程师在使用 Codex 后,每周完成的 Pull Request 数量提升了 70%,几乎所有 OpenAI 的 PR 都经过 Codex 审查。Codex 还新增了三个企业功能:Slack 集成(可以直接在团队频道里让 Codex 写代码或回答问题)、Codex SDK(让开发者在自己的工作流中嵌入 Codex 能力)、以及管理工具(包括环境控制、监控和分析仪表板)。

模型和 API 更新方面,GPT-5 Pro API 向所有开发者开放,这是 OpenAI 目前最智能的模型,专为需要高精度和深度推理的场景设计,如金融建模、法律文件分析和医疗诊断,定价为每百万输入 token 15 美元、每百万输出 token 120 美元。

OpenAI 刚刚发布全新的 Sora 2 模型及同名 Sora App,应用上线后迅速走红,Sora 2、Sora 2 Pro API 也进入预览阶段,这个新一代视频生成模型在可控性上有巨大飞跃,能根据详细指令生成风格化、构图精良的视频,还能配上丰富的声音景观、环境音频和同步音效。Sora 2 输出每秒 0.1 美元,Pro 输出每秒 0.3 美元。

GPT-Realtime-Mini 则是一个更小、更便宜的语音模型,比之前的高级语音模型便宜 70%,但音质和表达力保持一致。OpenAI 认为语音将成为人们与 AI 互动的主要方式之一,更经济的模型能让语音应用更快普及。

平台化的野心

这次 DevDay 最重要的信号是,ChatGPT 不再只是一个 Chatbot,而是正在成为一个完整的应用平台。Apps SDK 让开发者能触达 8 亿用户,AgentKit 降低了 Agent 开发门槛,Codex 提升了软件开发效率。OpenAI 正在构建一个从应用分发、开发工具到基础设施的完整生态。

从现场演示来看,这些 Agent 更像是对话式的 App,它们依然需要后端逻辑、数据管理和 UI 交互,只是把入口从图标点击变成了自然语言对话。这是交互方式的革命,但软件开发的本质没有改变,你还是需要懂业务、懂技术、懂用户需求。

苹果推出 App Store 时,没人想到十年后会有几百万个 App。OpenAI 推出了 Apps SDK,现在的问题不是 Agent 是否会替代 App,而是开发者们是否真的会来,在 ChatGPT 上 "Build something new"。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

amd 芯片 旧金山 基础设施 界面
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论