
智东西
作者 | 程茜
编辑 | 云鹏
OpenAI 的 AI 浏览器终于来了!
智东西 10 月 22 日消息,今天凌晨,OpenAI 发布自家首款内置 ChatGPT 的浏览器 ChatGPT Atlas。这也意味着,OpenAI 正式向谷歌在浏览器领域的霸主地位发起挑战。
先来看 Atlas 的核心功能:内置 ChatGPT,可在网页窗口任意位置调用完成任务;拥有浏览器记忆,可以记住曾访问网站的上下文;通过 Agent 模式执行工作,现在更擅长在用户浏览网页时研究和分析、自动化任务以及计划活动或预约。

再来看谁可以用:目前,Atlas 已经向 macOS 的免费、Plus、Pro、Go 订阅用户开放下载,Windows、iOS 和安卓用户体验稍后开放。Atlas 中的 Agent 模式仅向 Plus、Pro 和 Business 用户提供了预览版。
智东西下载初步体验了 Atlas 后发现,其基本的操作模式与谷歌等浏览器类似,相当于将 ChatGPT 直接嵌入浏览器,且从功能来看 Atlas 与其他 AI 浏览器并没有较大差距,或许还需要体验一段时间,当其拥有更多浏览器记忆,才能有更多差异化的用户体验。
OpenAI 联合创始人兼 CEO 萨姆 · 阿尔特曼(Sam Altman)称," 我们认为 AI 代表了重新思考浏览器功能的难得机会。"OpenAI 将 ChatGPT 视为 Atlas 跳动的心脏。ChatGPT 可以帮助用户采取行动,如预订航班、编辑文档等,此外用户可以在设置中查看和管理浏览器的记忆,以及打开隐身窗口。

这场直播阿尔特曼还邀请了多位 OpenAI 员工,包括从事训练后研究的威尔・埃尔斯沃思(Will Ellsworth)、ChatGPT 搜索功能的产品负责人亚当・弗赖伊(Adam Fry)、曾参与开发谷歌浏览器(Google Chrome)和火狐浏览器(Mozilla Firefox)的深员工本・古杰(Ben Goodger)、界面设计师瑞安 · 奥鲁克(Ryan O ’ Rouke)、曾任职于苹果公司的贾斯汀・拉辛(Justin Rushing),以及普拉纳夫・维什努(Pranav Vishnu)。
不知这场发布结束后,OpenAI 这些员工会不会又被挖走 ……

上图从左至右:Ryan O ’ Rouke、Ben Goodger、Adam Fry,下图从左至右:Pranav Vishnu、Justin Rushing、Will Ellsworth(上下图最右侧均为 Sam Altman)
Atlas 还支持安装谷歌扩展程序,也有网友称,这只是 ChatGPT+ 各种谷歌浏览器标签的组合。
也有 AI 浏览器的用户发声,称 Atlas 遇到了其之前在使用 Perplexity 推出的 Comet 浏览器时遇到的相同问题。在计算和总结大数据或单击复杂 SaaS 中的按钮时出现问题, 例如他们甚至都无法填写时间表,这令人失望,希望等待几个季度让这些系统变得更好。

Perplexity 本月早些时候免费推出了 Comet 浏览器,谷歌今年 9 月在自家谷歌浏览器中嵌入了 Gemini 模型。伴随 OpenAI 正式入局,AI 浏览器之战再度升温。
下载地址:chatgpt.com/atlas
一、登录即可导入其他浏览器数据,设置默认浏览器领 7 天会员
Atlas 的入门很简单:用户打开 Atlas,登录自己此前的 ChatGPT 账号然后即可选择从其他浏览器倒入历史数据,不过目前只有谷歌和 Safari 浏览器可选。

值得一提的是,现在将 Atlas 设置为默认浏览器,用户还可以获得限时 7 天的 Atlas 消息发送、文件上传、数据分析以及图片生成功能的扩展限额。
Atlas 的提问方式主要有以下几种:在 Atlas 的搜索框中直接提问;输入链接基于整篇网页内容提问;使用光标选中部分文字进行内容编辑。

智东西在 Atlas 中打开 OpenAI 的发布链接,然后要求其 " 用通俗易懂的语言逐步解析这篇帖子 ",就可以得到右侧的结果,其按照 Atlas 是什么、有什么好处、安全性等结构进行了梳理。

智东西用光标选中文章中的某个部分并提问,Atlas 会根据上下文做出回应。

此外,ChatGPT 可以记住用户探索过的内容并建议下一步该做什么,如返回此前打开的页面、深入挖掘主题、提出相关想法还是自动执行日常任务。
AI Agent 功能可以在 Atlas 中以更快速度和原生方式运行,目前这一功能仅向 Plus、Pro 和 Business 用户提供了预览版,
如用户计划晚宴时将食谱交给 ChatGPT,它就可以它找到一家杂货店,将所有食材添加到购物车中,然后订购到家。
在工作中,ChatGPT 可以帮助用户打开并阅读过去的团队文档,进行新的研究,并将见解汇编成团队简报。
当用户提出问题时,ChatGPT 可能会询问是否应该开始打开选项卡并单击浏览器以完成任务,用户也可以选择 Agent 模式按钮来启动 ChatGPT。
二、浏览器记忆是用户私有内容,为 Agent 功能添加多重安全保障
在安全与隐私保护方面,用户可以控制 ChatGPT 在自己浏览时可以看到和记住的内容,包括清除特定页面、清除整个浏览历史记录或打开隐身窗口以暂时注销 ChatGPT。
如果用户打开浏览器记忆,ChatGPT 会记住其浏览内容中的关键细节,以改进聊天响应并提供更智能的建议,例如根据用户最近的活动创建待办事项列表或根据您查看过的产品继续研究节日礼物。
但这些记忆是用户 ChatGPT 帐户的私有内容由用户控制。用户可以在设置中查看、存档并清除浏览历史记录。即使浏览器内存处于打开状态,用户也可以使用地址栏中的切换开关来决定 ChatGPT 可以或不能看到哪些网站。当可见性关闭时,ChatGPT 无法查看页面内容,并且不会从中创建任何记忆。

对于 Agent 模式,OpenAI 提到,他们优先考虑了安全性并添加保护措施,以应对在代表用户采取行动时访问登录站点和浏览历史记录可能带来的新风险,包括:
Agent 无法在浏览器中运行代码、下载文件或安装扩展;
Agent 无法访问用户计算机或文件系统上的其他应用程序;
Agent 将暂停以确保用户正在观察它在特定的例如金融机构等敏感站点上采取行动;
可以在注销模式下使用 Agent,限制其对敏感数据的访问以及像用户在网站上一样执行操作的风险。
此外,Agent 还容易受到隐藏的恶意指令影响,这些指令可能隐藏在网页或电子邮件等地方,目的是这些指令覆盖 ChatGPT Agent 的预期行为。基于此,OpenAI 也提到,随着 AI Agent 越来越受欢迎,其保护措施可能不会组织出现的每一次攻击。因此,用户在决定向 Agent 提供哪些信息时应加以权衡,并采取措施尽量减少风险。
结语:AI 浏览器之战升温
OpenAI 提到,他们将继续改进 Atlas,其路线图包括多配置文件支持、改进的开发者工具以及 Apps SDK,帮助开发者提高其应用在 Atlas 中的可发现性,网站所有者还可以添加 ARIA 标签,以改进 ChatGPT Agent 在 Atlas 中为其网站工作的方式。
AI 浏览器之战已经打响,OpenAI 早在去年 7 月就宣布了其搜索引擎的原型 SearchGPT,再到如今 Atlas 正式发布。
此前,Perplexity 推出了 Comet 浏览器 ,这是一种 AI 驱动的解决方案可以简化人们浏览网页和完成任务的方式,其可以扫描用户打开的所有选项卡、总结视频、整理电子邮件收件箱,甚至在亚马逊上进行购买;上个月,谷歌宣布更深入地将 Gemini AI 助手嵌入到谷歌浏览器中,并计划在未来几个月内允许谷歌浏览器中的 Gemini 能够代表用户完成杂货店购买、安排约会、预订等。
不过目前看来,各家 AI 浏览器的功能没有较大差别,下一步如何在体验上拉开差异化吸引用户或许是竞争的关键。


登录后才可以发布评论哦
打开小程序可以发布评论哦