实测智谱新智能体AutoGLM沉思：跨平台“边想边干”破信息壁垒，免费不限量开放

图片来源：视觉中国

蓝鲸新闻 3 月 31 日讯（记者朱俊熹）3 月 31 日，大模型独角兽智谱 AI 在中关村论坛上正式发布全新智能体 "AutoGLM 沉思 "。据智谱介绍，该智能体具备深度研究能力（Deep Research），同时还能实现实际操作（Operator），推动 AI Agent 进入 " 边想边干 " 的阶段。

智能体一直是国内外 AI 公司竞相押注的方向。本月初，中国初创企业 Monica 发布智能体产品 Manus，称其为 " 全球首款通用 Agent"，引发科技行业热议。OpenAI 也于 2 月推出 deep research（深度研究）功能，通过智能体对复杂任务进行多步骤研究，在数十分钟内做到人类需要数小时才能完成的工作。

智谱 CEO 张鹏在中关村论坛的演讲中表示，" 智谱很早在布局 AI Agent，甚至早过海外的 OpenAI 和 Anthropic。" 自去年 10 月起，智谱陆续推出能模拟人类操作手机、计算机等电子设备的智能体，支持跨应用操作，一句话让 AI 帮忙发微信红包或下单采购外卖。

据智谱介绍，最新的 AutoGLM 沉思是国内首个正式开放给所有用户的 deep research 类智能体功能。除 deep research 能力外，AutoGLM 沉思还具备实际操作能力，能够主动行动。智谱称，这一能力的实现依赖于三个关键特性：一是深度思考，模拟人类在面对复杂问题时的推理与决策过程；二是感知世界，像人一样获取并理解环境信息；三是工具使用，像人一样调用和操作工具，完成复杂任务。

" 此次发布的是 preview 版本，核心是以 research 类场景为主。在未来的两周时间之内，我们将进一步扩展更多的 agent 场景和执行的能力。" 张鹏介绍称。

在实测中，蓝鲸新闻向 AutoGLM 沉思测试版提出这样的 Prompt：我最近在研究 AI Coding（AI 编程）领域，帮我整理一份行业报告，要包含国内外主流的 AI Coding 工具。

AutoGLM 沉思会先对用户的请求进行拆解，再逐步执行研究计划。该智能体的操作过程贴近人类的行为方式，会跳转打开 Cursor、Windsurf 等 AI 编程工具的官网。浏览网页并收集相关信息，整合到最终生成的研究报告中。

图片来源：AutoGLM 沉思实测

蓝鲸新闻发现，AutoGLM 沉思通过浏览器插件的方式实现对网页的调用。如果用户此前未登陆相关官网，智能体在执行任务时会受阻，需要用户介入，等待手动确认。或者它也会主动调整搜索策略，转向其他信源来获取详细信息。

相较而言，当通过 Manus 执行同一任务时，虽然 Manus 也会主动浏览不同 AI 编程工具的官网，但仅体现在对步骤的简要描述中，不会像 AutoGLM 沉思一样弹出浏览器页面。

图片来源：Manus 截图

通过模拟人类浏览网页的方式，智谱的智能体 AutoGLM 沉思能够突破各平台间的 " 信息壁垒 "。以制定一项旅游计划的任务为例，Manus 等产品参考的是互联网上能被抓取到的公开信息，而 AutoGLM 沉思可以触达更多相对封闭的内容生态，包括小红书笔记、知乎、哔哩哔哩视频等，提供更优质的信息来源。

从用户体验来看，Manus 运行在独立虚拟机中，执行任务时可以关闭其页面，不影响它在后台继续保持工作。当用户提出任务请求后，Manus 会补充提问以进一步确认需求细节。用户也可以随时发送信息，对任务进行修改、补充或要求停止。

而智谱的 AutoGLM 沉思在任务进行过程中，不支持对任务进行修改或开启新对话，否则会直接终止任务进程。AutoGLM 沉思跳转打开的浏览器页面虽然可以小窗化，但必须全程保持在线，且用户难以直观判断任务的进度条。智谱表示，之后计划推出 " 虚拟机 " 版本，进一步增强 AI Agent 的实际落地能力。

图片来源：Manus 任务进度

智谱称，AutoGLM 沉思向用户免费、不限量地开放体验。OpenAI 的 deep research 功能需要用户每月至少付费 20 美元。Manus 也在 3 月 28 日公布了其收费方案：Manus Starter 每月收费 39 美元，获得 3900 积分；Manus Pro 每月收费 199 美元，获得 19900 积分。

积分是 Manus 使用的标准计量单位，任务越复杂或越耗时，所需积分越多。以蓝鲸新闻实测的任务为例，生成一份关于 AI 编程的行业报告需要花费 23 分钟，消耗 456 积分。而生成旅游计划需要 17 分钟，消耗 197 积分。

智谱表示，AutoGLM 沉思的背后，融合了新版基座模型 GLM-4-Air-0414 的通用能力、全新深度思考模型 GLM-Z1-Air 的反思能力、沉思模型 GLM-Z1-Rumination，以及 AutoGLM 的自动执行能力。其中核心链路的模型和技术，预计将于 4 月 14 日正式开源。

新版 GLM-Z1-Air 在性能表现上可媲美 DeepSeek-R1。其推理速度相比 R1 提升了 8 倍，成本可以降低至 1/30。基于 GLM-Z1 训练出的沉思模型 GLM-Z1-Rumination，能通过更长的深度思考时间来换取更优的效果，突破了实时联网搜索、动态工具调用、深度分析和自我验证。

" 相比于传统的推理模型，我们期待沉思模型引领 AI 助手进入一个‘高智商’到‘高智商 + 高自主’的阶段。" 智谱称。

宙世代

一起剪

相关标签