蓝鲸财经 03-31
实测智谱新智能体AutoGLM沉思:跨平台“边想边干”破信息壁垒,免费不限量开放
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

图片来源:视觉中国

蓝鲸新闻 3 月 31 日讯(记者 朱俊熹)3 月 31 日,大模型独角兽智谱 AI 在中关村论坛上正式发布全新智能体 "AutoGLM 沉思 "。据智谱介绍,该智能体具备深度研究能力(Deep Research),同时还能实现实际操作(Operator),推动 AI Agent 进入 " 边想边干 " 的阶段。

智能体一直是国内外 AI 公司竞相押注的方向。本月初,中国初创企业 Monica 发布智能体产品 Manus,称其为 " 全球首款通用 Agent",引发科技行业热议。OpenAI 也于 2 月推出 deep research(深度研究)功能,通过智能体对复杂任务进行多步骤研究,在数十分钟内做到人类需要数小时才能完成的工作。

智谱 CEO 张鹏在中关村论坛的演讲中表示," 智谱很早在布局 AI Agent,甚至早过海外的 OpenAI 和 Anthropic。" 自去年 10 月起,智谱陆续推出能模拟人类操作手机、计算机等电子设备的智能体,支持跨应用操作,一句话让 AI 帮忙发微信红包或下单采购外卖。

据智谱介绍,最新的 AutoGLM 沉思是国内首个正式开放给所有用户的 deep research 类智能体功能。除 deep research 能力外,AutoGLM 沉思还具备实际操作能力,能够主动行动。智谱称,这一能力的实现依赖于三个关键特性:一是深度思考,模拟人类在面对复杂问题时的推理与决策过程;二是感知世界,像人一样获取并理解环境信息;三是工具使用,像人一样调用和操作工具,完成复杂任务。

" 此次发布的是 preview 版本,核心是以 research 类场景为主。在未来的两周时间之内,我们将进一步扩展更多的 agent 场景和执行的能力。" 张鹏介绍称。

在实测中,蓝鲸新闻向 AutoGLM 沉思测试版提出这样的 Prompt:我最近在研究 AI Coding(AI 编程)领域,帮我整理一份行业报告,要包含国内外主流的 AI Coding 工具。

AutoGLM 沉思会先对用户的请求进行拆解,再逐步执行研究计划。该智能体的操作过程贴近人类的行为方式,会跳转打开 Cursor、Windsurf 等 AI 编程工具的官网。浏览网页并收集相关信息,整合到最终生成的研究报告中。

图片来源:AutoGLM 沉思实测

蓝鲸新闻发现,AutoGLM 沉思通过浏览器插件的方式实现对网页的调用。如果用户此前未登陆相关官网,智能体在执行任务时会受阻,需要用户介入,等待手动确认。或者它也会主动调整搜索策略,转向其他信源来获取详细信息。

相较而言,当通过 Manus 执行同一任务时,虽然 Manus 也会主动浏览不同 AI 编程工具的官网,但仅体现在对步骤的简要描述中,不会像 AutoGLM 沉思一样弹出浏览器页面。

图片来源:Manus 截图

通过模拟人类浏览网页的方式,智谱的智能体 AutoGLM 沉思能够突破各平台间的 " 信息壁垒 "。以制定一项旅游计划的任务为例,Manus 等产品参考的是互联网上能被抓取到的公开信息,而 AutoGLM 沉思可以触达更多相对封闭的内容生态,包括小红书笔记、知乎、哔哩哔哩视频等,提供更优质的信息来源。

从用户体验来看,Manus 运行在独立虚拟机中,执行任务时可以关闭其页面,不影响它在后台继续保持工作。当用户提出任务请求后,Manus 会补充提问以进一步确认需求细节。用户也可以随时发送信息,对任务进行修改、补充或要求停止。

而智谱的 AutoGLM 沉思在任务进行过程中,不支持对任务进行修改或开启新对话,否则会直接终止任务进程。AutoGLM 沉思跳转打开的浏览器页面虽然可以小窗化,但必须全程保持在线,且用户难以直观判断任务的进度条。智谱表示,之后计划推出 " 虚拟机 " 版本,进一步增强 AI Agent 的实际落地能力。

图片来源:Manus 任务进度

智谱称,AutoGLM 沉思向用户免费、不限量地开放体验。OpenAI 的 deep research 功能需要用户每月至少付费 20 美元。Manus 也在 3 月 28 日公布了其收费方案:Manus Starter 每月收费 39 美元,获得 3900 积分;Manus Pro 每月收费 199 美元,获得 19900 积分。

积分是 Manus 使用的标准计量单位,任务越复杂或越耗时,所需积分越多。以蓝鲸新闻实测的任务为例,生成一份关于 AI 编程的行业报告需要花费 23 分钟,消耗 456 积分。而生成旅游计划需要 17 分钟,消耗 197 积分。

智谱表示,AutoGLM 沉思的背后,融合了新版基座模型 GLM-4-Air-0414 的通用能力、全新深度思考模型 GLM-Z1-Air 的反思能力、沉思模型 GLM-Z1-Rumination,以及 AutoGLM 的自动执行能力。其中核心链路的模型和技术,预计将于 4 月 14 日正式开源。

新版 GLM-Z1-Air 在性能表现上可媲美 DeepSeek-R1。其推理速度相比 R1 提升了 8 倍,成本可以降低至 1/30。基于 GLM-Z1 训练出的沉思模型 GLM-Z1-Rumination,能通过更长的深度思考时间来换取更优的效果,突破了实时联网搜索、动态工具调用、深度分析和自我验证。

" 相比于传统的推理模型,我们期待沉思模型引领 AI 助手进入一个‘高智商’到‘高智商 + 高自主’的阶段。" 智谱称。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai deep 中关村 编程 朱俊
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论