3 月 6 日,又一个来自中国的 AI 产品刷屏了,Manus。有多火呢?一时间,几乎全网都在争抢邀请码,甚至传言 Manus 邀请码在闲鱼炒到了 8 万元一个。就在 3 月 7 日,咱们得到的快刀青衣老师,迅速给大家做了专业的讲解。
今天,我们又请来了得到 App,《科技参考》第四季的主理人卓克老师,从Manus 的定位、优劣势、预期等方面,为你进一步解读。卓克老师的这门课程,主要带你关注和追踪这个世界正在发生的科技大事,带你每天跟上科技新变化。
卓克老师长期追踪科技进展,著有畅销书《我们脑中那些挥之不去的问题》,在得到 App 累计已有 19 万人订阅他的课程。
以下是卓克老师的分享:
作者:卓克
来源:《卓克 · 科技参考 4》
01
定位:一个不错的产品
先来定位,它是一个很不错的产品,在特定领域的实用性预期会很好,但和之前大火的 DeepSeek 比起来,并不是一个级别的。DeepSeek 如果是奥运会金牌,Manus 大约是全运会前三名的水平。
Manus 的火爆是源于一段演示视频。
第一个任务是让 Manus 从一堆简历里找出 " 强化学习算法工程师 " 这个职位最合适的候选人。
它接收到一个 zip 压缩文件,里面有 15 份个人简历,Manus 自动解压后,逐页阅读了简历,记录了重要信息,根据这些人的经验和专业水平对 15 个人做了排序,然后根据主人的偏好生成了一个 excel 格式的结果报告。
第二个任务是根据主人的购房需求在纽约选房子。考虑了很多因素,比如社区的犯罪率、中小学教育质量、预算等等,最后给出了候选房屋的报告。
第三个任务是对特斯拉股票的分析,最终呈现的是一个网页,网页里是关于这只股票的各种可视化的而且带一定交互属性的页面(这是需要编程的)。
这个视频发布后,Manus 邀请了一些人做体验,可能是由于这个公司算力有限,所以邀请码数量很少,不到一天的时间在闲鱼上,一个邀请码就被炒到了 8 万块钱。
第二天 Manus 还专门发文章辟谣,说他们从未开设任何付费获取邀请码的渠道,从未投入任何市场推广预算。
在这些事情发生后,我看到的对 Manus 的评价鲜明地分为两派:
第一派说 Manus 是全球首款通用型 AI Agent,是继 DeepSeek 后又一个国运级突破。
第二派是浇凉水派,说 Manus 并没有重大技术突破,只是一个可能还不错的互联网产品。
而第一派集中在那些平时什么内容都发的自媒体上,第二派集中在平时只聚焦在偏技术的自媒体上。所以不用多说,第二派的定位是更值得采信的。
02
优势:产品化做得又快又好
我们先来说说 Manus 的优势,那就是产品化做得又快又好。
实际上 AI Agent(人工智能体)从 GPT3 时代就有人在做,比如 Auto-GPT,而且这个项目今天依然存在,还在不断改进和优化中。类似的自我驱动完成任务的 Agent 在开源社区里还有很多,比如 BabyAGI、LangChain Agent,还有商业化更成熟的 Coze、Dify、ChatDev。
但是开源社区比较火的那几个 Agent,实际使用门槛比较高,又要本地部署,又要申请各种 API 密钥,还得付款,普通用户是不可能搞定的。
其次是他们诞生得比较早,基于的大语言模型还是能力较弱的 GPT-4,所以虽然听上去," 自我驱动 " 好像很神奇,但实际上它理解完任务后规划出来的步骤经常跑偏。
比如 2 年前我使用 Auto-GPT 只是想完成一个在网页上查信息的工作,竟然耗了 1 个多小时没有弄完,消耗的 token 也几美元了,我手动暂停了,它好像是卡在了某个循环上。这本质上是因为那时候大语言模型的理解能力弱,导致拆分任务不合理。
这个问题要解决,只能靠基础模型的能力提升。所以在 2024 年 9 月之前下功夫做 Agent,受挫感是很明显的,业界也曾有一股潮流认为 Agent 已死,这个状况是从带有较强推理功能的模型出现后才得以改观的。
而 Manus 无疑是其中反应最快的,最早做出了效果不错,看上去可用的 AI Agent。尽管还没有公布任何技术细节,但从初期大家的试用体验来看,如果后续把算力大幅补齐,应该会是一个比较受欢迎的产品。
03
劣势:功能不全面
然后我们再来说说 Manus 的劣势,当然,这不止是 Manus 的劣势,而是整个 AI Agent 都无法避免的。
我们先从商业化更成熟的后者,其中最有代表性的 Coze 说起。
他们就明确知道 Agent 还有其他严重瘸腿的部分,所以只在自己有权限的软件生态圈里设计功能,一般来说定位在公司的运营和办公上。
Coze 是字节跳动开发的,工作流里有很多任务其实不需要多高的能力去完成,只需要消耗时间,中学生都可以做,比如请假、报销、会议安排,还有一些工作是公司经常用到的有明确评价标准的工作,比如面试、简单编程辅助、信件翻译。所以 Coze 就自己开发出大量小工具插件,Agent 需要的时候就可以调用它们。
这时你不禁要问,为什么 Coze 不把功能做全?让 Agent 可以控制所有的软件,就像很多游戏代练一样,把整个电脑操作权交给一个脚本,只不过现在是一个比脚本程序智能得多的、能够自我驱动的 Agent 去设计脚本并执行。
这个思路是对的,但问题卡在本地部署和权限上。
你如果想让 Agent 能像我说的智能脚本一样为你干活,首先你需要把这个 Agent 背后的模型部署在本地,而这种计划要商业化的模型,怎么可能让所有用户随便安装在本地呢,相当于核心机密免费赠送了。那么不本地部署,就不可能有足够的权限通过网络操作你本地电脑上的那些软件。
其次就是,哪怕你说我根本不在乎网络安全,你可以就像远程控制那样,通过网络完全接管我的电脑,但是广大用户给 Agent 安排的任务还往往牵涉让 Agent 去各个互联网巨头,比如电商平台、票务平台、打车平台、内容服务平台、短视频平台、房屋中介平台,让它们像真人一样输入信息、获取信息。
而今天绝大部分互联网巨头都不会轻易给你提供这样的 API 接口权限,我们真人使用时完全感受不到这种限制,但你想通过机器人或者爬虫,从这些平台搞到批量的信息,对方平台其实大部分都是禁止你这样访问的。
所以你发现没有,Manus 给大家展示的功能,涉及到网页之外的服务时,都是用亚马逊举例,因为亚马逊是个例外,它本身有自己的 AI 音箱,希望接入 AI 智能下单这类的功能,所以允许以 API 的方式访问和下订单。但这个事情放在京东、淘宝、闲鱼就搞不定了。
于是像 Coze 这样的 AI Agent,虽然早就在做 Agent 的项目,但只是把 Agent 的功能定义在字节软件生态内部。当它自我驱动去索取工具时,也只是用 Coze 自己开发的插件,这样从权限到功能兼容性都不会出问题。
在中国,也不会有哪个公司打算推出一个功能特别全面的 Agent,因为大部分线上线下服务的互联网巨头并不给这些初创公司开 API 特权,起码当下是没有这个环境基础的。也许今后,某个成熟的、用户体验好、安全也做到位的 Agent 出现,会有首先吃螃蟹的巨头出现,但这是很难预期的。
这就是中国目前没有很好的全功能的 Agent 的原因,也是今后一段时间 Manus 发展受限的主要原因。
04
预期:自媒体内容领域可能出现大洗牌
说完优势和劣势,我们再来说说预期。那就是自媒体内容领域,可能会出现大洗牌。
如果你听懂了我刚刚说的逻辑就知道,尽管中国互联网服务的巨头们,今天大都没有向 AI Agent 开放 API 接口,但有一个领域其实是全面开放的,那就是所有用浏览器可以看到的部分。
只要人用浏览器可以看见的内容,AI Agent 就有能力完全获取,于是 Agent 的输入部分就完全没有限制了,如果输出部分也不做特殊功能要求,也只让他输出图片和文字,那其实也相当于完全开放。
于是一个任务规划功能训练优秀的 AI Agent 最先取代的就是那些公众号的写手们,这些公众号的老板们用上这个工具后就会发现不需要再招聘编辑了,Agent 可以写得又快又好。
你可能会说,咱们不是有 OpenAI 的 DeepResearch 吗?他生成的报告,那质量简直就是硕士的水平,这不假,但这个功能也有缺点,就是只能生成这个调调的内容,从风格到深度,都是很统一的。
他不能根据用户的需求很自由地规划任务,而 Manus 是可以轻松搞定这一步的。虽然我没有申请到邀请码,但是《五分钟商学院》的刘润老师有,他今天和我分享了好几个例子:
1. 刘润公众号主笔招聘报告
2.《雷军的修行》短视频脚本系列
3. 成都到新加坡旅行方案
我就以第一个方案招聘主笔举例,需求是:
当然,大家也能发现,刘润老师的提示词写得很全面、很有逻辑,然后 Manus 就按这几个步骤去规划更细节的动作:
1. 分析刘润写作风格和特点。
主要参考了几个网站上,曾经有其他人对刘润老师文章的点评,它并没有自己抓取刘润的大量文章,自己分析。当然,因为刘润老师本来影响力大,所以这样直接找到正确答案的概率也高。
2. 确定主笔招聘要求。
这一步是通过大语言模型对文章风格的理解生成的,这一步能比较好的完成,是强烈依赖于大语言模型能力的进步,GPT-4 是干不了的。
3. 启动了自己的虚拟 PC 里的浏览器,在直聘网上搜索潜在的候选人。
5. 然后把这 2 个集合的交集做了一个地理位置是否在上海的筛选。
6. 然后把作者们按刘润老师的要求排了序,并且针对性地给每个作者生成了一条劝说他加入刘润公众号的文案。
7. 生成报告。
这个任务非常个性化,还涉及很多具体访问动作,OpenAI 的 DeepResearch 哪怕可以完成,效果也是很勉强的。我把 DeepResearch 结果图放在下面。
实际上你会发现 DeepResearch 给的结果,这些推荐人都是一些在写商业分析文章中已经独树一帜的大 V 了,比如猫爷、邵恒、李翔、小马宋。这个招聘候选人的结果可用性我们放在一边不提,起码是看不出对刘润文章分析的过程,也看不出对招聘网站信息的筛选过程的。
最后说说 Manus 的创始人,肖弘,92 年出生,华中科技大学软件工程专业,大三的时候就开发了华科版的微信漂流瓶、微信上墙、志愿者报名助手、圈圈市场这些小程序。
毕业后推出了壹伴助手,就是最早用 AI 续写文章的一个程序,之后推出了浏览器插件 Monica,后来 Monica 还发展成一个 AI 软件的聚合平台。
肖弘之前在 AI 领域的经验在开发 Manus 的时候真的全都用上了,快速积累出 Manus 这个产品,起码在抢先体验的时候,会给人眼前一亮的感觉。这个产品之后如果发展顺利,应该会首先取代一些文章的写手,但也很可能会止步于此。
如果你或身边的朋友对科技圈的事感兴趣,提醒你,现在卓克老师在得到 App 的课程《科技参考》第四季,已经正式开始更新了,欢迎你订阅学习。
tips:敬爱的读者朋友,由于微信的推送规则,即使您关注了我们,可能也常常收不到推送,记得点击 " 罗辑思维 " 名片,设为星标⭐️,文章每天会自动推送哦!
登录后才可以发布评论哦
打开小程序可以发布评论哦