这是一个操作系统层的个人 AI 助手。
智东西 5 月 15 日报道,近日,腾讯开始内测一款名为Marvis(马维斯)的操作系统层个人 AI 助手。这一 AI 助手通过多个 Agent 的协作完成 App 操作、EXE 操作、电脑操作、文件管理、文档生成以及各种复杂任务,24 小时持续在线,并支持跨端操作。
Marvis 目前仅支持 Windows PC 和安卓手机,iOS/macOS 即将上线。
具体到日常使用场景,Marvis 能干不少活。工作场景中,它能做文件格式转换、合同信息审查、运营数据分析,甚至帮忙整理参考文献。这些功能超越了单纯的文字、代码生成,能真正去操作系统、文件和应用等更为底层的元素。

在生活娱乐场景中,它能帮你监控游戏限时福利和明星动态,自动完成微博签到、整理高清物料,也可以定时执行每天早上的新闻汇总。
Marvis 这一名字致敬了知名智能助手"Jarvis",取自 " 马(Ma)" 与 "Jarvis" 的结合。比较有趣的是,它把每个 Agent 的形象设计成一只长着牛角的黑色小马,简称 " 小牛马 "," 小牛马 " 还继承了腾讯企鹅标志性的围脖。
你可以在虚拟办公室里随时查看每只 Agent 在干什么,被安排任务的 Agent 会坐在工位上认真搬砖,其他闲着的 Agent 可能会打盹、闲逛、健身、喝咖啡或上厕所。
当你指定任务后,会有一只 Agent 主管出来主持大局,分配任务给相应的 Agent,Agent 在完成工作后会向主管汇报。
目前 Marvis 里的专家 Agent 具备 App 操作、电脑系统运维、网页交互、数字资产管理和搜索任务等能力。

Marvis 目前提供了两种运行模式:云端效率模式采用混元和 DeepSeek V4 等最新模型,本地隐私模式则采用 Qwen 端侧模型,做到一句话都不出电脑。
这一产品还支持本地知识库的功能,可以自动识别本地文档、图片并进行索引。当用户需要搜索特定内容时,Marvis 可以基于标题匹配或基于内容匹配。

与同样能操控电脑的其他 " 龙虾类 " 产品相比,Marvis 有什么优势?
智东西获知,Marvis 背后是腾讯应用宝团队,继承了十几年与英特尔、微软等软硬件厂商的合作关系和跨端引擎技术。
因此,Marvis 不仅能操作电脑 EXE 软件,还能通过应用宝,直接在电脑上操控手机 App(同花顺、开盘啦、飞常准、汽车之家、唯品会等 App 已授权)。
该团队通过对端侧模型做芯片级优化,实现了跑端侧模型速度提升 20%,并能通过提示词直接对电脑文件进行查询、变更等操作。而当前大多数 AI 应用都做不到这种深入操作系统层的能力。
智东西第一时间拿到 Marvis 的内测资格。根据我们的实际体验,Marvis 展现了 "AI 打工人 " 的雏形,它能实实在在地帮你干活,完成任务的质量不错,但在速度、token 消耗量、灵活性等方面仍有提升空间。
找文件、调设置Marvis 全动手试了一遍
电脑操作是 Marvis 的一大长板。Marvis 拥有系统级的能力,可直接完成对电脑的全流程操作。我们的首批案例就围绕这类任务展开。
进入主页后,用户可以直接与 Marvis 对话并指派任务,也可通过自动任务页面让 Marvis 定时执行既定任务。

案例 1:图像搜索、文件定位都能胜任,就是有点烧 token
对许多用户来说,在本地设备上寻找指定的文件或图像,是件费时费力的事情。我试着让 Marvis 帮我在本地的下载文件夹中,找到一张包含纳斯达克元素的图片。
拿到这一任务后,Marvis 的团队负责人 Agent 把任务分配给了文件处理 Agent,后者先是尝试了文件名搜索,未获得命中。在这一过程中,它判断我的图片命名大多无意义,决定换个思路,用图像分析来找到相关图像。

切换思路后,Marvis 终于步入了正轨,它成功地找到了包含纳斯达克相关元素的图片。然而,调用图像分析工具,Marvis 的 token 消耗量呈现指数级的增长。在搜索了一百多张图片后,总消耗量来到了 200 万 token。

Marvis 可以完成跨端的文件查找和传递。我在手机上向 Marvis 发送了一条命令,搜索与字节跳动估值有关的文件并发送到我的手机上。
它很快找到了文件,并发送到我的手机上。可能是因为这次文件名本身就包含了需要查找的关键词,任务的 token 消耗量明显降低了。
案例 2:精准抓取电脑配置,还给我提了优化建议
Marvis 可以直接在 Windows 系统层进行一些操作。当我要求它帮我把电脑的主题调为绿色时,Marvis 的电脑操作 Agent 接手了工作,并直接找到了系统主题色的设置入口。这一操作并未通过模拟点击实现,应该是深入了系统底层。
不过,它没有 100% 完成这一任务,停在了找到入口这一步,后续的具体设置需要我手动操作。

Marvis 可以精准地获取各种系统信息。当我向它咨询我的设备是否支持《黑神话 · 悟空》这样的大型游戏时,它快速整理出了我的系统配置,看样子是直接在设置中找到了相关内容。

紧接着,我让 Marvis 分析了我这套配置中的短板,并提出升级建议。它判断我的显卡配置充裕,但是 CPU、内存和硬盘都稍显落后。Marvis 建议我对内存进行升级,并说这是性能提升最直接、成本最低的方式。
不过,它似乎不了解当内存涨价的情况,告诉我 32GB 的 DDR4 3200MHz 内存只要四五百块。实际情况是,同类内存的价格至少也得 1000 元出头。

在我们的实际体验中,Marvis 在遇到批量删除文件、核心配置修改时一定会询问用户,用户点击确认后才会执行。
写代码、出报告多 Agent 协作有亮点
多 Agent 的协作,理论上可以完成更复杂的任务,或是提高任务执行的质量。我们拿几个复杂任务试了试 Marvis 的能力边界。
案例 1:开发本地知识库,全程无需碰代码
我们的首个复杂任务要求 Marvis 设计一个本地知识管理系统,支持自定义大模型接入,实现简单的 RAG。
在这种更复杂的任务中,Marvis 反而没有调用多 Agent,而是由主 Agent 完成所有的开发工作。Marvis 陆续创建了目录结构,并且并行写入了配置文件和核心模块,之后打造了 Web 界面。Marvis 默认使用了 ollama 本地跑模型,我要求它切换为接入外部 API 的模式。
Marvis 提供的 API 设置界面较为人性化,它向我发送了选项卡,只要逐步选择并填写信息就行。

最终,Marvis 按照我的要求打造出了这一知识管理系统,支持导入文件、导入目录、导入文本等选项,可提供参考来源。我们试着上传了几份文件并询问相关信息,该系统输出的内容准确,也没有编造不在知识库内的信息。

案例 2:盘点硅谷裁员潮,直接输出 PDF 文件
下一个实测任务要求 Marvis 梳理一下今年硅谷大厂的裁员情况,做成一个 PDF 网页,包含裁员数据和分析,每条数据背后附上单独的消息来源。
在这一任务中,Marvis 使用了多 Agent 协作的模式,文件 Agent 被唤起,并主动调用了文档写作 Skill。这一 Skill 要求模型先做复杂度判断,然后加载写作模板、写作规范,再开始正式的执行。

Marvis 判断这属于一个复杂文档,预计产出超过 3500 字。它进行了多轮的网页搜索,收集到足够数据后开始逐页撰写 PDF 内容,最终输出了一份完整的调研报告。

执行过程中,Marvis 的多 Agent 协作让任务划分更加合理,两个 Agent 的并行工作一定程度上提高了效率。不过,这一任务中 Agent 出现了自主切换到英文的问题,Skill 的内容和背后模型的特性可能导致了这一现象。

Marvis 生成的文档可以直接在侧边栏中进行预览,从结果来看,这一文档的内容明显要比 AI 单次生成的内容来得详实,文中的数据基本准确。

排版方面,这一文档的风格比较朴素,通过表格、加粗、章节划分等方式,让内容的可读性更强。这种输出方式应该与 Marvis 内置的 Skill 有关。
靠应用宝操作安卓应用效率仍有提升空间
Marvis 可以通过腾讯应用宝在 Windows PC 上完成对安卓 App 的操作,并且相关操作不会干扰 PC 的正常使用。安装应用宝后,我们对这部分功能进行了体验。
案例 1:自动到微博打卡签到,任务耗时 3 分多钟
Marvis 官方在首页展示了微博超话签到这一任务。我们也实测了一下,要求 Marvis 打开微博去陈奕迅超话签到。
App 操作 Agent 是这一任务的主要执行者。我们提前在应用宝中下好了微博并登录,以免 Marvis 在登录这一步卡住。
Marvis 的执行速度不太理想。此前我们已经跑过类似任务,但它还是较为机械地按照规范来,检查微博安装包,试图搜索微博操作 Skill,未果后直接开始任务执行。
开始操作后,Marvis 只能截图一步,操作一步,每张截图都要分析个几秒钟,整个任务的执行时长被拉到 3 分多钟。下图是它的完整执行过程,画面经过 20 倍速的处理。

▲动图经过 20 倍速处理
借助 Marvis 的定时任务功能,用户可以把上述 App 操作设置为每天自动执行的任务。不过,前提是电脑必须保持 24 小时开机。
案例 2:拒绝小红书、微信操作请求
除了微博之外,我们也尝试了 Marvis 操作其他 App 的能力。当我们要求它操作微信并发送消息时,Marvis 拒绝了这一请求,称由于系统限制无法在微信内执行点击和输入操作。我们尝试了小红书,也同样无法操作。

这可能是因为微信这类 App 的聊天和支付界面,本身可能就有防模拟点击、防注入输入的特殊安全机制,如果 AI 助手能随意替用户在微信上发消息、转钱,一旦被恶意利用,造成的风险和平台责任是平台无法承受的。因此,Marvis 从源头上拒绝了任何涉及资金划转的自动交易等操作。
我们也尝试询问 Marvis 它到底可以直接操作哪些应用,不过 Marvis 一直答非所问。
结语:AI 打工人雏形已现但离 " 放手 " 还有距离
对于愿意尝鲜的极客用户来说,Marvis 已经能带来实打实的效率提升。然而,现在普通用户仍无法完全放手让 Marvis 执行一个任务,复杂的软件生态、文件系统等影响因素,都有可能让 Marvis 的任务执行中断或偏离预期。
不过,Marvis 的设计思路确实代表了一种明确的趋势。目前,国内已有不少 AI 厂商在多 Agent 产品上展开探索,跨端协同也逐渐成为行业共识。尽管体验还需要进一步打磨,但腾讯至少已经迈出了第一步。

