智东西 09-27
Kimi第一次有自己的电脑了,分析师、工程师样样精通,一手实测来了!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

Kimi 发了一款 " 全栈助理 "。

作者 | 陈骏达

编辑 | 云鹏

智东西 9 月 27 日报道,近日,月之暗面正在小规模灰度测试 Kimi 的 Agent 模式 "OK Computer"OK Computer 的目标是通过更多轮次推理、更多工具调用、更多 token 消耗,带来更多智能,月之暗面将其定义为一款 " 全栈助理 "。

在 OK Computer 模式下,Kimi 将拥有自己的虚拟电脑,可以连续工作几十分钟,一步一步自主完成需求调研、规划、分析、设计、开发等环节。

▲ OK Computer 工作界面,左侧为聊天框,右侧为虚拟电脑(图源:智东西)

与传统依赖人工预设工作流的方式不同,OK Computer 背后是月之暗面的原生 Agent 模型 Kimi K2,能应对更多任务场景和突发情况。

借助端到端强化学习技术,Kimi K2 掌握了文件系统、浏览器、终端、代码、图片生成、音频生成等 20 多种工具的使用方式,拥有完成复杂任务所需的内在知识。

官方 Demo 中,OK Computer 能够直接交付功能模块丰富的多页面网站、移动端友好的 Web 应用以及可编辑的高品质演示文稿等产出物,也能够把几十万行的 Excel 数据进行可视化、交互式呈现。

目前,过去两年曾经给予 Kimi 打赏鼓励的用户,将优先获得 OK Computer 的体验席位,这部分用户打开网页版 Kimi 即可收到邀请。

月之暗面称,Agent 模式下单个任务的 token 消耗量可达常规对话模式的几十倍,OK Computer 会根据服务器负载情况逐步扩大灰度测试范围。智东西也对 OK Computer 的表现进行了体验。

01.

一手体验海量数据分析能力

把英伟达投资策略捋清了

获得 OK Computer 模式体验机会的用户,在 Kimi 首页输入框的左下角能找到 OK Computer 模式的切换按钮,点击后即可使用。

官方提供了 OK Computer 模式下的一些模板提示词,如果想体验其能力,又不愿意撰写复杂提示词,可以直接选用这些模板。

智东西从中选择了一项数据可视化任务,要求 Kimi 从雅虎财经获取英伟达过去两年的股价和财报数据,并分析股价的暴涨是否主要发生在财报发布前后、比较估值(市盈率 P/E)与标普 500 科技板块的平均值。

此外,Kimi 还需模拟在每次财报发布前一周买入,发布后一周卖出的交易策略,长期来看是否盈利。

设计风格方面,提示词要求 Kimi 采用低饱和度的英伟达品牌色,保持布局简洁和谐,仅使用纯色(无渐变),并通过优雅图标提升清晰度。

收到任务后,Kimi 会在右侧呈现它在虚拟电脑中进行的各类操作。在开始任务之前,它一般会撰写待办事项,对任务流程进行全面规划,然后再正式执行。

开启 OK Computer 模式后,Kimi 会列出其进行的每一步操作,包括使用数据源、使用文件、使用 iPython、使用部署工具等等。分析完成后,它还用简洁的语言给出了关键发现,并将分析图表和结论做成了一个完整的网站,耗时 5 分钟左右。

生成结果:

https://www.kimi.com/share/19988a15-7962-8c6a-8000-0000857b187e

可以看到,Kimi 给出的网页完成度较高,数据可视化清晰,跳转逻辑正确,还提供了 JSON 格式的分析数据。

智东西核验了页面中部分关键数据的正确性,如英伟达市值、股价等等。在我们的抽查范围内,数据基本无误,不过英伟达的市盈率与雅虎财经上显示的数据有出入。

这一任务考察的能力类型众多,OK Computer 模式下的 Kimi 需要从指定来源抓取正确数据和对应时间,理解提示词中谈到的各种金融术语,还需要利用 Python 进行数据分析,并将结果按照风格要求可视化。如果是人工完成,可能需要耗费数小时。

我们将官方提示词中的企业从英伟达改为 AMD,切换了比较的基准,Kimi 同样能给出类似质量的分析结果,这在某种程度上也印证了其能力不是完全靠 " 背题 " 实现的。

生成结果:

https://www.kimi.com/share/19988bb0-9b82-864d-8000-0000e74d03a4

不过,OK Computer 并不是市面上唯一一款具备类似能力的 Agent,我们也将这一任务交给了 Manus。

可以看到,Manus 的执行风格更偏向直接上手做,收到任务后直接就开始查询财经数据的 API 了。Manus 最终交付了一份 MarkDown 文档,以及四张数据图表。

Manus 的报告内容更为宏观,在具体数据的呈现上比 OK Computer 更少,报告长度也更短,任务耗时比 OK Computer 长。数据可视化方面,其图表的美观程度和 OK Computer 相比还有一定差距。

02.

擅长 PPT、多功能网站开发

多位网友给出好评

月之暗面介绍,OK Computer 已掌握的工具集包括列待办事项、写 Python 代码、操作终端、浏览网页、文字搜索、图片搜索、图片生成、音频生成、接入专业财经数据源、网站部署等。

在该公司的内部测试中,OK Computer 目前擅长的任务类型,包括多功能网站原型开发、海量数据分析与可视化、高品质演示 PPT 制作等。

x 平台上的一名科技博主分享,他用 OK Computer 打造了一个功能完备的星座网站。这个网站可以帮助用户了解每个星座的特征,还可以比较两个星座之间是否匹配。其设计风格也与网站的主题较为匹配。

▲ OK Computer 生成的星座网站(图源:Gadgetify)

还有网友分享,自己用 OK Computer 打造了一个文档比较网站,可以看到这一网站设计简洁美观,这位网友反馈完成率还不错。

官方 Demo 中,借助 OK Computer,Kimi 还打造了一份对电影《2001 太空漫游》视觉元素的深度解析 PPT,要求仅使用电影原图与影视和学术深度解析文章。

Kimi 会先设定计划,搜索电影原图素材和关键场景的图片,搜索电影深度解释和学术研究资料,经过深度研究和素材资料收集,然后才开始按照视觉规范制作 PPT。

最终,Kimi 可以交付一份演示文稿,既可以在线分享,也可以下载到本地。

03.

结语:从问答机器到全栈开发

大模型竞逐 Agent 能力

月之暗面称,未来他们会为 OK Computer 模式带来更丰富的工具选项和自定义工具能力,也支持连接更多外部应用,让 Kimi 可以完成更多类型的任务。

这也顺应了行业内的一大趋势:通用大模型正从知识问答阶段、生产力工具阶段迈向通用 Agent 阶段。未来,谁能率先在工具生态整合、长时任务执行、可靠性和合规性上建立优势,谁就可能在新一轮竞争中占据先机。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

kimi 英伟达 标普500 数据分析
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论