智东西 04-18
把智能体装入浏览器,3分钟搞出可视化研报,解放打工人神器来了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西(公众号:zhidxcom)

作者 | 陈骏达

编辑 | 云鹏

智东西 4 月 18 日报道,今天,国内 AI 浏览器创企 Fellou 向智东西等媒体分享了其浏览器产品的最新进展。Fellou 将 Fellou 浏览器其定义为一款 AI 原生,具有自主规划、计划执行、根据用户需求自主决定行为方式的 AI 浏览器。

这款浏览器具备自动浏览网页、整合信息,帮助用户完成复杂任务的行动能力,还能据用户行为和状态主动提供服务。其任务平均耗时为 3.7 分钟,成本为 0.3 元 -3 元,远少于 Manus、OpenAI Deep Research 等相同功能的产品。

浏览网页、使用电脑时,Fellou 浏览器基于虚拟化技术为浏览器打造了 " 影子空间 ",AI 不会与用户 " 争夺 " 电脑的使用权。为了让人与 Agent 更顺畅的协作,Fellou 还打造了用于更高级别自动化的智能体框架 Eko。

Fellou 浏览器于 2024 年底面向海外市场小规模推出,目标用户主要为先锋用户与知识密集型用户,如产品经理、投资人、媒体从业者等。这款产品的商业模式处于探索阶段,未来可能通过云存储空间等方式进行收费。

一、打造行动型浏览器,可主动预测用户需求

Fellou 创始人谢扬也是身份云产品 Authing 的创始人,曾在字节跳动任职,后连续创业。

谢扬认为,当今浏览器市场拥有三种类型的浏览器:传统浏览器、对话式浏览器与搜索优化型浏览器。其中,对话式浏览器更多提供对网页的总结与自然语言交互,而搜索优化型浏览器具备深度检索能力。

Fellou 浏览器的名字是 "Fellow" 的变体,谢扬称 Fellou 希望将这一浏览器打造为用户的伙伴,了解、熟悉用户,并且能为用户提供服务,是一款行动型浏览器(Agentic Browser)。

现场,谢扬用多个案例展示了 Fellou 浏览器的能力。

首先是深度行动能力,其中包括了 Fellou 浏览器的 Deep Search 功能。与 Deep Research 不同,Deep Search 产出的结果较为精简,重点明确,并且倾向于可视化、图形化的方式呈现。

▲ Fellou 浏览器的 Deep Search 结果

其次是主动智能。Fellou 浏览器具备环境感知架构,能了解用户行为、环境状态与环境事件,并通过这些信息预测用户的需求。例如,当在 Fellou 浏览器搜索 " 故宫博物院 " 时,这款浏览器会主动询问用户是否需要为其指定旅行计划。

影子空间是 Fellou 浏览器的一项独特技术,通过虚拟化技术,能让浏览器与人更好地同时使用浏览器。不过,Fellou 并未实现操作系统级别的虚拟化,而是应用程序级别的,谢扬称目前这项技术的成熟度在 60% 到 70%。

谢扬认为,未来很难出现一个单一通用智能体胜任所有任务的情况。Fellou 打造了智能体网络(Agent Store),允许用户打造个性化的对话智能体;同时,也可以将操作序列封装为一个完整的工作流,供其他用户直接调用。

这一智能体网络使有垂直领域知识的智能体创作者面向全网用户开发、共享自己的经验、知识和工作流。

二、融合浏览器、智能体与工作流,单次任务执行成本小于 3 元

在设计这款行动型浏览器时,Fellou 主要融合了 3 大元素:浏览器、智能体能力与工作流自动化。

浏览器负责最广泛的 Web 内容访问与渲染,以及对操作系统、文件系统、命令行与本地应用的直接控制。

智能体负责思考和决策,基于大模型或其他算法来理解上下文、规划行动。

工作流自动化负责执行和工具化,能调用不同的 API、插件、脚本,实现跨网站、跨应用的自动化操作,并能与 A2A、MCP 等协议集成。

用户在浏览器上的行为可大致分为搜索和序列化操作工作流。

在搜索场景,用户通过浏览海量网页来收集信息、分析数据,获取所需知识,Fellou 浏览器可以批量并行化,一次性辅助用户阅读大量网页信息。

在工作流中,用户需要依靠一系列序列化操作完成具体任务,如在线购物、预订会议、填写报告、交互提交等,Fellou 浏览器可根据用户需求自行规划任务并自主行动。

为验证生成的报告效果,Fellou 团队找了 60 位用户进行测评,分为五大维度(准确性、描述清晰性、思考深度和广度、可读性),和 OpenAI Deep Research、Manus、Perplexity 做了打分比较,Fellou 浏览器的综合得分展现出优势。

从执行速度层面来看,Fellou 在 49 个任务中的平均耗时为 3.7 分钟,而 Manus 的平均耗时为 18.6 分钟,OpenAI Deep Research 为 11.5 分钟。

Fellou 浏览器的自动化工作流依托于 Fellou 团队自研的浏览器使用框架 Eko,允许用户干预,执行速度较快,单次任务执行成本在 0.3 元 -3 元之间。

三、现阶段主打海外市场,仍存幻觉问题

现场,谢扬与智东西等多家媒体进行了交流。智东西注意到,其官网内提供的 Demo 中存在图表数据错误,在这些数据以可视化形式呈现后,用户对其进行溯源的难度也更高,这对其生成结果的可靠性产生了负面影响。

对此,谢扬回应,在深度行动场景,Fellou 浏览器在检索数据丰富的信息(如某家公司的财报)时准确度较高,但在数据量较小的情况下,确实会出现幻觉。

现阶段,谢扬建议在使用 Fellou 浏览器进行行业分析或决策时,优先参考其提供的结构化的文字信息与引用,Fellou 也在努力解决生成结果中的幻觉问题。

当谈及浏览器领域面临的激烈竞争时,谢扬称 Fellou 团队目前拥有产品、运营、工程与算法部门,团队有打造优秀 to C 产品经验,学历背景包括清华、复旦、斯坦福等知名学府。

谢扬透露,Fellou 浏览器的平均内存占用约为 1.5GB-2GB 左右,Fellou 团队认为有希望将其优化至 400MB-500MB,这将降低其对用户设备的要求。

现阶段,Fellou 浏览器将主打规模更大的海外市场,这一市场对新产品的接受度更高,竞争环境更好,但未来中国也会是重要的市场。

结语:AI 引发浏览器形态升级

浏览器作为互联网的主要入口,在 AI 技术兴起之前,功能较为传统和固定。生成式 AI 为传统浏览器带来了新的发展机遇,浏览器厂商纷纷加入 AI 功能,浏览器 AI 插件或是如 Dia 这样的新形态 AI 浏览器产品层出不穷。

Fellou 本次发布的行动型浏览器是 AI 浏览器领域的最新尝试,现阶段在成本、速度方面具有优势,并通过可视化界面提供了独特的阅读体验。未来,我们或许能看到更多 AI 对浏览器形态带来的变革。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

deep ai 创始人 字节跳动
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论