钛媒体 16小时前
美团AI浏览器,被龙虾截胡了
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 | AIX 财经,作者 | 王璐,编辑 | 魏佳

继腾讯、阿里、百度、360、微软、谷歌、ChatGPT 等国内外科技巨头推出 AI 浏览器后,美团也加入了战局。

3 月 2 日,美团旗下光年之外团队上线 AI 浏览器 Tabbit,并开启免费公测,这一举动很快在业内引发广泛关注。

毕竟,与多数入局者不同,美团既没有浏览器产品的历史积累,也没有搜索业务作为基础设施,从 "AI 原生 " 的定位直接切入这一赛道显得有些激进。

产品上线后不久,Tabbit 即卷入一场抄袭争议。独立开发者 " 梦溪睡了吗 " 指出,Tabbit 与其开源项目 " 陪读蛙 "(ReadFrog)在界面设计、快捷键乃至内部文件名等方面高度相似,并质疑 Tabbit 未严格遵守 GPL 开源协议。随后,Tabbit 回应称对开源协议理解不足,已移除相关代码并开源了修改后的版本,双方几轮公开发声后,事件最终告一段落。

抛开争议,更值得关注的是美团的战略选择。在老牌搜索公司和 AI 创业公司扎堆的 AI 浏览器赛道,一家以本地生活起家的平台入局,是否具备胜算?更为重要的是,当 OpenClaw 这类系统级 Agent 已经开始直接操控电脑时,AI 浏览器是否还是一个有价值的入口?

Tabbit 实测:一款中规中矩的 AI 浏览器

AI 浏览器的概念,从去年开始升温。与传统浏览器的最大区别在于,面对用户抛出的问题,它往往会直接给出总结后的答案,而非甩出一串链接。

从技术路线上看,可以分成两类,一是集成技术路线,在管理网页的基础上,加上 AI 能力和 Chatbot 式交互,谷歌、微软以及国内绝大多数大厂属于这类;二是 AI 原生路线,在开发时就基于 AI 原生架构打造,国外代表为 Comet、Dia、Fellou AI、ChatGPT 的 Atlas,国内的 Tabbit 与夸克 AI 浏览器(以下简称夸克)也属于这类。

综合多位 Agent 从业者的说法,目前无论是集成路线还是原生路线,AI 浏览器功能的实现难度,大致可分为三个等级 :

初级:信息提取与结构化、精确操作与指令跟随;

中级:视觉 - 语言协同、多步规划与页面导航;

高级:长上下文记忆、自主决策与容错能力。

Tabbit 对外宣称具备智能对话、智能代理、标签组管理和快捷操作支持等主要功能。为了适配不同行业,它还提供妙招(Skill)和脚本(Script)功能:妙招功能允许用户将反复使用的提问方式、格式规范和工作流程保存为一键调用的快捷指令;脚本功能则让不懂编程的人也能轻松定制浏览器。这些能力基本符合当前 AI 浏览器产品的普遍形态,但整体来看并未展现出突破性创新。

为了更直观地了解其实际表现,「AIX 财经」选取了三个相同场景,对 Tabbit 与夸克这两款同属 AI 原生路线的产品进行测试。

场景一:让 AI 浏览器打开雪球网行情页面,提取今日涨幅前 10 的股票名称、代码、涨幅百分比,生成表格。

结果显示,Tabbit 完成了一半任务,给出了前十涨幅表格,但将范围自动缩小到了 A 股,夸克则在尝试自动化提取雪球网实时行情数据时出现了问题,显示无法直接提取。

Tabbit 成功提取但范围不准确

夸克直接显示无法提取

我们进一步降低指令难度。让它们访问豆瓣电影 Top250 页面(https://movie.douban.com/top250),提取前 10 部电影的电影名称、导演、上映年份、评分,生成 Markdown 表格。需要指出的是,夸克依托的是千问大模型和千问助手,且千问已深度融合到夸克中,执行回邮件、跨标签分析等众多智能化功能。

夸克整理的电影排名

Tabbit 整理的电影排名

测试结果显示,Tabbit 与夸克均成功完成了数据抓取并生成了表格,但两者输出的内容存在差异。在第三部电影《泰坦尼克号》的数据上出现了分歧。

核查后,我们发现该片在豆瓣的实际评分为 9.5 分,与 Tabbit 的抓取结果一致,夸克存在偏差。这一轮,Tabbit 表现更优。

场景二:让 AI 浏览器在京东、天猫、拼多多搜索 iPhone16Pro 256GB 的价格和库存,需识别现货、缺货、预售等不同表述,选择有货且价格最低的平台,加入购物车但不支付。

测试结果显示,Tabbit 与夸克均无法直接完成加入购物车的自动化操作,但两者呈现出不同的应对策略。

夸克明确提示无法直接访问电商平台,更无法执行加购操作,转而给出的代替方案是,根据公开资料整理了一份 iPhone16Pro 256GB 的各平台报价清单。

Tabbit 则呈现出 " 能访问但执行失败 " 的状态。界面显示其能够访问京东、天猫等平台,并结合了部分数据资料,生成了 " 加入购物车 " 的操作按钮。

然而,当用户点击执行该操作时,系统显示报错,实际并未完成加购流程。这表明 Tabbit 的 Agent 能力并不稳定,最终仍需用户手动跳转至电商平台完成购买。

Tabbit 显示系统错误

场景三:让 AI 浏览器连续 3 天上午 10 点打开某基金净值页面,并复制数字到表格上,如果网页打不开,等 1 小时再试;如果连续 3 次打不开,就放弃并报错。

夸克无法执行定时任务

Tabbit 无法执行定时任务

结果显示,Tabbit 与夸克均无法执行该任务,表示不具备定时任务和后台自动访问网页的能力。

综合三组测试结果可以看出,Tabbit 在信息提取和基础指令执行方面具备一定能力,但在复杂网页环境、跨平台操作等场景下,仍存在不足。这种表现也与当前 AI 浏览器整体的发展阶段相符,它们能在部分场景中提升效率,但距离真正的 " 数字员工 " 还存在明显差距。

既抢入口,也练 Agent

在不少从业者看来,当前无论是国内还是国外,AI 浏览器仍是一个技术复杂、尚未成熟的领域,商业模式也远未清晰。即便如此,美团依然选择推出 Tabbit,背后其想要抢占 AI 时代入口有关。

相比其在本地生活领域稳固的地位,美团在 AI 产品尤其是 C 端产品上的存在感始终不强。

近两年,美团在 B 端的 AI 应用上已取得一定进展,比如面向商家的 AI 应用有 " 袋鼠参谋 "、" 袋鼠管家 ",但在面向普通消费者的 C 端,始终缺乏一款具有代表性的产品。无论是此前推出的 AI 助手 "LongCat",还是美团 App 内的智能搜索入口 " 问小团 ",都未能形成明显的用户心智。

与此同时,AI 助手的竞争已经进入新的阶段。以字节跳动的豆包、阿里的千问、腾讯的元宝为代表的产品,正在从 " 能用 " 走向 " 好用 ",并不断向具体场景延伸。大厂的竞争焦点已不再是谁的 AI 更聪明,而是看谁能成为用户日常使用 AI 的主要入口。

在这样的背景下,AI 浏览器成为一个被重新审视的形态。

与封闭的应用不同,浏览器天然连接整个互联网信息环境,这使其具备一种独特的能力:在同一界面中完成信息获取、决策参考乃至后续操作。叠加 AI 能力后,理论上可以让用户在浏览网页的过程中直接调用智能助手完成任务。

有技术人员以点奶茶举例,用户在千问 APP 中点奶茶,通常是通过 API 接口完成,只能获取阿里生态或合作方开放的结构化数据(如店名、价格、库存)。而 AI 浏览器模式一旦走通,可直接抓取网页上的公开信息,包括各外卖平台的实时价格,以及社交媒体上的用户评价做参考,最终让用户在一个界面内完成查看攻略 - 比价  - 下单的全流程。

当然,正如前文测试中的表现那样,这一能力距离完全成熟仍有距离。但对于像美团这样同时拥有大量商家资源与消费场景的平台来说,如果 AI 浏览器形态能逐步走通,未来确实有可能串联起庞大的 B 端商家与丰富的 C 端消费场景,构建起一个从信息决策到交易的完整闭环。

除了入口意义,AI 浏览器也是美团展示 Agent 能力的重要载体。

资深 Agent 领域专家赵江杰指出,Agent 技术已成为当前 AI 与软件行业最受关注的方向之一。对美团而言,公司需要一个合适的平台来展示其大模型在任务规划、自主执行等方面的能力,但美团 App 功能相对固化、场景集中,并非理想的测试环境。同时,美团还需权衡 Agent 的自主决策对平台现有商业模式(如广告分发和流量闭环)可能产生的冲击。因此,选择更通用、更开放的浏览器作为入口,自然成为技术落地的新方向。

同样还是以 " 点奶茶 " 为例,当用户向千问发出指令时,得到的通常只是一个直接的奶茶推荐结果,用户无法知晓其筛选和决策的过程,而 Tabbit 这类 AI 浏览器的核心优势在于,它能将任务执行过程可视化。即随着技术的成熟,用户可以亲眼看到 AI 是如何一步步操作的:先打开外卖平台页面,输入 " 奶茶 ",然后根据设定的条件(如价格、评分)进行筛选,最终将选定的商品加入购物车。这种交互形式,比封闭的对话式响应更透明、更可信。

从技术布局来看,赵江杰认为,美团自研的 LongCat 大模型基础能力不错,但因为起步较晚,与国内头部梯队相比仍有一定距离,但其在 Agent 方向上投入坚决、聚焦明确,此次推出 Tabbit,是其将模型能力与实际应用场景结合的一次重要尝试。

AI 浏览器,没赶上好时候?

虽然 Tabbit 被视为美团的一次重要尝试,但从市场反馈来看,并没有在行业激起太大水花。

产品上线首日,不少业内人士试用后的评价是 " 与市面上现有的 AI 浏览器功能差异不大 ";次日引发广泛讨论,则是因陷入了抄袭开源代码的争议。

但许多从业者认为,行业的冷静并不完全是 Tabbit 本身的问题,更重要的原因在于,当前行业的注意力已经发生转移。

近期,无论国内还是海外,AI 领域的关注焦点已明显转向能够深度操控操作系统的 Agent,讨论度最高的就是 OpenClaw。展示出的广阔想象空间,让仍停留在应用层的 AI 浏览器显得声势不足。

简单来说,OpenClaw 这类产品的目标,是让 AI 像人一样操作整台电脑:打开软件、填写表格、发送邮件,甚至在不同应用之间完成复杂任务流程。

尽管技术路径不同,但在 " 替代人工完成重复操作 " 这一目标上,AI 浏览器与系统级 Agent 确实存在一定重叠。

比如,当用户需要处理一份数据表格时,AI 浏览器可以操作网页版 Excel,但如果任务涉及多个本地应用,例如处理 Excel 后再发送到微信,目前还难以独立完成。而 OpenClaw 可以直接操作本地 Excel 文件,并在不同软件之间切换,完成整个流程。

这种能力差异的背后,是两类产品在技术架构上的不同。

许多 AI 浏览器执行操作时,会截图再由视觉模型理解画面,最后决策并执行这一套流程,需花费较长时间。

而且在处理图表、游戏等复杂页面时,由于无法解析底层代码,只能依赖像素猜测,导致结果准确率大大降低。此外,各大网站的防爬机制也限制了浏览器的自动化操作。

相比之下,OpenClaw 选择了一条不同的技术路径。它并非 AI 浏览器,而是一个运行在本地的通用 AI Agent,其核心能力之一是控制浏览器。它的独特之处在于,并非依赖多模态视觉模型对页面截图进行理解,而是通过获取系统的 " 辅助功能树 "(Accessibility Tree)快照来解析页面。这些快照会转换为包含按钮、链接、文本框等元素的文本化页面结构描述,大语言模型(LLM)通过阅读这些文本来 " 看见 " 并理解界面。

简而言之,如果说传统 AI 浏览器是从 " 系统外部 " 猜测界面,那么 OpenClaw 则是从 " 系统内部 " 直接理解界面。这种更接近底层、更结构化的理解方式,也是许多用户感觉 OpenClaw 表现更为智能的主要原因。

不过,能力越强,也意味着更高的风险与门槛。

一方面,系统级 Agent 需要获得更高的操作权限,一旦指令理解出现偏差,就可能造成误操作,造成失控风险有用户曾报告其 OpenClaw 因指令异常,自动删除邮箱邮件,这也让安全问题成为业内讨论的焦点。

另一方面,OpenClaw 的使用门槛也较高其部署过程复杂,对普通用户不够友好,甚至催生了从数百元到数千美元不等的付费教安装服务。而且持续调用大模型 API 将产生高昂费用,一些重度用户每月开销可达数百美元,被戏称为 " 贷款上班 "。

从更长远的视角看,AI 浏览器与系统级 Agent 或许并不是简单的替代关系,而更像是 Agent 发展的两条不同路径:前者依托浏览器这一成熟入口,更容易触达普通用户并快速规模化;后者能力边界更大,但在安全、成本上仍有门槛。

在这样的行业背景下,Tabbit 的处境也颇为微妙。它既是在探索 AI 浏览器这一尚未定型的赛道,也不得不面对一个现实,行业注意力正被更具想象空间的系统级 Agent 所吸引。Tabbit 能否突围,就得看产品进化的速度能不能跟得上大家的期待了。

评论
大家都在看