美团AI浏览器，被龙虾截胡了

文 | AIX 财经，作者 | 王璐，编辑 | 魏佳

继腾讯、阿里、百度、360、微软、谷歌、ChatGPT 等国内外科技巨头推出 AI 浏览器后，美团也加入了战局。

3 月 2 日，美团旗下光年之外团队上线 AI 浏览器 Tabbit，并开启免费公测，这一举动很快在业内引发广泛关注。

毕竟，与多数入局者不同，美团既没有浏览器产品的历史积累，也没有搜索业务作为基础设施，从 "AI 原生 " 的定位直接切入这一赛道显得有些激进。

产品上线后不久，Tabbit 即卷入一场抄袭争议。独立开发者 " 梦溪睡了吗 " 指出，Tabbit 与其开源项目 " 陪读蛙 "（ReadFrog）在界面设计、快捷键乃至内部文件名等方面高度相似，并质疑 Tabbit 未严格遵守 GPL 开源协议。随后，Tabbit 回应称对开源协议理解不足，已移除相关代码并开源了修改后的版本，双方几轮公开发声后，事件最终告一段落。

抛开争议，更值得关注的是美团的战略选择。在老牌搜索公司和 AI 创业公司扎堆的 AI 浏览器赛道，一家以本地生活起家的平台入局，是否具备胜算？更为重要的是，当 OpenClaw 这类系统级 Agent 已经开始直接操控电脑时，AI 浏览器是否还是一个有价值的入口？

Tabbit 实测：一款中规中矩的 AI 浏览器

AI 浏览器的概念，从去年开始升温。与传统浏览器的最大区别在于，面对用户抛出的问题，它往往会直接给出总结后的答案，而非甩出一串链接。

从技术路线上看，可以分成两类，一是集成技术路线，在管理网页的基础上，加上 AI 能力和 Chatbot 式交互，谷歌、微软以及国内绝大多数大厂属于这类；二是 AI 原生路线，在开发时就基于 AI 原生架构打造，国外代表为 Comet、Dia、Fellou AI、ChatGPT 的 Atlas，国内的 Tabbit 与夸克 AI 浏览器（以下简称夸克）也属于这类。

综合多位 Agent 从业者的说法，目前无论是集成路线还是原生路线，AI 浏览器功能的实现难度，大致可分为三个等级 :

初级：信息提取与结构化、精确操作与指令跟随；

中级：视觉 - 语言协同、多步规划与页面导航；

高级：长上下文记忆、自主决策与容错能力。

Tabbit 对外宣称具备智能对话、智能代理、标签组管理和快捷操作支持等主要功能。为了适配不同行业，它还提供妙招（Skill）和脚本（Script）功能：妙招功能允许用户将反复使用的提问方式、格式规范和工作流程保存为一键调用的快捷指令；脚本功能则让不懂编程的人也能轻松定制浏览器。这些能力基本符合当前 AI 浏览器产品的普遍形态，但整体来看并未展现出突破性创新。

为了更直观地了解其实际表现，「AIX 财经」选取了三个相同场景，对 Tabbit 与夸克这两款同属 AI 原生路线的产品进行测试。

场景一：让 AI 浏览器打开雪球网行情页面，提取今日涨幅前 10 的股票名称、代码、涨幅百分比，生成表格。

结果显示，Tabbit 完成了一半任务，给出了前十涨幅表格，但将范围自动缩小到了 A 股，夸克则在尝试自动化提取雪球网实时行情数据时出现了问题，显示无法直接提取。

Tabbit 成功提取但范围不准确

夸克直接显示无法提取

我们进一步降低指令难度。让它们访问豆瓣电影 Top250 页面（https://movie.douban.com/top250），提取前 10 部电影的电影名称、导演、上映年份、评分，生成 Markdown 表格。需要指出的是，夸克依托的是千问大模型和千问助手，且千问已深度融合到夸克中，执行回邮件、跨标签分析等众多智能化功能。

夸克整理的电影排名

Tabbit 整理的电影排名

测试结果显示，Tabbit 与夸克均成功完成了数据抓取并生成了表格，但两者输出的内容存在差异。在第三部电影《泰坦尼克号》的数据上出现了分歧。

核查后，我们发现该片在豆瓣的实际评分为 9.5 分，与 Tabbit 的抓取结果一致，夸克存在偏差。这一轮，Tabbit 表现更优。

场景二：让 AI 浏览器在京东、天猫、拼多多搜索 iPhone16Pro 256GB 的价格和库存，需识别现货、缺货、预售等不同表述，选择有货且价格最低的平台，加入购物车但不支付。

测试结果显示，Tabbit 与夸克均无法直接完成加入购物车的自动化操作，但两者呈现出不同的应对策略。

夸克明确提示无法直接访问电商平台，更无法执行加购操作，转而给出的代替方案是，根据公开资料整理了一份 iPhone16Pro 256GB 的各平台报价清单。

Tabbit 则呈现出 " 能访问但执行失败 " 的状态。界面显示其能够访问京东、天猫等平台，并结合了部分数据资料，生成了 " 加入购物车 " 的操作按钮。

然而，当用户点击执行该操作时，系统显示报错，实际并未完成加购流程。这表明 Tabbit 的 Agent 能力并不稳定，最终仍需用户手动跳转至电商平台完成购买。

Tabbit 显示系统错误

场景三：让 AI 浏览器连续 3 天上午 10 点打开某基金净值页面，并复制数字到表格上，如果网页打不开，等 1 小时再试；如果连续 3 次打不开，就放弃并报错。

夸克无法执行定时任务

Tabbit 无法执行定时任务

结果显示，Tabbit 与夸克均无法执行该任务，表示不具备定时任务和后台自动访问网页的能力。

综合三组测试结果可以看出，Tabbit 在信息提取和基础指令执行方面具备一定能力，但在复杂网页环境、跨平台操作等场景下，仍存在不足。这种表现也与当前 AI 浏览器整体的发展阶段相符，它们能在部分场景中提升效率，但距离真正的 " 数字员工 " 还存在明显差距。

既抢入口，也练 Agent

在不少从业者看来，当前无论是国内还是国外，AI 浏览器仍是一个技术复杂、尚未成熟的领域，商业模式也远未清晰。即便如此，美团依然选择推出 Tabbit，背后与其想要抢占 AI 时代的入口有关。

相比其在本地生活领域稳固的地位，美团在 AI 产品尤其是 C 端产品上的存在感始终不强。

近两年，美团在 B 端的 AI 应用上已取得一定进展，比如面向商家的 AI 应用有 " 袋鼠参谋 "、" 袋鼠管家 "，但在面向普通消费者的 C 端，始终缺乏一款具有代表性的产品。无论是此前推出的 AI 助手 "LongCat"，还是美团 App 内的智能搜索入口 " 问小团 "，都未能形成明显的用户心智。

与此同时，AI 助手的竞争已经进入新的阶段。以字节跳动的豆包、阿里的千问、腾讯的元宝为代表的产品，正在从 " 能用 " 走向 " 好用 "，并不断向具体场景延伸。大厂的竞争焦点已不再是谁的 AI 更聪明，而是看谁能成为用户日常使用 AI 的主要入口。

在这样的背景下，AI 浏览器成为一个被重新审视的形态。

与封闭的应用不同，浏览器天然连接整个互联网信息环境，这使其具备一种独特的能力：在同一界面中完成信息获取、决策参考乃至后续操作。叠加 AI 能力后，理论上可以让用户在浏览网页的过程中直接调用智能助手完成任务。

有技术人员以点奶茶举例，用户在千问 APP 中点奶茶，通常是通过 API 接口完成，只能获取阿里生态或合作方开放的结构化数据（如店名、价格、库存）。而 AI 浏览器模式一旦走通，可直接抓取网页上的公开信息，包括各外卖平台的实时价格，以及社交媒体上的用户评价做参考，最终让用户在一个界面内完成查看攻略 - 比价  - 下单的全流程。

当然，正如前文测试中的表现那样，这一能力距离完全成熟仍有距离。但对于像美团这样同时拥有大量商家资源与消费场景的平台来说，如果 AI 浏览器形态能逐步走通，未来确实有可能串联起庞大的 B 端商家与丰富的 C 端消费场景，构建起一个从信息决策到交易的完整闭环。

除了入口意义，AI 浏览器也是美团展示 Agent 能力的重要载体。

资深 Agent 领域专家赵江杰指出，Agent 技术已成为当前 AI 与软件行业最受关注的方向之一。对美团而言，公司需要一个合适的平台来展示其大模型在任务规划、自主执行等方面的能力，但美团 App 功能相对固化、场景集中，并非理想的测试环境。同时，美团还需权衡 Agent 的自主决策对平台现有商业模式（如广告分发和流量闭环）可能产生的冲击。因此，选择更通用、更开放的浏览器作为入口，自然成为技术落地的新方向。

同样还是以 " 点奶茶 " 为例，当用户向千问发出指令时，得到的通常只是一个直接的奶茶推荐结果，用户无法知晓其筛选和决策的过程，而 Tabbit 这类 AI 浏览器的核心优势在于，它能将任务执行过程可视化。即随着技术的成熟，用户可以亲眼看到 AI 是如何一步步操作的：先打开外卖平台页面，输入 " 奶茶 "，然后根据设定的条件（如价格、评分）进行筛选，最终将选定的商品加入购物车。这种交互形式，比封闭的对话式响应更透明、更可信。

从技术布局来看，赵江杰认为，美团自研的 LongCat 大模型基础能力不错，但因为起步较晚，与国内头部梯队相比仍有一定距离，但其在 Agent 方向上投入坚决、聚焦明确，此次推出 Tabbit，是其将模型能力与实际应用场景结合的一次重要尝试。

AI 浏览器，没赶上好时候？

虽然 Tabbit 被视为美团的一次重要尝试，但从市场反馈来看，并没有在行业激起太大水花。

产品上线首日，不少业内人士试用后的评价是 " 与市面上现有的 AI 浏览器功能差异不大 "；次日引发广泛讨论，则是因陷入了抄袭开源代码的争议。

但许多从业者认为，行业的冷静并不完全是 Tabbit 本身的问题，更重要的原因在于，当前行业的注意力已经发生转移。

近期，无论国内还是海外，AI 领域的关注焦点已明显转向能够深度操控操作系统的 Agent，讨论度最高的就是 OpenClaw。其展示出的广阔想象空间，让仍停留在应用层的 AI 浏览器显得声势不足。

简单来说，OpenClaw 这类产品的目标，是让 AI 像人一样操作整台电脑：打开软件、填写表格、发送邮件，甚至在不同应用之间完成复杂任务流程。

尽管技术路径不同，但在 " 替代人工完成重复操作 " 这一目标上，AI 浏览器与系统级 Agent 确实存在一定重叠。

比如，当用户需要处理一份数据表格时，AI 浏览器可以操作网页版 Excel，但如果任务涉及多个本地应用，例如处理 Excel 后再发送到微信，目前还难以独立完成。而 OpenClaw 可以直接操作本地 Excel 文件，并在不同软件之间切换，完成整个流程。

这种能力差异的背后，是两类产品在技术架构上的不同。

许多 AI 浏览器执行操作时，会截图再由视觉模型理解画面，最后决策并执行这一套流程，需花费较长时间。

而且在处理图表、游戏等复杂页面时，由于无法解析底层代码，只能依赖像素猜测，导致结果准确率大大降低。此外，各大网站的防爬机制也限制了浏览器的自动化操作。

相比之下，OpenClaw 选择了一条不同的技术路径。它并非 AI 浏览器，而是一个运行在本地的通用 AI Agent，其核心能力之一是控制浏览器。它的独特之处在于，并非依赖多模态视觉模型对页面截图进行理解，而是通过获取系统的 " 辅助功能树 "（Accessibility Tree）快照来解析页面。这些快照会转换为包含按钮、链接、文本框等元素的文本化页面结构描述，大语言模型（LLM）通过阅读这些文本来 " 看见 " 并理解界面。

简而言之，如果说传统 AI 浏览器是从 " 系统外部 " 猜测界面，那么 OpenClaw 则是从 " 系统内部 " 直接理解界面。这种更接近底层、更结构化的理解方式，也是许多用户感觉 OpenClaw 表现更为智能的主要原因。

不过，能力越强，也意味着更高的风险与门槛。

一方面，系统级 Agent 需要获得更高的操作权限，一旦指令理解出现偏差，就可能造成误操作，造成失控风险。有用户曾报告其 OpenClaw 因指令异常，自动删除邮箱邮件，这也让安全问题成为业内讨论的焦点。

另一方面，OpenClaw 的使用门槛也较高。其部署过程复杂，对普通用户不够友好，甚至催生了从数百元到数千美元不等的付费教安装服务。而且持续调用大模型 API 将产生高昂费用，一些重度用户每月开销可达数百美元，被戏称为 " 贷款上班 "。

从更长远的视角看，AI 浏览器与系统级 Agent 或许并不是简单的替代关系，而更像是 Agent 发展的两条不同路径：前者依托浏览器这一成熟入口，更容易触达普通用户并快速规模化；后者能力边界更大，但在安全、成本上仍有门槛。

在这样的行业背景下，Tabbit 的处境也颇为微妙。它既是在探索 AI 浏览器这一尚未定型的赛道，也不得不面对一个现实，行业注意力正被更具想象空间的系统级 Agent 所吸引。Tabbit 能否突围，就得看产品进化的速度能不能跟得上大家的期待了。