返回列表

美团AI浏览器，被龙虾截胡了_Tabbit_结果显示_操作_宁城网站建设_网站建设公司_网站建设设计制作_seo优化

发布者：admin发布时间：{dede:field name='pubdate'function='strftime("%Y-%m-%d %H:%M:%S",@me)' /}

AIX财经（AIXcaijing）原创

作者 | 王璐

编辑 | 魏佳

继腾讯、阿里、百度、360、微软、谷歌、ChatGPT等国内外科技巨头推出AI浏览器后，美团也加入了战局。

3月2日，美团旗下光年之外团队上线AI浏览器Tabbit，并开启免费公测，这一举动很快在业内引发广泛关注。

毕竟，与多数入局者不同，美团既没有浏览器产品的历史积累，也没有搜索业务作为基础设施，从“AI原生”的定位直接切入这一赛道显得有些激进。

产品上线后不久，Tabbit即卷入一场抄袭争议。独立开发者“梦溪睡了吗”指出，Tabbit与其开源项目“陪读蛙”（ReadFrog）在界面设计、快捷键乃至内部文件名等方面高度相似，并质疑Tabbit未严格遵守GPL开源协议。随后，Tabbit回应称对开源协议理解不足，已移除相关代码并开源了修改后的版本，双方几轮公开发声后，***最终告一段落。

抛开争议，更值得关注的是美团的战略选择。在老牌搜索公司和AI创业公司扎堆的AI浏览器赛道，一家以本地生活起家的平台入局，是否具备胜算？更为重要的是，当OpenClaw这类系统级Agent已经开始直接操控电脑时，AI浏览器是否还是一个有价值的入口？

Tabbit实测：一款中规中矩的AI浏览器

AI浏览器的概念，从去年开始升温。与传统浏览器的最大区别在于，面对用户抛出的问题，它往往会直接给出总结后的答案，而非甩出一串链接。

从技术路线上看，可以分成两类，一是集成技术路线，在管理网页的基础上，加上AI能力和Chatbot式交互，谷歌、微软以及国内绝大多数大厂属于这类；二是AI原生路线，在开发时就基于AI原生架构打造，国外代表为Comet、Dia、Fellou AI、ChatGPT的Atlas，国内的Tabbit与夸克AI浏览器（以下简称夸克）也属于这类。

展开全文

综合多位Agent从业者的说法，目前无论是集成路线还是原生路线，AI浏览器功能的实现难度，大致可分为三个等级:

初级：信息提取与结构化、精确操作与指令跟随；

中级：视觉-语言协同、多步规划与页面导航；

高级：长上下文记忆、自主决策与容错能力。

Tabbit对外宣称具备智能对话、智能代理、标签组管理和快捷操作支持等主要功能。为了适配不同行业，它还提供妙招（Skill）和脚本（Script）功能：妙招功能允许用户将反复使用的提问方式、格式规范和工作流程保存为一键调用的快捷指令；脚本功能则让不懂编程的人也能轻松定制浏览器。这些能力基本符合当前AI浏览器产品的普遍形态，但整体来看并未展现出突破性创新。

为了更直观地了解其实际表现，「AIX财经」选取了三个相同场景，对Tabbit与夸克这两款同属AI原生路线的产品进行测试。

场景一：让AI浏览器打开雪球网行情页面，提取今日涨幅前10的股票名称、代码、涨幅百分比，生成表格。

结果显示，Tabbit完成了一半任务，给出了前十涨幅表格，但将范围自动缩小到了A股，夸克则在尝试自动化提取雪球网实时行情数据时出现了问题，显示无法直接提取。

Tabbit成功提取但范围不准确

夸克直接显示无法提取

我们进一步降低指令难度。让它们访问豆瓣电影Top250页面（

***s://movie.douban***/top250），提取前10部电影的电影名称、导演、上映年份、评分，生成Markdown表格。需要指出的是，夸克依托的是千问大模型和千问助手，且千问已深度融合到夸克中，执行回邮件、跨标签分析等众多智能化功能。

夸克整理的电影排名

Tabbit整理的电影排名

测试结果显示，Tabbit与夸克均成功完成了数据抓取并生成了表格，但两者输出的内容存在差异。在第三部电影《泰坦尼克号》的数据上出现了分歧。

核查后，我们发现该片在豆瓣的实际评分为9.5分，与Tabbit的抓取结果一致，夸克存在偏差。这一轮，Tabbit表现更优。

场景二：让AI浏览器在京东、天猫、拼多多搜索iPhone16Pro 256GB的价格和库存，需识别现货、缺货、预售等不同表述，选择有货且价格最低的平台，加入购物车但不支付。

测试结果显示，Tabbit与夸克均无法直接完成加入购物车的自动化操作，但两者呈现出不同的应对策略。

夸克明确提示无法直接访问电商平台，更无法执行加购操作，转而给出的代替方案是，根据公开资料整理了一份iPhone16Pro 256GB的各平台报价清单。

Tabbit则呈现出“能访问但执行失败”的状态。界面显示其能够访问京东、天猫等平台，并结合了部分数据资料，生成了“加入购物车”的操作按钮。

然而，当用户点击执行该操作时，系统显示报错，实际并未完成加购流程。这表明Tabbit的Agent能力并不稳定，最终仍需用户手动跳转至电商平台完成购买。

Tabbit显示系统错误

场景三：让AI浏览器连续3天上午10点打开某基金净值页面，并复制数字到表格上，如果网页打不开，等1小时再试；如果连续3次打不开，就放弃并报错。

夸克无法执行定时任务

Tabbit无法执行定时任务

结果显示，Tabbit与夸克均无法执行该任务，表示不具备定时任务和后台自动访问网页的能力。

综合三组测试结果可以看出，Tabbit在信息提取和基础指令执行方面具备一定能力，但在复杂网页环境、跨平台操作等场景下，仍存在不足。这种表现也与当前AI浏览器整体的发展阶段相符，它们能在部分场景中提升效率，但距离真正的“数字员工”还存在明显差距。

既抢入口，也练Agent

在不少从业者看来，当前无论是国内还是国外，AI浏览器仍是一个技术复杂、尚未成熟的领域，商业模式也远未清晰。即便如此，美团依然选择推出Tabbit，背后与其想要抢占AI时代的入口有关。

相比其在本地生活领域稳固的地位，美团在AI产品尤其是C端产品上的存在感始终不强。

近两年，美团在B端的AI应用上已取得一定进展，比如面向商家的AI应用有“袋鼠参谋”、“袋鼠管家”，但在面向普通消费者的C端，始终缺乏一款具有代表性的产品。无论是此前推出的AI助手“LongCat”，还是美团App内的智能搜索入口“问小团”，都未能形成明显的用户心智。

与此同时，AI助手的竞争已经进入新的阶段。以字节跳动的豆包、阿里的千问、腾讯的元宝为代表的产品，正在从“能用”走向“好用”，并不断向具体场景延伸。大厂的竞争焦点已不再是谁的AI更聪明，而是看谁能成为用户日常使用AI的主要入口。

在这样的背景下，AI浏览器成为一个被重新审视的形态。

与封闭的应用不同，浏览器天然连接整个互联网信息环境，这使其具备一种独特的能力：在同一界面中完成信息获取、决策参考乃至后续操作。叠加AI能力后，理论上可以让用户在浏览网页的过程中直接调用智能助手完成任务。

图源 / pexels

有技术人员以点奶茶举例，用户在千问APP中点奶茶，通常是通过API接口完成，只能获取阿里生态或合作方开放的结构化数据（如店名、价格、库存）。而AI浏览器模式一旦走通，可直接抓取网页上的公开信息，包括各外卖平台的实时价格，以及社交媒体上的用户评价做参考，最终让用户在一个界面内完成查看攻略-比价 -下单的全流程。

当然，正如前文测试中的表现那样，这一能力距离完全成熟仍有距离。但对于像美团这样同时拥有大量商家***与消费场景的平台来说，如果AI浏览器形态能逐步走通，未来确实有可能串联起庞大的B端商家与丰富的C端消费场景，构建起一个从信息决策到交易的完整闭环。

除了入口意义，AI浏览器也是美团展示Agent能力的重要载体。

资深Agent领域专家赵江杰指出，Agent技术已成为当前AI与软件行业最受关注的方向之一。对美团而言，公司需要一个合适的平台来展示其大模型在任务规划、自主执行等方面的能力，但美团App功能相对固化、场景集中，并非理想的测试环境。同时，美团还需权衡Agent的自主决策对平台现有商业模式（如广告分发和流量闭环）可能产生的冲击。因此，选择更通用、更开放的浏览器作为入口，自然成为技术落地的新方向。

同样还是以“点奶茶”为例，当用户向千问发出指令时，得到的通常只是一个直接的奶茶推荐结果，用户无法知晓其筛选和决策的过程，而Tabbit这类AI浏览器的核心优势在于，它能将任务执行过程可视化。即随着技术的成熟，用户可以亲眼看到AI是如何一步步操作的：先打开外卖平台页面，输入“奶茶”，然后根据设定的条件（如价格、评分）进行筛选，最终将选定的商品加入购物车。这种交互形式，比封闭的对话式响应更透明、更可信。

从技术布局来看，赵江杰认为，美团自研的LongCat大模型基础能力不错，但因为起步较晚，与国内头部梯队相比仍有一定距离，但其在Agent方向上投入坚决、聚焦明确，此次推出Tabbit，是其将模型能力与实际应用场景结合的一次重要尝试。

AI浏览器，没赶上好时候？

虽然Tabbit被视为美团的一次重要尝试，但从市场反馈来看，并没有在行业激起太大水花。

产品上线首日，不少业内人士试用后的评价是“与市面上现有的AI浏览器功能差异不大”；次日引发广泛讨论，则是因陷入了抄袭开源代码的争议。

但许多从业者认为，行业的冷静并不完全是Tabbit本身的问题，更重要的原因在于，当前行业的注意力已经发生转移。

近期，无论国内还是海外，AI领域的关注焦点已明显转向能够深度操控操作系统的Agent，讨论度最高的就是OpenClaw。其展示出的广阔想象空间，让仍停留在应用层的AI浏览器显得声势不足。

简单来说，OpenClaw这类产品的目标，是让AI像人一样操作整台电脑：打开软件、填写表格、发送邮件，甚至在不同应用之间完成复杂任务流程。

尽管技术路径不同，但在“替代人工完成重复操作”这一目标上，AI浏览器与系统级Agent确实存在一定重叠。

比如，当用户需要处理一份数据表格时，AI浏览器可以操作网页版Excel，但如果任务涉及多个本地应用，例如处理Excel后再发送到微信，目前还难以独立完成。而OpenClaw可以直接操作本地Excel文件，并在不同软件之间切换，完成整个流程。

这种能力差异的背后，是两类产品在技术架构上的不同。

许多AI浏览器执行操作时，会截图再由视觉模型理解画面，最后决策并执行这一套流程，需花费较长时间。

图源 / pexels

而且在处理图表、游戏等复杂页面时，由于无法解析底层代码，只能依赖像素猜测，导致结果准确率大大降低。此外，各大网站的防爬机制也限制了浏览器的自动化操作。

相比之下，OpenClaw 选择了一条不同的技术路径。它并非AI浏览器，而是一个运行在本地的通用AI Agent，其核心能力之一是控制浏览器。它的独特之处在于，并非依赖多模态视觉模型对页面截图进行理解，而是通过获取系统的“辅助功能树”（Accessibility Tree）快照来解析页面。这些快照会转换为包含按钮、链接、文本框等元素的文本化页面结构描述，大语言模型（LLM）通过阅读这些文本来“看见”并理解界面。

简而言之，如果说传统AI浏览器是从“系统外部”猜测界面，那么OpenClaw则是从“系统内部”直接理解界面。这种更接近底层、更结构化的理解方式，也是许多用户感觉OpenClaw表现更为智能的主要原因。

不过，能力越强，也意味着更高的风险与门槛。

一方面，系统级Agent需要获得更高的操作权限，一旦指令理解出现偏差，就可能造成误操作，造成失控风险。有用户曾报告其OpenClaw因指令异常，自动删除邮箱邮件，这也让安全问题成为业内讨论的焦点。

另一方面，OpenClaw的使用门槛也较高。其部署过程复杂，对普通用户不够友好，甚至催生了从数百元到数千美元不等的付费教安装服务。而且持续调用大模型API将产生高昂费用，一些重度用户每月开销可达数百美元，被戏称为“贷款上班”。

从更长远的视角看，AI浏览器与系统级Agent或许并不是简单的替代关系，而更像是Agent发展的两条不同路径：前者依托浏览器这一成熟入口，更容易触达普通用户并快速规模化；后者能力边界更大，但在安全、成本上仍有门槛。

在这样的行业背景下，Tabbit的处境也颇为微妙。它既是在探索AI浏览器这一尚未定型的赛道，也不得不面对一个现实，行业注意力正被更具想象空间的系统级Agent所吸引。Tabbit能否突围，就得看产品进化的速度能不能跟得上大家的期待了。

*题图来源于pexels。返回搜狐，查看更多

上一篇 : 用PHP写了个小框架，怎么才能得到大佬们的指点？下一篇 : 和女生合租，都会发生什么事情？