返回列表
美团AI浏览器,被龙虾截胡了_Tabbit_结果显示_操作_宁城网站建设_网站建设公司_网站建设设计制作_seo优化
发布者:admin发布时间:{dede:field name='pubdate'function='strftime("%Y-%m-%d %H:%M:%S",@me)' /}

AIX财经(AIXcaijing)原创

作者 | 王璐

编辑 | 魏佳

继腾讯、阿里、百度、360、微软、谷歌、ChatGPT等国内外科技巨头推出AI浏览器后,美团也加入了战局。

3月2日,美团旗下光年之外团队上线AI浏览器Tabbit,并开启免费公测,这一举动很快在业内引发广泛关注。

毕竟,与多数入局者不同,美团既没有浏览器产品的历史积累,也没有搜索业务作为基础设施,从“AI原生”的定位直接切入这一赛道显得有些激进。

产品上线后不久,Tabbit即卷入一场抄袭争议。独立开发者“梦溪睡了吗”指出,Tabbit与其开源项目“陪读蛙”(ReadFrog)在界面设计、快捷键乃至内部文件名等方面高度相似,并质疑Tabbit未严格遵守GPL开源协议。随后,Tabbit回应称对开源协议理解不足,已移除相关代码并开源了修改后的版本,双方几轮公开发声后,***最终告一段落。

抛开争议,更值得关注的是美团的战略选择。在老牌搜索公司和AI创业公司扎堆的AI浏览器赛道,一家以本地生活起家的平台入局,是否具备胜算?更为重要的是,当OpenClaw这类系统级Agent已经开始直接操控电脑时,AI浏览器是否还是一个有价值的入口?

Tabbit实测:一款中规中矩的AI浏览器

AI浏览器的概念,从去年开始升温。与传统浏览器的最大区别在于,面对用户抛出的问题,它往往会直接给出总结后的答案,而非甩出一串链接。

从技术路线上看,可以分成两类,一是集成技术路线,在管理网页的基础上,加上AI能力和Chatbot式交互,谷歌、微软以及国内绝大多数大厂属于这类;二是AI原生路线,在开发时就基于AI原生架构打造,国外代表为Comet、Dia、Fellou AI、ChatGPT的Atlas,国内的Tabbit与夸克AI浏览器(以下简称夸克)也属于这类。

展开全文

综合多位Agent从业者的说法,目前无论是集成路线还是原生路线,AI浏览器功能的实现难度,大致可分为三个等级:

初级:信息提取与结构化、精确操作与指令跟随;
中级:视觉-语言协同、多步规划与页面导航;
高级:长上下文记忆、自主决策与容错能力。

Tabbit对外宣称具备智能对话、智能代理、标签组管理和快捷操作支持等主要功能。为了适配不同行业,它还提供妙招(Skill)和脚本(Script)功能:妙招功能允许用户将反复使用的提问方式、格式规范和工作流程保存为一键调用的快捷指令;脚本功能则让不懂编程的人也能轻松定制浏览器。这些能力基本符合当前AI浏览器产品的普遍形态,但整体来看并未展现出突破性创新。

为了更直观地了解其实际表现,「AIX财经」选取了三个相同场景,对Tabbit与夸克这两款同属AI原生路线的产品进行测试。

场景一:让AI浏览器打开雪球网行情页面,提取今日涨幅前10的股票名称、代码、涨幅百分比,生成表格。

结果显示,Tabbit完成了一半任务,给出了前十涨幅表格,但将范围自动缩小到了A股,夸克则在尝试自动化提取雪球网实时行情数据时出现了问题,显示无法直接提取。

Tabbit成功提取但范围不准确

夸克直接显示无法提取

我们进一步降低指令难度。让它们访问豆瓣电影Top250页面(

***s://movie.douban***/top250),提取前10部电影的电影名称、导演、上映年份、评分,生成Markdown表格。需要指出的是,夸克依托的是千问大模型和千问助手,且千问已深度融合到夸克中,执行回邮件、跨标签分析等众多智能化功能。

夸克整理的电影排名

Tabbit整理的电影排名

测试结果显示,Tabbit与夸克均成功完成了数据抓取并生成了表格,但两者输出的内容存在差异。在第三部电影《泰坦尼克号》的数据上出现了分歧。

核查后,我们发现该片在豆瓣的实际评分为9.5分,与Tabbit的抓取结果一致,夸克存在偏差。这一轮,Tabbit表现更优。

场景二:让AI浏览器在京东、天猫、拼多多搜索iPhone16Pro 256GB的价格和库存,需识别现货、缺货、预售等不同表述,选择有货且价格最低的平台,加入购物车但不支付。

测试结果显示,Tabbit与夸克均无法直接完成加入购物车的自动化操作,但两者呈现出不同的应对策略。

夸克明确提示无法直接访问电商平台,更无法执行加购操作,转而给出的代替方案是,根据公开资料整理了一份iPhone16Pro 256GB的各平台报价清单。

Tabbit则呈现出“能访问但执行失败”的状态。界面显示其能够访问京东、天猫等平台,并结合了部分数据资料,生成了“加入购物车”的操作按钮。

然而,当用户点击执行该操作时,系统显示报错,实际并未完成加购流程。这表明Tabbit的Agent能力并不稳定,最终仍需用户手动跳转至电商平台完成购买。

Tabbit显示系统错误

场景三:让AI浏览器连续3天上午10点打开某基金净值页面,并复制数字到表格上,如果网页打不开,等1小时再试;如果连续3次打不开,就放弃并报错。

夸克无法执行定时任务

Tabbit无法执行定时任务

结果显示,Tabbit与夸克均无法执行该任务,表示不具备定时任务和后台自动访问网页的能力。

综合三组测试结果可以看出,Tabbit在信息提取和基础指令执行方面具备一定能力,但在复杂网页环境、跨平台操作等场景下,仍存在不足。这种表现也与当前AI浏览器整体的发展阶段相符,它们能在部分场景中提升效率,但距离真正的“数字员工”还存在明显差距。

既抢入口,也练Agent

在不少从业者看来,当前无论是国内还是国外,AI浏览器仍是一个技术复杂、尚未成熟的领域,商业模式也远未清晰。即便如此,美团依然选择推出Tabbit,背后与其想要抢占AI时代的入口有关。

相比其在本地生活领域稳固的地位,美团在AI产品尤其是C端产品上的存在感始终不强。

近两年,美团在B端的AI应用上已取得一定进展,比如面向商家的AI应用有“袋鼠参谋”、“袋鼠管家”,但在面向普通消费者的C端,始终缺乏一款具有代表性的产品。无论是此前推出的AI助手“LongCat”,还是美团App内的智能搜索入口“问小团”,都未能形成明显的用户心智。

与此同时,AI助手的竞争已经进入新的阶段。以字节跳动的豆包、阿里的千问、腾讯的元宝为代表的产品,正在从“能用”走向“好用”,并不断向具体场景延伸。大厂的竞争焦点已不再是谁的AI更聪明,而是看谁能成为用户日常使用AI的主要入口。

在这样的背景下,AI浏览器成为一个被重新审视的形态。

与封闭的应用不同,浏览器天然连接整个互联网信息环境,这使其具备一种独特的能力:在同一界面中完成信息获取、决策参考乃至后续操作。叠加AI能力后,理论上可以让用户在浏览网页的过程中直接调用智能助手完成任务。

图源 / pexels

有技术人员以点奶茶举例,用户在千问APP中点奶茶,通常是通过API接口完成,只能获取阿里生态或合作方开放的结构化数据(如店名、价格、库存)。而AI浏览器模式一旦走通,可直接抓取网页上的公开信息,包括各外卖平台的实时价格,以及社交媒体上的用户评价做参考,最终让用户在一个界面内完成查看攻略-比价 -下单的全流程。

当然,正如前文测试中的表现那样,这一能力距离完全成熟仍有距离。但对于像美团这样同时拥有大量商家***与消费场景的平台来说,如果AI浏览器形态能逐步走通,未来确实有可能串联起庞大的B端商家与丰富的C端消费场景,构建起一个从信息决策到交易的完整闭环。

除了入口意义,AI浏览器也是美团展示Agent能力的重要载体。

资深Agent领域专家赵江杰指出,Agent技术已成为当前AI与软件行业最受关注的方向之一。对美团而言,公司需要一个合适的平台来展示其大模型在任务规划、自主执行等方面的能力,但美团App功能相对固化、场景集中,并非理想的测试环境。同时,美团还需权衡Agent的自主决策对平台现有商业模式(如广告分发和流量闭环)可能产生的冲击。因此,选择更通用、更开放的浏览器作为入口,自然成为技术落地的新方向。

同样还是以“点奶茶”为例,当用户向千问发出指令时,得到的通常只是一个直接的奶茶推荐结果,用户无法知晓其筛选和决策的过程,而Tabbit这类AI浏览器的核心优势在于,它能将任务执行过程可视化。即随着技术的成熟,用户可以亲眼看到AI是如何一步步操作的:先打开外卖平台页面,输入“奶茶”,然后根据设定的条件(如价格、评分)进行筛选,最终将选定的商品加入购物车。这种交互形式,比封闭的对话式响应更透明、更可信。

从技术布局来看,赵江杰认为,美团自研的LongCat大模型基础能力不错,但因为起步较晚,与国内头部梯队相比仍有一定距离,但其在Agent方向上投入坚决、聚焦明确,此次推出Tabbit,是其将模型能力与实际应用场景结合的一次重要尝试。

AI浏览器,没赶上好时候?

虽然Tabbit被视为美团的一次重要尝试,但从市场反馈来看,并没有在行业激起太大水花。

产品上线首日,不少业内人士试用后的评价是“与市面上现有的AI浏览器功能差异不大”;次日引发广泛讨论,则是因陷入了抄袭开源代码的争议。

但许多从业者认为,行业的冷静并不完全是Tabbit本身的问题,更重要的原因在于,当前行业的注意力已经发生转移。

近期,无论国内还是海外,AI领域的关注焦点已明显转向能够深度操控操作系统的Agent,讨论度最高的就是OpenClaw。其展示出的广阔想象空间,让仍停留在应用层的AI浏览器显得声势不足。

简单来说,OpenClaw这类产品的目标,是让AI像人一样操作整台电脑:打开软件、填写表格、发送邮件,甚至在不同应用之间完成复杂任务流程。

尽管技术路径不同,但在“替代人工完成重复操作”这一目标上,AI浏览器与系统级Agent确实存在一定重叠。

比如,当用户需要处理一份数据表格时,AI浏览器可以操作网页版Excel,但如果任务涉及多个本地应用,例如处理Excel后再发送到微信,目前还难以独立完成。而OpenClaw可以直接操作本地Excel文件,并在不同软件之间切换,完成整个流程。

这种能力差异的背后,是两类产品在技术架构上的不同。

许多AI浏览器执行操作时,会截图再由视觉模型理解画面,最后决策并执行这一套流程,需花费较长时间。

图源 / pexels

而且在处理图表、游戏等复杂页面时,由于无法解析底层代码,只能依赖像素猜测,导致结果准确率大大降低。此外,各大网站的防爬机制也限制了浏览器的自动化操作。

相比之下,OpenClaw 选择了一条不同的技术路径。它并非AI浏览器,而是一个运行在本地的通用AI Agent,其核心能力之一是控制浏览器。它的独特之处在于,并非依赖多模态视觉模型对页面截图进行理解,而是通过获取系统的“辅助功能树”(Accessibility Tree)快照来解析页面。这些快照会转换为包含按钮、链接、文本框等元素的文本化页面结构描述,大语言模型(LLM)通过阅读这些文本来“看见”并理解界面。

简而言之,如果说传统AI浏览器是从“系统外部”猜测界面,那么OpenClaw则是从“系统内部”直接理解界面。这种更接近底层、更结构化的理解方式,也是许多用户感觉OpenClaw表现更为智能的主要原因。

不过,能力越强,也意味着更高的风险与门槛。

一方面,系统级Agent需要获得更高的操作权限,一旦指令理解出现偏差,就可能造成误操作,造成失控风险。有用户曾报告其OpenClaw因指令异常,自动删除邮箱邮件,这也让安全问题成为业内讨论的焦点。

另一方面,OpenClaw的使用门槛也较高。其部署过程复杂,对普通用户不够友好,甚至催生了从数百元到数千美元不等的付费教安装服务。而且持续调用大模型API将产生高昂费用,一些重度用户每月开销可达数百美元,被戏称为“贷款上班”。

从更长远的视角看,AI浏览器与系统级Agent或许并不是简单的替代关系,而更像是Agent发展的两条不同路径:前者依托浏览器这一成熟入口,更容易触达普通用户并快速规模化;后者能力边界更大,但在安全、成本上仍有门槛。

在这样的行业背景下,Tabbit的处境也颇为微妙。它既是在探索AI浏览器这一尚未定型的赛道,也不得不面对一个现实,行业注意力正被更具想象空间的系统级Agent所吸引。Tabbit能否突围,就得看产品进化的速度能不能跟得上大家的期待了。

*题图来源于pexels。返回搜狐,查看更多

美团AI浏览器,被龙虾截胡了_Tabbit_结果显示_操作