Manus智能体‌ 接替Manus,字节的Agent王牌能打多久? – 哔哩哔哩

ChatGPT国内版

文|魏琳华

编|王一粟

在和Manus的冲击之下,“沉寂”已久的字节,做出了首个由大厂发布的Agent爆款。

从4月18号扣子Agent上线以来,各个AI交流群都开始抢起了扣子的邀请码。用户们蹲在各个群里等待5个一组的邀请码放出,又在几秒钟被横扫一空。

与之对应的是,即便算力充沛如字节,也没顶住用户对Agent尝鲜的热情。几天内,扣子出现过几次因人多而服务器爆满的情况,可见,其算力消耗也远远超过了字节原本的预期。

在Manus之后,字节新上线的Agent,靠着优化的产品思路和量大便宜的优势,暂时成功吃下了昂贵的Manus遗留的空白市场。

一时的热闹后,扣子空间会昙花一现,还是成为字节屹立不倒的招牌?

邀请码被疯抢,扣子补上了Agent市场的空白

在扣子本次更新的多款产品和功能中,“扣子空间”成为了引爆用户热情的关键产品。

“扣子空间”,是字节的智能体平台扣子推出的Agent,目前已经满足了规划、使用工具和记忆等关键的自主能力。

根据扣子官网给出的各种使用体验案例,扣子既可以用来写游戏攻略、市场调研报告,也能基于字节提供的数十种MCP实现更加复杂的需求,比如用高德地图MCP+Agent写一份旅游指南,用飞书多维表格统计数据等等。

实际体验下来,扣子的Agent更接近于发布的智能体和Manus的结合体。

拿到体验码后,光锥智能以“字节一年To B的AI战略”为要求,让Agent帮忙收集信息并生成一份分析报告。Agent将任务拆解成4个步骤,并在测试者的意见修改下,给出最终的拆解结果:

通过在浏览器搜索信息,扣子Agent用了十几分钟,把上述三个步骤收集到的信息各整理成文件留存,供使用者随时查看。最后,Agent调用了网页生成工具,输出了一份长达10个小节的报告。虽然概况的内容还较为简略,但Agent的调查报告已经能做到基本覆盖各个维度的信息。

于产品设计思路上,字节整体的设计方式更加接近。比如两者都将Agent的思考过程和收集内容放到了整体界面的右侧,让使用者能够更加清晰地看到AI的每一步操作。

在此基础上,扣子的Agent还延续了字节一贯突出的产品设计思路,进一步提升了用户的交互体验。

Manus智能体‌ 接替Manus,字节的Agent王牌能打多久?  - 哔哩哔哩

当前,一般的Agent虽然生成速度快,但往往难以满足用户的复杂需求;深度思考的Agent又往往效率不如前者,需要花几十分钟才能给出结果。

考虑到用户对于生成效率和质量两种不同的需求,扣子的智能体史无前例地在Agent使用界面中开启了两种模式——“探索模式”和“规划模式”。

对比起来,前者的思考速度快,但只能处理需求较为简单的任务,而后者则能根据用户需求将任务拆分成详细步骤,还能在生成规划后让用户根据需求修改。加入用户的修改意见后,也能提升AI操作的准确性。

不过,如果以智能体目前的三个关键能力指标,即规划、工具调用和记忆来衡量,字节的Agent表现还无法比肩和Manus。

在工具调用上,目前字节平台给出的可直接调用的MCP只有十多种,还需要进一步扩充。

交给扣子Agent生成内容的体验中,目前它搜索的文字内容也多直接来自互联网引擎搜索,没办法像一样直接在特定的垂类网站搜索信息,也没有横跨各个平台的内容搜索。内容池窄了,生成的内容质量自然有限。

而在记忆问题上,也有不少体验扣子的用户表示,在测试了十几轮上下文对话后,Agent就会出现“失忆”的情况,无法记住之前的交流内容。

实际上,这也是由于扣子Agent的底层模型决定。

当下的共识是,Agent的能力依赖于底层模型的水平。但和用自研模型的,以及调用 3.7等模型的Manus相比,扣子的底层模型主要使用的是豆包通用模型-1.5-pro,从效果和部分开发者反馈效果来看,无论在文本理解思考能力还是代码输出等能力上,扣子Agent表现还稍逊于前者。

不过,为了提升Agent使用体验,字节在多模态能力上下了功夫。比如字节在上一周发布了专门为Agent设计的GUI(图形交互界面)模型,这也让扣子Agent在视觉理解和图片生成能力上表现更加突出。

在上述光锥智能实际体验后,扣子Agent按照要求生成的报告不仅详细分好了对应的报告节点,且在UI设计上体验拉满,给到了图文并茂的调研报告。

虽然,扣子的Agent目前表现还没办法追赶上Manus,但在一片基本空白的自主Agent市场中,扣子Agent的表现已经足够惊艳。它做到了火山引擎最爱强调的那句“成本低、易落地”,先把具备自主执行能力的Agent端上来,让人们能够体验并反馈。

如同字节给扣子空间的定位“一个通用的实习生配合各领域的专家”,现阶段的扣子Agent,做到了这个执行标准。

抢占时间窗口,扣子拿下大厂智能体首胜

“扣子空间”的诞生,是大厂在智能体路线上的一次“纠偏”。

为什么Manus没有出生在大厂?这个在Manus爆火后常常被人提起的问题,要从大厂做智能体的思路说起。

Manus智能体‌ 接替Manus,字节的Agent王牌能打多久?  - 哔哩哔哩

从发布GPTs商店开始,大厂在2024年上半年纷纷跟进智能体。字节跳动的扣子、腾讯云的腾讯元器、百度智能云千帆、阿里云大模型平台百炼,都是在这个时间段先后发布。

字节海外版平台Coze

但大厂们对这些智能体的定位,仍然停留在做开发者生态的平台上——智能体商店。

通过接入市面上多种大模型能力和各种Agent开放工具,智能体平台们不断吸纳开发者,寄希望于靠开发者们做出应用生态,再借着各种功能的智能体来吸引用户,智能体平台则顺势成为流量生态的入口。

之所以做出这样的选择,是大厂一贯的“平台思维”的惯性——做好平台和基础工具,并不亲自下场。这就像淘宝和京东一开始的区别。

另外一方面也是由于模型能力的制约。彼时,在多模态能力尚未完善的情况下,大模型还无法“理解”手机和电脑的操作界面信息,也就无法完成各种自主操作。

所以,扣子们重点做的是通用工具的打磨,完善各种工作流,降低开发者们的开发门槛。再采用流量分成的方式,吸引开发者接入。

但在去年11月,智谱发布的Agent“”开始能够实现点外卖、发红包等自主操作后,大厂们肯定看到了相关的潜力,但从行动上来看,大厂的速度显然没有Manus更快,产品也没有Manus深。

在现象级爆款产品面前,各家大厂都开始坐不住了。向来求稳,发产品从来不发“半成品”的字节,这次抢着把还不够完善的扣子Agent发了出来。

如今的扣子Agent,就是一个满足“60分及格”的产品,它要做的就是抢占时间窗口。

此前,谭待曾在采访中表示,做B端,抢先发优势的前提是产品或服务要达到及格线。

“做B端更要为结果负责。”谭待说,“如果你的产品足够‘可用’,抢占先发优势肯定是有价值的。”

这次,字节选对了。

Manus虽然在短时间内在市场点燃了热度,成功验证PMF,但它的技术护城河并不高,在强手云集的AI行业中,多家大厂都开始着手准备复刻Manus类产品。

从一开始的爆火,Manus要想真的在行业中“长青”,关键在于两点,一是保证技术优势持续领先,二则是解决Agent成本高企的问题,快速铺开市场规模。

但现在,Manus仍然深受成本问题制约。在Manus的闭门会上,其工作人员分享Manus单次运行成本在2美元左右。高昂的成本,注定了Manus只能在起步阶段向少量用户开放。即使开放商业计划,它的定价也不会是一笔普通用户能承担的费用。

开出最低一个月39美金的会员定价的情况下,Manus还无法进一步提升市场占有率。

323AI导航网发布

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...