文 | X研究媛
很多人还在争论Manus是否“套壳”的时候,却没有察觉到到Agent+MCP意味着什么。
Agent+MCP,自主探索、深度思考、调用工具,以接近人类的学习、工作方式,完成真实世界的复杂任务。
今天MCP的热潮很像十几年前iPhone+iOS,那个iOS生态的起点,少有人意识到移动互联网时代的大浪滚滚而来。个人判断:MCP共识一旦形成,大模型To C的趋势,将碾压一切。
在一个资本高度关注、全球大热的领域,一个名不经传的团队,做出一个现象级产品,大概率是击中了PMF,为所有还困在森林里的探险者找到了路。
Manus现象大概就是创业最经典的“轻量级验证”。这家公司以它自己为模板,为行业验证了潜在的、极其庞大的需求。而且这大概率是冲着传统搜索引擎。
Manus是什么?Manus为什么能火?它就是找到了让普通人最舒服使用大模型的方式。“通用Agent”无论这个牛逼概念能不能兑现,能“通用”到什么程度,Manus能一句话,用户能以“自然语言”说人话的方式,让大模型把一个事情从头到尾做完。
我不需要跟大模型费劲多轮Prompt,它自己去琢磨你要什么
它能调用工具了,而且还知道用什么工具。像真人一样,去打开网页、访问本地文件、打开这个软件那个应用,去搜索产品信息、公司信息、搜索相关数据,然后自己总结、排版,生成报告。一气呵成。
按时髦的说法,大模型“端到端”把活干完了,这才是普通人真正需要的东西!
但是人们发现,火出圈的Manus 居然没有自研大模型,只是一个模型和工具的“包装器”,套壳的质疑并非完全是污蔑。
Manus本质是基座模型+接口协议+调用工具的自主工作流。Manus 使用Claude为底座模型和阿里云通义实验室研发的Qwen-finetunes微调工具,CodeAct作为调用工具的“接口协议”,关键差异在,Manus还打包了29个大模型调用的、精心筛选的工具。
按类别来分,Manus集成了12个浏览器操作工具(browser系列,支持AI代理与浏览器、网站交互);5个Shell操作工具(用户与操作系统内核之间的接口,允许用户通过命令行界面与系统进行交互);5个文件操作(file系列,支持打开、读取、写入、创建文件等等);3个部署工具;2个message消息交互工具;1个信息查询工具info_search_web和1个idle工具。
Manus究竟有什么独特之处?调用工具其实也不是重点,Function Call早就有人提出了。自主工作流,拆解目标、层层推进、反思迭代、输出结果,也并不是破天荒。从o1到R1,从预训练Scaling 到后训练Scaling 甚至推理步骤和时间上的Test-time Scaling,推理式LLM能力也已具备。
但是推理式LLM+自主调用工具,产生了质变。
MCP是推理式LLM调用工具的关键。
MCP作为一个统一的“工具”生态,全球性的共识正在形成。打一个比喻,如果MCP的工具生态就像iOS平台刚刚诞生那会,而谷歌的A2A,就像就在这个关键节点,搞出了Android。
MCP的起源,按Anthropic发明MCP核心工程师的说法,为了给自家已经很棒的大模型延展更多的功能,他们在Cloud Desktop和IDE之间来回复制粘贴,不胜其烦。他们给出的解决方案是:给大模型配一台“云电脑”,把已开发的多个大模型调用的Function,和想获得的多个外部功能、数据在这台“云电脑”环境上集成、打通、运行,一个典型的“M X N"问题,使用一个标准协议解决。
MCP运行涉及到Host、Client和 Server。Host简单理解就是调用工具或外部数据的“需求发起方”,它可以是一个大模型聊天对话工具或者专业的IDE。Client则是负责连接Host与Server的「客户端」,比如Cursor;Server就是需要扩展的外部功能或外部获得的上下文数据。
一个简单的MCP运行过程,Host发出需求指令,Host的指令通过 Client 和 外部的Server 沟通,最终实现功能并返回结果给用户。
相比 Manus演示了推理式LLM工作流+自主调用工具的思路,使用了CodeAct而非MCP做协议,并且调用的工具基本是定制好了,数量也限死。
字节Coze更进一步,开始扩展可以调用的工具,并且瞄准办公场景。
4 月 18 日周五晚,字节的 Agent 产品 “扣子空间” 开启内测。团队为此准备不少算力资源,但短短几小时内,服务器就被涌入的用户挤爆。超出预期的用户热情,让扣子团队再次验证一个判断:用户一直在等待能用的 AI 产品,去解决工作中的问题。
Coze Space是什么?
Coze Space 按字节官方说法「一款AI Agent协作办公平台」,旨在通过AI驱动的代理和模块化工具优化工作流程,被定位为“用户与AI Agent协作的理想场所”。它支持从任务分析到执行和结果生成的全流程自动化,提供两种模式:
探索模式:适合快速执行简单任务,如生成会议记录。
规划模式:针对复杂任务(如市场调研、跨行业分析),AI会在关键步骤暂停,与用户确认后再继续。
平台集成了60多个MCP扩展,包括飞书多维表格、高德地图、图像工具和语音合成等,支持数据分析、地理规划、内容创作等应用场景。它提供低代码/无代码环境,非技术用户也能通过自然语言构建AI应用。
有了封闭产品、调用有限和固定工具的Manus,有了Coze半开放的协作智能体工作流,还会出现什么?
2025年4月23日,纳米AI正式上线MCP技能商店,按官方说法,建立起像DeepSeek等基座大模型的“万能工具箱”。基于本地客户端,而不是Coze或者Manus的云端Host,纳米AI客户端有4亿月度访问用户,选择面向普通用户,目前只有它一家。
周鸿祎不做只有29个固定工具的Manus,也不做只有60个MCP扩展、半开放协作智能体工作流Coze。一步到位,直指普通人用的超级智能体:调用工具更多、更自由、高度开放场景的MCP to C。
纳米AI不同于Manus和Coze集中在开发者圈子,相对封闭产品体系,纳米AI自建了MCP的开放市场,思路类似iOS App Store。
纳米AI通过自研MCP工具,逐一审核引入外部高频使用、有口碑的MCP应用并且限时免费接入,以及扩容第三方MPC Server的方式,建立起一个初步MCP应用生态,让大模型可以调用超过100个仔细筛选、高质量、真实有用的MCP技能应用,用户可以手搓自己的超级智能体!
这些MCP在被LLM调用,多个技能并行运行时,能够模仿人类在真实世界完成工作,覆盖任务的更多样性、泛化性尤其突出。
作为首批实测纳米AI超级智能体用户,笔者一个实测案例,创建“生成网页”的个人智能体:
输入相对规整的Prompt
选择MCP工具。本案例选择了MCP工具箱里的firecrawl(免key)、纳米生成网页、sequential thinking(免安装)
在创建好了智能体后,我让它进行“特朗普关税影响”的深度报告生成和网页代码生成。
最终生成的网页 https://mzbx47.n.cn
从实测效果看,这是全网第一个不需要调试代码,不需要MCP工具调用配置,不需要掏钱买Key连接第三方高质量 MCP Server,只要会写Prompt和选择合适的MCP工具,就可以生成个人专属智能体的平台。
如果用户不会写Prompt,也不知道该选择哪个工具,可以直接使用官方的模板智能体。就像在App Store选择应用一样,一键下载、配置、使用。
按照纳米AI的设想,通过MCP集成大量生态伙伴,让大模型和MCP工具技能自由组合,超越Coze和Manus的能力上限。目前,纳米AI能够自动分析用户需求并拆解为多个子任务,自主调用工具(如浏览器、代码编辑器等)执行任务,并输出完整的结果报告,如网页、PPT、Word文档等。
纳米AI比较独特之处,可以通过MCP读取本机数据库,自动调用纳米AI集成的本地浏览器,跨过登陆墙调用应用执行应用内多步操作,让大模型和智能体能够完成此前无法完成的复杂功能。
这背后是360团队过去在搜索和浏览器的技术积累。根据笔者跟相关产品和研发的深入交流:
一方面基于360团队过去在搜索上的深厚积累,自建了千亿级的索引库和百亿级精品库。另一方面,加入了更多MCP协议的搜索工具,如Tavily Search , Exa Search ,Github, Google Scholar, ArXiv和PubMed,雅虎财经,包括学术、医学、科学论文、代码等高质专业数据来源,大大提升了大模型专业知识搜索的广度和深度。得益于纳米AI的开放式设计,接入的MCP Server越来越多,专业内容搜索能力会越来越强。
纳米AI专门也打造了一个最能适应中国网络特色的AI爬虫。与通用爬虫不一样的是,基于360搜索过去搜索爬虫能力,纳米AI是专门为大模型打造的爬虫,它能够读懂各种复杂的页面结构,包括各种信息流网站、视频网站、社交网站的动态网页代码,让大模型可以提取网页正文、图片、视频、音频等资源。
还有客户端集成了首个为大模型定制的AI浏览器。纳米AI打造了一个大模型专用的浏览器,而且该浏览器的大模型调用基于本地计算机上运行,它实现多个社交网站的深度搜索和深度理解,打破登录墙和内容围栏,帮你在多个网站中找到信息、找到用户评论,找到贴子里的图片和视频。最终检索出更全面、更高效和精准的信息。
目前,纳米AI支持的MCP工具数量最多、客户端体量最大,也是首个可自由调用和组合MCP工具、并且支持用户自建Agent的平台。纳米AI选择了 MCP to C的道路,建立起本地客户端+MCP自由调用市场,一个类似App Store的开放生态。
后续,开发者还可以在纳米AI平台上架自己的MCP工具,并且获得终端用户的付费收入,一个平台、开发者、用户形成完整闭环,可持续的商业模式。完全就是iPhone+iOS的思路!
周鸿祎成名于PC时代,错过了移动时代,但在大模型时代,卯足劲要拿到一张船票。
可能地火已经无法压制。MCP to C,一座火山已经突出了地壳,即将喷发。