|
鉴于Meta收购Manus的消息甚嚣尘上,我们发现Manus这家公司在被收购之前,对外作出了一场公开演讲,Manus AI联合创始人兼首席产品官张涛,在10月29日新加坡企业发展局主办的SWITCH大会上,分享了对于智能体的理解。 重新定义「智能体」 演讲开始,张涛直击当前市场的一大乱象,他说,2025年几乎所有人都在谈论“智能体”,但这个词背后充满了误解,很多服务仅在聊天机器人中加入一些系统提示(System Prompt),比如“你现在是一个法律代理”或“你是一个金融代理”,然后便宣称自己提供了智能体服务。 那么,究竟如何让一个真正的“智能体”(AI Agent)与众不同?张涛的答案只有一个词:自主性(Agency)。 他说:“一个真正的智能体,必须具备独立思考、独立行动、独立完成任务的能力,而不是仅仅被我们人类的指令所触发。” 他做了一个对比。用聊天机器人时,用户需要不断地追问,你问一个问题,得到一个答案,然后再问下一个问题,整个过程是“一问一答”的被动式交互。而智能体的工作方式则完全不同,它更像一个自主的目标执行者。 在此基础上,还衍生了“通用智能体”(General Agent)的概念。张涛强调,通用智能体并非为某个特定任务而设计,而是一个拥有广泛能力、能够解决开放式问题的系统。 “这就像我们人类自己。当你的儿女去上大学时,你并不知道他们未来会做什么。他们会在大学里学习,然后开启自己的职业生涯,最终成为一个我们从未想象过的人。” 在Manus内部,这个过程被简化为三个步骤:思考(Think)、行动(Act)、学习(Learn)。 首先,智能体根据任务进行思考和规划,并在过程中不断反思、调整计划。其次,它会基于思考结果,决定下一步应该执行何种“行动”——这些行动是高度自动化的原子能力,例如读写文件、看网页、运行终端命令或访问数据库。最后,在整个过程中,智能体会从与用户的交互中学习,记住用户的个人偏好,比如报告需要以PDF格式呈现。 “我们正在构建的是一个‘问题解决引擎’,而不仅仅是一个特定的应用程序。”张涛总结。 第一前沿:工具的「网络效应」与涌现式的「软件开发」 了解基本概念后,张涛开始深入探讨他眼中智能体技术的三大前沿领域。 第一个,也是正在彻底改变软件行业面貌的,是“自主能力”及其带来的“工具的网络效应”。 “在过去的15年软件行业生涯中,我们构建软件的方式是固定的,我们倾听用户需求,构思解决方案,然后进行设计、开发、测试、发布,最后收集用户反馈。这是一个传统的线性过程。” 然而,在Manus,产品的构建方式被彻底颠覆。张涛透露,目前Manus有三个核心用例:深度研究、日常工作报告与幻灯片制作、构建网站或AI应用。有意思的是,在产品最初于2025年3月发布时,开发团队从未预想过这些具体用途。 那么,这些功能如何实现? 答案在于Manus的构建当中:他们只专注于打造一个通用的核心架构,并为系统提供足够丰富的工具箱,这些工具包括图像生成、代码编写、在虚拟机上读写文件,以及一个可以让智能体自由浏览互联网的浏览器。 然后,系统以一种近乎神奇的方式,自己找到了解决这些垂直领域问题的方法。 为了具体说明这种“涌现式”的能力,他分享了一个用户案例。一位生物信息学的研究员,在自己的实验室里需要处理一种特殊格式的设备文件,这种文件只能用一款特定的专有软件打开。这位研究员没有任何编程经验,而实验室对文件处理又有特殊的需求,这让她一筹莫展。 于是,她将这个文件展示给了Manus。智能体首先自主上网研究,弄清楚了这是什么文件格式。接着,它竟然设法编写了一个Python库来处理这种格式,并最终为她的实验室交付了一个Web服务。此后,不仅是她,她所有的同事都可以通过这个Web服务来处理这种特殊文件,以进行后续的数据分析。 “我们从未如此设计过Manus,我们只提供了基础的工具和行动能力,智能体自己解决了这些开放式问题”,张涛说。 Manus首席科学家将这种现象命名为“工具的网络效应”(Network Effect of Tools)。当你为智能体提供越多的工具,系统能力的边界就会以非线性的方式扩展,涌现出你从未预料到的新能力——这也是Manus未来会持续为智能体增加更多工具和行动的核心原因。 第二前沿:7x24小时在线的「数字员工」 智能体的第二个前沿,也关乎它最终形态的实现——一个7天24小时为每个人不间断工作的“数字员工”。 “也许明年的SWITCH大会,在座的一半人都将拥有一个为你24小时运行的智能体,甚至无需你提出问题。”张涛大胆预言。 要实现这一愿景,必须克服一个技术挑战:构建一个能够支持“长时运行任务”(Long-Running Tasks)的坚实基础架构,目前的系统存在局限,一个任务运行几分钟或一小时后就可能失败。Manus的目标远不止于此,他们正致力于打造能够支持任务连续运行24小时的架构,以解决那些极其复杂和耗时的问题。 除了持久性,速度也是关键。为此,Manus引入了“并行处理”(Parallelism)机制。 张涛以Manus在7月份发布的一项名为“广泛研究”的功能为例:“如果你想对1000个不同的目标进行研究,你可以试试把这个任务交给其他工具,你会发现它们都会失败。” 但在Manus内部,当接到这样的任务时,系统会自动将这个任务分解为1000个独立的子任务,并让它们并发运行。这不但提升了效率,也避免了大型模型在处理长任务时可能出现的“惰性”或注意力衰减问题。这是一种只有通过专门的智能体架构才能实现的能力。 第三前沿:主动性是智能体的灵魂 在张涛看来,第三个前沿,也是最重要、最能体现“自主性”精髓的,是“主动性”(Proactivity)。 “我们认为,智能体应该在你要求它做某事之前就开始工作。自主性就意味着主动性。”张涛强调。 当前市面上的智能体产品,包括Manus在3月份发布的版本,仍然没有达到智能体的终极形态,因为用户仍需明确地提出问题或分配任务。而未来的图景是,智能体将成为一个真正主动的伙伴。 为了实现这一点,Manus推出了“连接器”(Connectors)功能,允许用户将自己的Gmail、日历、Notion等个人工作流与代理连接。然而,他们发现,即使用户连接了这些服务,很多人仍然不知道可以分配什么样的任务给智能体。 于是,一个颠覆性想法诞生了:“为什么我们还需要用户来提问呢?” 既然智能体已经通过连接器访问了用户的日历和待办事项,它已经知道了用户正在忙什么。因此,使用智能体的最佳方式,是让它基于用户的个人上下文,主动开展工作。 张涛分享了他自己的日常体验,一个内部原型已经让他享受到了这种便利:“每天早上8点,我的Manus智能体会检查我当天的日历,如果发现有与外部伙伴的会议,它就会主动去研究参会者的背景资料,为我准备会议。这超级有用,我每天都在用。” 这便是「主动性」的用武之地。未来,你可能每天只需花5到10分钟与智能体进行一些关键的对齐,但它会在后台为你工作24小时。 企业破局的关键:从“替代思维”到“增效思维”
在描绘了技术前沿之后,张涛将话题转向了更具挑战性的商业现实:企业应如何拥抱智能体? 他指出,在过去两年中,他看到许多身为行业领导者的朋友和创始人,在尝试将AI智能体(Agentic AI)引入公司时,绝大多数都失败了。为什么? “因为当人们试图在公司中应用AI时,他们脑海里冒出的第一个念头是:‘我能用AI替代哪些员工?’” 张涛认为这正是问题的症结所在,当你的出发点是“替代”时,你的整个思维框架就会被“风险控制”所主导。你会首先考虑:如果我解雇了这个人,现有的工作流程还能否正常运转?你的焦点在于规避风险,而不是创造收益。 他倡导一种不同的思维模式:从“替代”(Replace)转向“生成/增效”(Generate)。 “如果你开始思考如何用AI来增效,你脑海里冒出的第一个念头会是:‘AI如何能让我的顶尖员工的绩效提升10倍?会出现哪些新的机会和可能性?’”在这种模式下,你的焦点转向了“收益”,你看到的是一片蓝海。 他强调,AI技术尚处早期,在这样一个阶段,如果只盯着风险,必然会错失良机。而关注收益,则会让你看到完全不同的景象。 为了印证这一点,他分享了一个发生在他身上的真实故事。今年1月,公司搬到新加坡后,CEO需要找公寓,与他合作的是房地产中介,当这位中介得知客户是Manus的CEO后,她利用Manus为客户制作了一份高度个性化的定制PPT。 这份长达12页的PPT,详细介绍了当天下午要看的三套公寓,不仅包含了户型图,还深入研究了公寓周边的环境,如哪里有超市、医院,以及顶级的餐厅和酒吧。这份报告的专业度和个性化程度,让CEO感到非常惊喜,因为他从未想过一个房地产中介能提供如此水平的服务体验。 “这正是AI如何赋能的体现,重点从来不是替代,那位中介仍然在那里,但借助AI,她的工作表现和客户体验得到了极大的提升。拥抱AI最重要的事,就是改变你的思维模式。”张涛总结。 跨越三大障碍 除了思维模式的转变,张涛还指出了企业在拥抱AI时需要跨越的其他三个障碍: 第一,信任与上下文共享。人们普遍对与AI共享个人数据(如邮件)感到恐惧。张涛认为这只是一个时间问题,随着技术的成熟和信任的建立,人们会逐渐愿意向自己的专属智能体开放个人上下文。 第二,为人类而建的世界。当今绝大多数的工具和服务都是为人类操作而设计,未来,我们将会看到越来越多从第一天起就为AI交互而设计的“AI原生”工具。 第三,与AI协作的范式。在过去,我们习惯了机器增强我们的体力,但我们不习惯我们的“智力”也可以被规模化。学会如何与可规模化的智能体协作,是一个全新的课题,也是一道需要跨越的认知障碍。 他最后总结说,就像几十年前需要学会打字、二十年前需要学会操作电脑一样,从2025年开始,学会如何与智能体协作,将成为决定个人未来表现的关键技能。 |