链载Ai

标题: 图解Manus产品/技术/体验的最新思考 [打印本页]

作者: 链载Ai    时间: 昨天 17:13
标题: 图解Manus产品/技术/体验的最新思考
内容简介

Manus内部如何看待通用Agent?看下最新的内部讨论


核心议题:


(1)产品哲学
战略岔路口:通用与垂直优化的战略选择
这两种不同的Agent发展范式,有个形象隐喻:Hao123 还是 百度?
Hao123加链接,跟百度转链接卡片有本质区别,Chatbot让人感觉非常通用,但实际上没有那么通用。
image

揭示产品定位的核心分歧与最终选择,确立 Manus 发展范式:通用性优先,逐步沉淀和优化高频场景。通用性是获客和探索可能性的基础,后续优化则是构建核心竞争力和护城河的关键。


通用的代价与边界:承认通用路线的挑战,引入对专业软件和知识冲突的思考


范斌提出挑战:像专业视频剪辑这样的任务,通用Agent如何与FinalCutPro或Premiere专业软件竞争?Agent在理解和操作复杂图形界面(ComputerUse)方面,短期内难以实现质的突破。

Peak则给出更具未来感的设想:如果Agent运行环境是完整的“带桌面环境的虚拟机”,那么完全可以通过模拟人的键鼠操作来直接使用这些专业软件,从而将通用性推向新高度。

Red指出潜在问题—知识冲突。一个无所不学的通用Agent,可能会在不同领域的知识上产生混淆。例如,用于数据科学的严谨知识,可能与用于市场文案的创意知识在底层逻辑上冲突。未来可能需要某种形式的“领域隔离”或“知识分区”机制。

image

(2)技术基石:云端浏览器


Manus 如何实现对 Web 复杂操作,确立技术实现路径。

如何解决当前Agent产品的核心痛点,构建一个真正稳定、持久且强大的执行环境?

image
Agent对Web的复杂操作是项目的技术基石。


痛点阻击:拒绝“失忆”的 Agent


当前竞品(如 Devin)最大弱点在于“一次性”的会话机制,每次都是全新、无菌环境,导致大量重复工作和糟糕的用户体验。


Manus 必须从根本上解决这个问题,实现全面的状态持久化。

image


(3)人机交互:接管与协同


用户界面与交互体验:“信任”与“控制”质检找到平衡

Agent遇到障碍(如复杂的验证码、两步验证登录)时,必须有流畅的机制让用户能够“接管”浏览器,完成操作后,再将控制权交还给Agent,弥补当前AI能力不足、确保任务能顺利完成的关键环节,“人”在回路中的作用。

image

界面哲学:解构 Devin


界面的双重角色:建立信任与提供控制

Devin界面分为左右两栏:左侧是对话流,右侧是Agent工作区(Planner,Shell,Browser)。

这个设计巧妙地服务了两类不同用户心智:


但有明显不足:

image


(4)ManusUI设计哲学

Manus 提出自己的UI设计哲学,解决复杂性与易用性的矛盾


image

OS 隐喻:重构功能层级,Manus 终极形态——不仅仅是聊天机器人,而是云端操作系统。

image

价值原点:为何要 Agent?人机协作,Agent作为人类心智的延伸,克服人类的认知局限

潘潘(PanPan)和张涛(hidecloud):人类在执行复杂任务时存在诸多局限,而这正是Agent的优势所在:


从哲学层面探讨 Agent 存在的意义,超越工具属性。

image

EVE Online 启示:复杂系统与长期规划

用游戏类比, 具体化 Agent 在复杂系统中的应用场景。

游戏《EVEOnline》“题外话”:EVE是拥有极其复杂的经济系统和生产链的科幻网游,玩家需要像经营国家一样,进行长期资源规划、生产调度和战略博弈。许多玩家军团甚至需要使用Excel表格来管理其庞大的生产体系。

这恰恰揭示了Agent的潜在的高价值应用场景:作为复杂系统的“总调度官”或“超级助理”,帮助人类管理和优化那些超越了单人认知和执行能力上限的庞大工程。

image


Manus 核心发展战略:双轮驱动策略。

image


(5)下一步行动


这两次深入讨论,不仅为Manus项目的正式启动扫清了思想上的障碍,更形成了一系列宝贵、可指导后续工作的核心原则。


最后,团队迅速行动,成立了项目组,共享了前期资料,并明确了在产品定义和技术架构上的分工。旨在重新定义智能体、致力于成为人类强大心智延伸的探索之旅,由此正式启航。

image
以强有力的视觉语言结束演示
image







欢迎光临 链载Ai (http://www.lianzai.com/) Powered by Discuz! X3.5