链载Ai

标题: 一个指令完成所有工作!Manus AI 预示了未来几年Agent的疯狂发展 [打印本页]

作者: 链载Ai    时间: 3 小时前
标题: 一个指令完成所有工作!Manus AI 预示了未来几年Agent的疯狂发展

3月5日,一款名叫Manus AI的代理Agent系统横空出世。

f6d7be9f-cc4a-481a-b63d-1ce6c1848402.png

"世界上第一个能交付完整结果的AI代理!"

而不到24小时,各大科技媒体的标题已经变成了"Manus AI碾压OpenAI"、"AI代理技术重大突破"、"马斯克紧急加速自家AI代理研发"...

到底什么是AI代理?Manus AI又凭什么这么牛?

今天,字节笔记本就带你一探究竟。

不只是聊天,更要独立行动

扔掉你对ChatGPT的固有印象——Manus AI不是来和你闲聊的。

简单来说,你就是老板了,Manus AI现在就是你打工的手下,给它一个任务,它能独立完成整个流程,不再需要你手把手教,一句一句的鞭打AI。

比如,你可以这样要求它:

"分析过去6个月特斯拉股票数据,找出价格波动模式,制作一个漂亮的数据仪表盘,并为我撰写一份投资建议。"


然后,Manus AI会按下面的步骤依次完成:

40dc06a5-22cb-40bc-832b-2e1e8a897b99.png

上面的步骤 他依次执行了如下的任务:

9141ad9d-cd92-41e4-bee5-cffbd4b76ce8.png

全程无需你的干预。这才是真正的AI代理:

不只是回答问题,而是用来完成任务的。

据官方介绍,Manus AI的核心能力包括:

过去你需要一个开发者、一个数据分析师和一个内容创作者一起工作几天才能完成的任务,现在一个AI就能独立搞定。

这听起来有点吓人,但确实是AI代理技术的发展方向。

真的比OpenAI强?

别以为这只是营销噱头。Manus AI在权威的GAIA基准测试中的表现,确实惊艳!

GAIA是专门评估AI系统解决现实世界复杂问题能力的基准测试,包含466个需要多步骤推理的任务。

人类在这个测试中的平均得分是92%,而带插件的GPT-4表现如何?只有可怜的15%。

75ff13ef-7c7c-44a8-b4a6-776769d426b5.png

而Manus AI的表现?据报道:

特别是在最难的Level 3任务上,Manus AI的表现超出OpenAI足足10个百分点。

像这种差距已经不是量级上的差距了而是代理技术的代际跃迁。

Manus AI能做什么?

Manus AI到底能做什么?根据内部测试预览应用,这款可以为打工人打工的代理在以下领域展现出惊人能力:

e89a8275-fcd4-4f8f-b42a-4f619be6d824.png

要求Manus AI接手一个Github项目的重构工作。它不仅理解了整个代码库,还识别出性能瓶颈,重写了关键组件,甚至添加了我没想到的功能优化。最神奇的是,它全程不需要我指导,代码质量比我团队的中级开发者还好。

87460a75-2d1f-4193-aadc-fa32b8161562.png

给Manus AI一堆混乱的Excel文件和一个模糊的分析目标。它自动清理了数据,识别出关键趋势,创建了交互式仪表盘,还给出了三点业务建议。过去这种工作至少需要我3天,Manus AI只用了20分钟。

f6fe7940-f453-4dde-b81d-fbbea55247e2.png

需要为高中物理课准备动量定理的教学材料。Manus AI不仅生成了教案,还创建了交互式演示,制作了测验问题,甚至为不同学习风格的学生提供了差异化内容。它就像一个拥有20年教学经验的资深教师。

难怪昨天就有风投分析师断言:"Manus AI不是在抢人类的工作,它是在创造全新的工作类别——'AI管理者',未来我们需要学习如何有效指导AI代理完成任务。"

为何能领先?

根据Anthropic(Claude公司)去年12月发布的研究报告《构建高效代理》,成功的AI代理系统应具备特定设计原则。有趣的是,Manus AI似乎也完美契合了:

简单,Anthropic发现,最成功的AI代理实现并不依赖复杂框架,而是采用简单、可组合的模式。Manus AI据说采用了模块化架构,每个功能都是独立优化的,而非大而全的单体系统。

步骤,成功的代理应明确展示其规划步骤。Manus AI的实时监控功能让用户可以看到它的"思考过程",理解它为什么做出某些决定。

工具,Anthropic强调工具接口的重要性。Manus AI在工具集成上下足功夫,它不仅能使用工具,还能根据任务需求选择最佳工具组合。

不过目前这种代理环境依然是隔离在虚拟环境下,离真正的生产力还是会有些距离,目前也只是更擅长于收集和整理数据调用应用程序或代码,不过相信未来很快就会直接连通到个人的电脑上,实现真正自动化的全能代理!






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5