|
「MAgentic UI」是什么?
Magentic UI是一款由微软开源的,宗旨“以人为本”的智能体。它是通过人机交互方式,来实现网页的浏览和执行、代码的生成和执行、以及文件的生成和分析。成为你工作中的一个超级AI助手。 在这个智能体满天飞的时代,相信你在听过这款Magentic-UI智能体之前,一定使用过其他的智能体。 在以往的智能体使用过程中,你只要输入一个段指令,智能体就会自动分解步骤,直接按步骤执行指令,最终输出结果,但是在每段指令执行过程中,我们无法进行任何干预它动作,只能等他最终的结果。如下图 而今天推荐的这款Magentic-UI智能体恰恰相反,它的宗旨是“以人为本”,细品这句话,就是让你成为智能体的主宰。 当智能体执行每一步骤动作时,都会征求你的意见,让你完全参与其中的决策。最终和智能体共同完成你想要的结果。二、核心功能包括哪些? 1、协同规划任务:
当你输入一条指令给Magentic-UI智能体后,它会自动分解为各个步骤,但是不会立即执行计划,你可以对各个计划内容进行修改,当你都同意各个步骤计划后,Magentic-UI才会开始执行。
这样做的好处是,可以在任务起始时,把控任务的方向,避免整个任务结果偏离你想要的结果,大大提高了结果的准确性。 2、协同执行任务: 当Magentic-UI智能体,执行每一步骤动作时,会清晰的展示操作哪一个按钮,哪一个页面,你可以随时接管它的操作,然后再把操作权限转交给智能体执行。
这种方式优点是,一旦执行过程中遇到特殊情况,例如网页加载慢、点击了错误的按钮,你可以及时纠正它的动作,以便最后结果输出的准确。 3、操作保护:
当Magentic-UI智能体,执行到一些不可逆转的性的动作时,例如支付、删除某些文件等等,它会征求你的同意。
只有当你同意它的操作后,它才会继续执行这些动作。当然如果你拒绝了请求,它就停止执行了。这种设计很人性化的,保护了你的系统。 
4、反复学习:
当Magentic-UI智能体,执行完一个任务后,可以让它进行自我总结。 吾日三省吾身,则其善而从之,其不善而改之,对于一些总结后的任务动作,进行存储,当后面在遇到相类似的场景时,可以直接复用这个任务。 Magentic-UI底层是由 AutoGen的Magentic-One系统改编的。从架构图上看核心主要包括四个方面:Orchestrator:是这个工具的核心,主要功能是把用户指令拆解为各个子任务,同时还是征求用户是否修改每个子任务的内容,然后交给下游的执行代理。WebSurfer:是一个Web浏览器的代理模块,主要功能是负责执行任务,同时也会与用户进行权限交替,允许用户接管执行动作,以达到用户想要的结果。Coder:是一个代码代理模块,可以编译和执行Python和Shell命令,同时给Orchestrator返回响应FileSurfer:是一个文件代理模块,可以定位文件的位置,转换文件格式、并解决文件相关的问题四、主要应用场景?![]() ![]() 1、数据采集和分析:可以使用这款工具,自动提取网页内容,生成分析图表。
2、自动化表单填写:可以使用这款工具,在工作中填写一些重复的表单。
3、任务流程自动化:可以使用这款工具,自动完成多步任务,如日报生成等。
4、文件处理:可以使用这款工具,完成文件的生成和分析。
前提条件,需要安装Docker Desktop。同时需要设置为WSL2,并且Python版本要在3.10及以上#使用虚拟环境python3-mvenv.venvsource.venv/bin/activatepipinstallmagentic-ui#运行Magentic-UI,同时要确保Docker是运行状态magenticui--port8081#如果构建报错,可以重新构建magenticui--rebuild-docker--port8081 部署方式二:使用源码安装,同样需要确认Docker正在运行#1、将代码拉取到本地gitclonehttps://github.com/microsoft/magentic-ui.gitcdmagentic-ui#2、使用uv安装依赖uvvenv--python=3.12.venvuvsync--all-extrassource.venv/bin/activate#3、安装前端curl-o-https://raw.githubusercontent.com/nvm-sh/nvm/v0.40.1/install.sh|bashnvminstallnodecdfrontendnpminstall-ggatsby-clinpminstall--globalyarnyarninstallyarnbuild#4、运行Magentic-UImagenticui--port8081 |