最近阿里又开源了一个智能体框架AgentScope,这次真的让我眼前一亮——可用性简直爆表,尤其是在本地文件系统下的体验。我花了一天时间深度体验,只有一个结论:这很可能就是最适合做本地智能助理的智能体框架了。
安装的细节我就不赘述了,直接聊聊让我惊艳的地方。
这个框架不仅会思考,还会"说话"!语音对话功能已经内置支持了,不过这个特性在README里藏得有点深,一不小心就错过了。
在ReActAgent中,Qwen-Omni和GPT-Audio系列模型已经原生支持,音频处理通过AudioBlock来完成。
想看怎么实现的?去examples/agent/voice_agent目录瞧瞧,示例代码已经写好了。
强化学习功能是我期待已久的一个特性,这次AgentScope居然真的把它集成进来了!官方还贴心地准备了好几个实用案例,感兴趣的朋友可以上手试试。
不过,有一个现实问题需要面对——对显卡的要求有点硬核。我看了一下文档,大多数场景都需要4块H20显卡起步……有点望而却步。
我寻思着找时间试试我的AI Max 395能不能扛得住。但对于大多数个人PC用户来说,这个功能确实有点"可望而不可即"了。
这次最让我惊喜的,是它竟然附带了一套可视化管理界面!真的太人性化了。
官方有两个仓库:一个是agentscope,另一个是agentscope-studio。studio就是专门用于管理的前端界面。我体验下来,感觉这个UI对本地运行来说,已经可以用于生产环境了——追踪trace、自定义智能体,样样都能搞定。
studio的架构很清晰:包含server和client两部分,client就是我们看到的UI界面,server在后台跑一个3000端口的服务。
除了自带的智能体外,你想把自己开发的智能体也接进来?很简单,连上这个服务,然后在UI的项目菜单下就能看到你注册的智能体了。
关键就是这一行初始化代码:
import agentscope
agentscope.init(studio_url="http://localhost:3000")
更绝的是,它还内置了一个专门针对AgentScope的问答智能体,名字就叫Friday。简单配置一下就能用,省心省力。
不过这个Friday有点"小心机"——它的问答是有优先级的。
优先级顺序是这样的:
view_agentscope_faq 查常见问题view_agentscope_readme 看项目介绍execute_shell_command 扒examples目录view_agentscope_library 查本地库文档view_text_file 看源码玩的时候你可能会疑惑:为什么它从来不调用Python Library?
答案藏在一个很巧妙的设计里——这个工具是通过reset_equipped_tools这个特殊工具动态注册到Toolkit里的,然后才通过对话加载进来。这个答案也是我问Friday问出来的,是不是挺神奇的?
这样设计的好处很明显:只有真正需要时,才激活那些消耗大量上下文的工具,而不是一上来就全加载。虽然初次接触可能会有点困惑,但从长远看,这可是省token的好办法,我们在开发时也可以借鉴这种思路。
想让agent调用Python Library?方法很简单——在对话中明确告诉它"激活agentscope_tools再回答"就行。
这个框架的玩法还有很多,我就不一一列举了。剩下的惊喜,留给大家自己探索吧!
| 欢迎光临 链载Ai (http://www.lianzai.com/) | Powered by Discuz! X3.5 |