返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

用 AgentScope Java 开家 AI 奶茶店

[复制链接]
链载Ai 显示全部楼层 发表于 2 小时前 |阅读模式 打印 上一主题 下一主题

AgentScope 是阿里云推出的一款以开发者为核心,专注于智能体开发的开源框架它的核心目标是解决智能体在构建、运行和管理中的难题,提供一套覆盖“开发、部署、调优”全生命周期的生产级解决方案,让智能体应用的开发更简单、运行更稳定、效果持续优化。

前言




Cloud Native

去年 12 月份,社区正式发布了 AgentScope Java 1.0 版本,面向 Java 开发者提供企业级 Agentic 应用构建的能力。在过去的一个多月,社区快速迭代到了1.0.7版本,在这 7 个小版本中,我们更新了很多实用的能力,比如:

  • 添加全面的 Ollama 集成,支持聊天和 embedding 功能
  • 新增了对 Agent Skill 的支持
  • 内置的文件操作工具和多模态工具
  • 工具调用HITL
  • 上下文自动压缩
  • HTTP 请求和响应内容压缩
  • MySQL 会话存储
  • 集成 Nacos 的 A2A 架构
  • 集成 Higress 的工具搜索
  • ……

至此 AgentScope Java 以 ReActAgent 为核心,配合众多强大的能力,已经能够胜任大多数场景的任务。面对如此多的能力,很多同学在社区反馈光看文档和单一功能的 Example 还是不够效率,不能快速地用好这些能力。为此我们用 AgentScope Java 开了一家奶茶店,来作为一个综合的 Example,为大家演示如何更好地使用 AgentScope Java。

这家店能干啥?




Cloud Native

首先我们先一起看看这家店能干啥:

image.png

  • 奶茶推荐:基于 RAG 知识库检索并结合用户偏好分析,回答有理有据,猜你喜欢。
  • 智能下单:不需要繁琐的表单,自然语言直接下单,Agent 自动识别产品、甜度、冰量。
  • 订单查询 & 用户反馈:查单、投诉、建议,一站式搞定。
  • 记住你的喜好:集成 Mem0 长期记忆服务,熟客无须多言,做更懂你的奶茶店。

这家店怎么做的?




Cloud Native


架构解析

首先在总体结构上我们采用了Supervisor-Worker架构,同时集成了一些生态组件来达到最终的效果。

其中 AgentScope 多智能体服务层是由一个 Supervisor Agent 和两个 Sub Agent 构成的智能体系统,负责处理店内大大小小的事项;MCP Server 负责处理具体的业务逻辑,可以直接基于传统的业务系统改造;Nacos 负责 Agent 和 MCP 的动态注册和发现;数据持久层负责数据的持久化,包括知识库、会话、记忆、业务数据等。

image.png

接下来我们一点一点地来拆解这家店,特别是多智能体服务层。

  • Supervisor Agent:相当于门店经理,负责接待客户,判断客户意图(点单?咨询?投诉?),然后把活派给对应的子 Agent。

  • Business Sub Agent:勤劳的店员,专门处理订单创建、查询、修改以及投诉等业务事项。

  • Consult Sub Agent:贴心的客服,接入了 RAG 知识库,能够进行产品推荐,问啥答啥。


能力解析

在这一部分我们来介绍为了实现上述的效果,我们要用到哪些能力,以及要如何进行开发。当然这边我们只能展示一些关键部分的代码片段,完整实现可以移步agentscope-java/agentscope-examples/boba-tea-shopingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;visibility: visible;">[ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;visibility: visible;">1]

ReActAgent:能思考会行动

为了能处理店内大大小小的事项,我们就需要一个能思考会行动的 Agent,而一个符合 Reasoning and Acting 范式的 Agent 能很好地完成这个任务。为了构建这个 Agent 如果不借助框架的话我们需要至少完成以下事项:

  • 对接适配各个模型厂商的 API
  • 构建 Reasoning 和 Acting 调用的循环
  • 支持工具的注册和调用

而在 AgentScope Java 中我们只需要进行一些配置便可以组装出一个 ReActAgent,由 AgentScope 完成上述的事项,同时我们原生支持了多家厂商的协议,包括 DashScope、Anthropic、Gemini、OpenAI。

DashScopeChatModel.Builderbuilder=DashScopeChatModel.builder().apiKey(dashscopeApiKey).modelName(dashscopeModelName).formatter(newDashScopeChatFormatter());DashScopeChatModelmodel=builder.build();ReActAgentagent=ReActAgent.builder().name("supervisor_agent").sysPrompt(sysPrompt).toolkit(toolkit)//挂载工具.model(model)//配置大模型.memory(memory)//短期记忆模块.longTermMemory(longTermMemory)//长期记忆模块.build();

集成 Nacos 的 A2A 架构:专业的事情让专业的 Agent 来做

当我们对 AI 应用的需求从单一的对话交互转向复杂的现实世界问题解决,单体智能系统(Single-Agent Systems)的局限性日益凸显。

  • 上下文窗口大小和注意力稀释
  • 幻觉难以自我觉察和纠正
  • 专业化能力不足
  • ……

为了解决这些问题大家都在逐步探索多智能体架构,我们也借奶茶店这个场景为大家演示如何用 AgentScope Java 开发多智能体系统中 Agent AS Tool 的模式。为了实现这个效果,我们原本需要基于 A2A Java SDK 来构建对应的 Client 和 Server,同时还需要进行一些事件和通讯的适配与对接,繁碎的同时还没有动态注册发现的能力。

所以为了更加便捷地落地 A2A 架构,AgentScope 提供了 A2A extension 来完成 A2A Java SDK 适配和对接,并且集成了 Nacos 来实现动态的 Agent 注册和发现。于是现在在 AgentScope Java 中只需要少量代码就可以完成 A2A 架构的落地。

首先是子 Agent 的注册,只需要定义客制化的内容即可,主要是子 Agent 自身所需要的模型、工具等组件的配置,其他部分由框架搞定。

@BeanpublicAgentRunneragentRunner(AgentPromptConfigpromptConfig,ConsultToolsconsultTools,Knowledgeknowledge,Modelmodel){Toolkittoolkit=newNacosToolkit();toolkit.registerTool(consultTools);AutoContextConfigautoContextConfig=AutoContextConfig.builder().tokenRatio(0.4).lastKeep(10).build();//UseAutoContextMemory,supportcontextautocompressionAutoContextMemorymemory=newAutoContextMemory(autoContextConfig,model);ReActAgent.Builderbuilder=ReActAgent.builder().name("consult_agent").sysPrompt(promptConfig.getConsultAgentInstruction()).memory(memory).hooks(List.of(newMonitoringHook())).model(model).toolkit(toolkit).knowledge(knowledge).ragMode(RAGMode.AGENTIC);returnnewCustomAgentRunner(builder);}

而对于 Supervisor Agent 来说由于集成了 Nacos,只需要构建一个 AiService 然后做一些简单的配置就可以完成子 Agent 的发现。

@BeanpublicAiServicenacosA2aService()throwsNacosException{Propertiesproperties=newProperties();properties.put(PropertyKeyConst.SERVER_ADDR,serverAddress);properties.put(PropertyKeyConst.NAMESPACE,namespace);returnAiFactory.createAiService(properties);}@BeanpublicA2aAgentconsultAgent(AiServicea2aService){returnA2aAgent.builder().name("consult_agent").agentCardResolver(newNacosAgentCardResolver(a2aService)).build();}

然后再把子 Agent 注册成一个工具,便可以像使用普通工具一样调用子 Agent。

@Tool(description="Agentforhandlingconsultation-relatedrequests,canprocessall"+"consultation-relatedrequests,requirespassingthecompletecontextin"+"thecontextparameter")publicStringcallConsultAgent(@ToolParam(name="context",description="Completecontext")Stringcontext,@ToolParam(name="userId",description="User'sUserId")StringuserId){Msgmsg=Msg.builder().content(TextBlock.builder().text(context).build()).build();A2aAgentconsultAgent=consultAgentProvider.getObject();returncombineAgentResponse(consultAgent.call(msg).block());}

集成 Nacos 的 MCP 调用:动态注册&发现

MCP 几乎已经成为了远程工具调用的事实标准,很多传统的业务系统也会提供 MCP 的 Endpoint 来使 Agent 能够触达真实业务场景。传统的 MCP 工具的注册方式是一个固定的 Endpoint,在灵活性和高可用上都不能完全满足需求。所以 AgentScope 在传统注册方式的基础上也集成了 Nacos 来实现 MCP 的动态发现。只需要在Business Sub Agent 中通过集成的 NacosMcpServerManager 加上几行代码便可以轻松完成 MCP 工具的注册。

Toolkittoolkit=newNacosToolkit();NacosMcpServerManagermcpServerManager=newNacosMcpServerManager(aiService);NacosMcpClientWrappermcpClientWrapper=NacosMcpClientBuilder.create("business-mcp-server",mcpServerManager).build();toolkit.registerMcpClient(mcpClientWrapper).block();

会话持久化:重启不丢失

会话通常包含了和模型的多轮对话,与记忆等有状态的内容绑定,如果只存储在内存中,在多实例部署或者重启场景下都会导致丢失或者错乱。所以 AgentScope 提供了基于 MySQL 的会话存储能力,能够随时接着上次聊天继续聊,同一会话无缝衔接,不同会话互相隔离。要在 AgentScope 中启用这个能力只需要部署一个 MySql 数据库,然后创建 MysqlSession 实例,在需要的地方 load 即可恢复到之前的状态,继续对话。

MysqlSessionmysqlSession=newMysqlSession(dataSource,System.getenv("DB_NAME"),null,true);ReActAgentagent=createAgent(toolkit,memory);agent.loadIfExists(mysqlSession,sessionId);

Mem0 长期记忆:记住每一位顾客

Mem0 是一个长期记忆服务框架,帮助 Agent 持续优化长期记忆,可以使用商业化版本也可以自行部署。在奶茶店的场景下,他能够帮助 Agent 不只拥有当前会话的记忆,还能跨会话记住用户关于饮品、甜度、冰量等偏好。自行对接 Mem0 需要维护与它的通讯以及注入 Agent 的方式和时机。在 AgentScope 中,则只需要配置 Mem0 的BaseUrl 以及 apiKey 即可。

Mem0LongTermMemorylongTermMemory=Mem0LongTermMemory.builder().agentName("BusinessAgent").userId(userId).apiBaseUrl("https://api.mem0.ai").apiKey(System.getenv("MEM0_API_KEY")).build();

AutoContextMemory:上下文压缩

现在的大模型的上下文窗口大小已经从早期的 4k 扩展至 100k 甚至 1M,但其中要存放历史交互、外部知识库检索结果、复杂的任务指令、中间推理步骤以及工具调用的返回结果等等,在复杂的场景中依旧存在着上下文大小焦虑。同时随着上下文窗口的暴涨,模型在检索和利用中间位置关键信息的效果和性能会显著下降。所以我们往往会考虑对上下文进行压缩,但是如果是简单的压缩很有可能会导致有效信息的损失,为了压缩而损失了准确性是不可取的。所以 AgentScope 推出了AutoContextMemory,它是框架提供的智能上下文内存管理组件,通过自动压缩、卸载和摘要对话历史,在成本控制和信息保留之间找到最佳平衡,具体的原理可以参考我们之前发布的文章《AgentScope AutoContextMemory:告别Agent上下文焦虑》。要使用该能力同样只需要配置一些简单参数即可。

AutoContextConfigautoContextConfig=AutoContextConfig.builder().tokenRatio(0.4).lastKeep(10).build();//UseAutoContextMemory,supportcontextautocompressionAutoContextMemorymemory=newAutoContextMemory(autoContextConfig,model);

快速开始

为了让大家能够快速体验,同时方便大家拿奶茶店练手,我们提供了多种便捷的部署方式:

本地开发推荐

#配置环境变量cplocal-env.examplelocal-env.shvimlocal-env.sh#一键启动sourcelocal-env.sh&&./local-deploy.shstart

K8s 生产推荐

#配置变量vimvalues.yaml#Helm一键部署helminstallagentscopehelm/--namespaceagentscope

Docker 极简

#配置环境变量cpdocker-env.example.env#容器一把梭docker-composeup-d

云产品(AgentRun)部署

如果想使用云产品部署,可以使用 AgentRun,直接拉取镜像部署,所需要配置的环境变量参考 README.md 文档。

最后的最后




Cloud Native

这个奶茶店的例子只是 AgentScope Java 能力的冰山一角,用来带大家快速入门。AgentScope Java 框架还支持更多玩法,所有的核心能力都有对应的 Example,欢迎大家体验:

  • 实时人类介入
    PlanNotebook,先规划后执行
    结构化输出
    AI 狼人杀

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ