|
Assistant Agent是一个基于Spring AI Alibaba构建的企业级智能助手框架,采用代码即行动(Code-as-Action)范式,通过生成和执行代码来编排工具、完成任务。它是一个能理解、能行动、能学习的智能助手解决方案,可帮助企业快速构建智能答疑客服、系统诊断、运维助手、业务助理、AIOps等智能体。 仓库地址:spring-ai-alibaba/AssistantAgent - 🚀代码即行动(Code-as-Action):Agent 通过生成并执行代码来完成任务,而非仅仅调用预定义工具,可以在代码中灵活编排、组合多个工具,实现复杂流程
- 🔒安全沙箱:AI 生成的代码在 GraalVM 多语言沙箱中安全运行,具备资源隔离能力
- 📊多维评估:通过评估图(Graph)进行多层次意图识别,精准指导 Agent 行为
- 🔄Prompt 动态组装:根据场景及前置评估结果动态注入上下文(经验、知识等)到 Prompt 中,灵活处理不同任务
- 🧠经验学习:自动积累成功经验,持续提升后续任务的表现
- ⚡快速响应:熟悉场景下,跳过 LLM 推理过程,基于经验快速响应
Assistant Agent 是一个功能完整的智能助手,具备以下核心能力: - 🔍智能问答:支持多数据源统一检索架构(通过 SPI 可扩展知识库、Web 等数据源),提供准确、可溯源的答案
- 🛠️工具调用:支持 MCP、HTTP API(OpenAPI)等协议,灵活接入海量工具,可组合调用实现复杂业务流程
- ⏰主动服务:支持定时任务、延迟执行、事件回调,让助手主动为你服务
- 📬多渠道触达:内置 IDE 回复,允许通过 SPI 可扩展钉钉、飞书、企微、Webhook 等渠道
- 运维助手:对接监控、工单系统,自动处理告警、查询状态、执行操作
- 业务助理:连接 CRM、ERP 等业务系统,辅助员工完成日常工作
💡 以上仅为典型场景示例。通过配置知识库和接入工具,Assistant Agent 可适配更多业务场景,欢迎探索。 

以下是 Assistant Agent 处理一个完整请求的端到端流程示例: assistant-agent/├──assistant-agent-common#通用工具、枚举、常量├──assistant-agent-core#核心引擎:GraalVM执行器、工具注册表├──assistant-agent-extensions#扩展模块:│├──dynamic/#-动态工具(MCP、HTTPAPI)│├──experience/#-经验管理与快速意图配置│├──learning/#-学习提取与存储│├──search/#-统一搜索能力│├──reply/#-多渠道回复│├──trigger/#-触发器机制│└──evaluation/#-评估集成├──assistant-agent-prompt-builder#Prompt动态组装├──assistant-agent-evaluation#评估引擎├──assistant-agent-autoconfigure#SpringBoot自动配置└──assistant-agent-start#启动模块 gitclonehttps://github.com/alibaba/assistant-agent.gitcdassistant-agentmvncleaninstall-DskipTests exportDASHSCOPE_API_KEY=your-api-key-here 项目已内置默认配置,只需确保 API Key 正确即可。如需自定义,可编辑assistant-agent-start/src/main/resources/application.yml: spring:ai:dashscope:api-key {DASHSCOPE_API_KEY}chat ptions:model:qwen-max cdassistant-agent-startmvnspring-boot:run 所有扩展模块默认开启并采用合理的配置,无需额外配置即可快速启动。 💡框架默认提供 Mock 知识库实现用于演示测试。生产环境需要接入真实知识源(如向量数据库、Elasticsearch、企业知识库 API 等),以便 Agent 能够检索并回答业务相关问题。 方式一:快速体验(使用内置 Mock 实现)默认配置已启用知识库搜索,可直接体验: spring:ai:alibaba:codeact:extension:search:enabled:trueknowledge-search-enabled:true#默认开启 方式二:接入真实知识库(推荐)实现SearchProvider接口,接入你的业务知识源: packagecom.example.knowledge;importcom.alibaba.assistant.agent.extension.search.spi.SearchProvider;importcom.alibaba.assistant.agent.extension.search.model.*;importorg.springframework.stereotype.Component;importjava.util.*;@Component//添加此注解,Provider会自动注册publicclassMyKnowledgeSearchProviderimplementsSearchProvider{@Overridepublicbooleansupports(SearchSourceTypetype){returnSearchSourceType.KNOWLEDGE==type;}@OverridepublicList<SearchResultItem>search(SearchRequestrequest){List<SearchResultItem>results=newArrayList<>();//1.从你的知识源查询(向量数据库、ES、API等)//示例:List<Doc>docs=vectorStore.similaritySearch(request.getQuery());//2.转换为SearchResultItem//for(Docdoc:docs){//SearchResultItemitem=newSearchResultItem();//item.setId(doc.getId());//item.setSourceType(SearchSourceType.KNOWLEDGE);//item.setTitle(doc.getTitle());//item.setSnippet(doc.getSummary());//item.setContent(doc.getContent());//item.setScore(doc.getScore());//results.add(item);//}returnresults;}@OverridepublicStringgetName(){return"MyKnowledgeSearchProvider";}}常见知识源接入示例作用:多维度意图识别框架,通过评估图(Graph)对信息进行多层次特质识别。 ┌──────────────────────────────────────────────────────────────────┐│评估图(EvaluationGraph)示例│├──────────────────────────────────────────────────────────────────┤│││用户输入:"查询今日订单"│││││▼││┌─────────────────────────────────────────────────────────┐│││Layer1(并行执行)││││┌────────────┐┌────────────┐│││││是否模糊?││输入改写││││││清晰/模糊││(增强)│││││└─────┬──────┘└─────┬──────┘│││└─────────┼──────────────────────┼────────────────────────┘││││││└──────────┬───────────┘││▼││┌─────────────────────────────────────────────────────────┐│││Layer2(基于改写内容,并行执行)││││┌──────────┐┌──────────┐┌──────────┐│││││检索经验││匹配工具││搜索知识││││││有/无││有/无││有/无│││││└──────────┘└──────────┘└──────────┘│││└─────────────────────────────────────────────────────────┘│││││▼││┌────────────────────┐│││整合不同维度评估结果││││→传递给后续模块│││└────────────────────┘│││└──────────────────────────────────────────────────────────────────┘ 核心能力: - LLM 评估:通过大模型进行复杂语义判断,用户可完全自定义评估 Prompt(customPrompt),也可使用默认 Prompt 组装(支持description、workingMechanism、fewShots等配置)
- Rule-based 评估:通过 Java 函数实现规则逻辑,用户自定义Function<CriterionExecutionContext, CriterionResult>执行任意规则判断,适合阈值检测、格式校验、精确匹配等场景
- 依赖关系自定义:评估项可通过dependsOn声明前置依赖,系统自动构建评估图按拓扑执行,无依赖项并行、有依赖项顺序执行,后续评估项可访问前置评估项的结果
- 评估结果:支持BOOLEAN、ENUM、SCORE、JSON、TEXT等类型,传递给 Prompt Builder 驱动动态组装
作用:根据评估结果和运行时上下文,动态组装发送给模型的 Prompt。示例: ┌─────────────────────────────────────────────────────────────────────────┐│PromptBuilder-条件化动态生成│├─────────────────────────────────────────────────────────────────────────┤│││评估结果输入:││┌────────────────────────────────────────────────────────┐│││模糊:是│经验:有│工具:有│知识:无│││└────────────────────────────────────────────────────────┘│││││▼││┌────────────────────────────────────────────────────────────────┐│││自定义PromptBuilder条件匹配││││││││模糊=是──────▶注入[澄清引导Prompt]││││模糊=否──────▶注入[直接执行Prompt]││││││││经验=有──────▶注入[历史经验参考]││││工具=有──────▶注入[工具使用说明]││││知识=有──────▶注入[相关知识片段]││││││││组合示例1:模糊+无工具+无知识──▶[追问用户Prompt]││││组合示例2:清晰+有工具+有经验──▶[快速执行Prompt]│││└────────────────────────────────────────────────────────────────┘│││││▼││┌────────────────────────────────────────────────────────────────┐│││最终动态Prompt:││││[系统提示]+[澄清引导]+[历史经验]+[工具说明]+[用户问题]│││└────────────────────────────────────────────────────────────────┘│││││▼││┌──────────┐│││模型│││└──────────┘│││└─────────────────────────────────────────────────────────────────────────┘ 核心能力: - 多个 PromptBuilder 按优先级顺序执行
- 每个 Builder 根据评估结果决定是否贡献、贡献什么内容
- 支持自定义 Builder,根据业务需求定制 Prompt 逻辑
对比传统方案: 作用:从 Agent 执行历史中自动提取并保存有价值的经验。 ┌─────────────────────────────────────────────────────────────────────────┐│学习模块工作流程│├─────────────────────────────────────────────────────────────────────────┤│││┌────────────────────────────────────────────────────────────────────┐│││Agent执行过程││││││││输入──▶推理──▶代码生成──▶执行──▶输出│││││││││││││└────────┴──────────┴─────────┴────────┘││││││││└────────────────────────┼───────────────────────────────────────────┘││▼││┌────────────────────────┐│││学习上下文捕获││││-用户输入││││-中间推理步骤││││-生成的代码││││-执行结果│││└───────────┬────────────┘│││││▼││┌──────────────────────────────────────────────────────────────┐│││学习提取器分析││││┌────────────┐┌────────────┐┌────────────┐│││││经验提取器││模式提取器││错误提取器││││││成功模式││通用模式││失败教训│││││└─────┬──────┘└─────┬──────┘└─────┬──────┘│││└────────┼───────────────┼───────────────┼─────────────────────┘│││││││└───────────────┼───────────────┘││▼││┌────────────────┐│││持久化存储│──▶供后续任务参考使用││└────────────────┘│││└────────────────────────────────────────────────────────────────────────┘ 核心能力: - After-Agent 学习:每次 Agent 运行完成后提取经验
- After-Model 学习:每次模型调用后提取经验
- Tool Interceptor:从工具调用中提取经验
- 学习过程:捕获执行上下文 → 提取器分析识别 → 生成经验记录 → 持久化存储供后续复用
作用:积累和复用历史成功执行经验。 ┌─────────────────────────────────────────────────────────────────────────┐│经验模块工作示意│├─────────────────────────────────────────────────────────────────────────┤│││【场景1:经验积累】││││用户:"查询订单状态"──▶Agent成功执行──▶┌────────────────┐│││保存经验:││││-React决策经验││││-Code经验││││-常识经验│││└────────────────┘│││││▼││┌────────────────┐│││经验库│││└────────────────┘││││【场景2:经验复用】|│││││用户:"查询我的订单状态"◀────匹配相似经验◀────────────┘│││││▼││┌─────────────────────────────────────────────────┐│││Agent参考历史经验,更快决策+生成正确代码│││└─────────────────────────────────────────────────┘││││【场景3:快速意图响应】││││┌─────────────────────────────────────────────────────────────────┐│││经验库││││┌─────────────────────┐┌────────────────────────────┐│││││经验A(普通)││经验B(✓已配置快速意图)││││││无快速意图配置││条件:前缀匹配"查看*销量"││││││→注入prompt供llm参考││动作:调用销量查询API│││││└─────────────────────┘└───────────┬────────────────┘│││└─────────────────────────────────────────────┼───────────────────┘│││条件命中││▼││用户:"查看今日销量"──▶匹配经验B快速意图──▶跳过LLM,直接执行│││││└─────────────────────────────────────────────────────────────────────────┘ 核心能力: - 多类型经验:代码生成经验、ReAct 决策经验、常识经验,为类似任务提供历史参考
- 灵活复用:经验可注入 Prompt 或用于快速意图匹配
- 经验需显式配置fastIntentConfig才能启用
- 匹配已配置条件时,跳过 LLM 完整推理,直接执行预记录的工具调用或代码
作用:创建和管理定时任务或事件触发的 Agent 执行。 ┌─────────────────────────────────────────────────────────────────────────┐│触发器模块能力示意│├─────────────────────────────────────────────────────────────────────────┤│││【定时触发】││││用户:"每天早上9点给我发送销售日报"│││││▼││┌─────────────────┐┌─────────────────┐┌─────────────────┐│││Agent创建││调度器││自动执行││││Cron触发器│────▶│09***│────▶│生成日报││││(自我调度)││││发送通知│││└─────────────────┘└─────────────────┘└─────────────────┘││││【延迟触发】││││用户:"30分钟后提醒我开会"│││││▼││┌─────────────────┐┌─────────────────┐┌─────────────────┐│││Agent创建││30分钟后││发送提醒││││一次性触发器│────▶│触发│────▶│"该开会了"│││└─────────────────┘└─────────────────┘└─────────────────┘││││【回调触发】││││用户:"满足xx条件时帮我xx"││││外部系统:发送事件到Webhook│││││▼││┌─────────────────┐┌─────────────────┐┌─────────────────┐│││接收回调││触发Agent││处理事件││││Webhook事件│────▶│执行任务│────▶│返回响应│││└─────────────────┘└─────────────────┘└─────────────────┘│││└─────────────────────────────────────────────────────────────────────────┘ 核心能力: - TIME_CRON触发器:支持 Cron 表达式定时触发任务
- Agent 可通过工具自主创建触发器,实现“自我调度”
作用:提供灵活的消息回复能力,支持多种输出渠道。 ┌─────────────────────────────────────────────────────────────────────────┐│回复渠道模块能力示意│├─────────────────────────────────────────────────────────────────────────┤│││Agent需要向用户回复消息│││││▼││┌─────────────────────────────────────────────────────────────────┐│││回复渠道路由│││└─────────────────────────────────────────────────────────────────┘│││││├──────────────┬──────────────┬──────────────┐││▼▼▼▼││┌────────────┐┌────────────┐┌────────────┐┌────────────┐│││DEFAULT││IDE_CARD││IM_NOTIFY││WEBHOOK││││文本回复││卡片展示││消息推送││JSON推送│││└─────┬──────┘└─────┬──────┘└─────┬──────┘└─────┬──────┘││││││││▼▼▼▼││┌──────────┐┌──────────┐┌──────────┐┌──────────┐│││控制台││IDE││IM││第三方││││终端回复││富文本卡片││(可扩展)││系统│││└──────────┘└──────────┘└──────────┘└──────────┘││││【使用示例】││││用户:"分析完成后发送结果"│││││▼││Agent:send_message(text="分析结果...")│││││▼││用户收到消息:"📊分析结果:..."│││└─────────────────────────────────────────────────────────────────────────┘ 核心能力: - 多渠道路由:Agent 可根据场景选择不同渠道回复
- 可扩展渠道(通过实现ReplyChannelDefinitionSPI):如IDE_CARD、IM_NOTIFICATION(钉钉/飞书/企微)、WEBHOOK_JSON等,需用户自行实现
作用:提供高度可扩展的工具体系,让 Agent 能够调用各类外部工具完成任务。 ┌─────────────────────────────────────────────────────────────────────────┐│工具扩展架构│├─────────────────────────────────────────────────────────────────────────┤│││Agent需要执行操作│││││▼││┌──────────────────────────────────────────────────────────────────┐│││CodeactTool工具体系│││└─────────────────────────────────────────────────────────────────┘│││││├─────────────┬─────────────┬─────────────┬──────────────┐││▼▼▼▼▼││┌────────────┐┌────────────┐┌────────────┐┌────────────┐┌───────┐│││MCP││HTTP││Search││Trigger││自定义││││Tools││API││Tools││Tools││Tools││││││Tools│││││││││└─────┬──────┘└─────┬──────┘└─────┬──────┘└─────┬──────┘└───┬───┘│││││││││▼▼▼▼▼││┌──────────┐┌──────────┐┌──────────┐┌──────────┐┌──────┐│││任意MCP││RESTAPI││知识检索││定时任务││...││││Server││OpenAPI││项目搜索││事件回调│││││└──────────┘└──────────┘└──────────┘└──────────┘└──────┘│││└─────────────────────────────────────────────────────────────────────────┘ 核心能力: - MCP 工具支持:一键接入任意 MCP Server,复用 MCP 工具生态
- HTTP API 支持:通过 OpenAPI 规范接入 REST API,调用企业现有接口
- 内置工具类型:搜索(Search)、回复(Reply)、触发器(Trigger)、学习(Learning)等
- 自定义工具 SPI:实现CodeactTool接口,轻松扩展新工具
作用:多数据源统一检索引擎,为 Agent 的问答和决策提供知识支撑。 ┌─────────────────────────────────────────────────────────────────────────┐│多数据源检索架构│├─────────────────────────────────────────────────────────────────────────┤│││用户问题:"如何配置数据库连接池?"│││││▼││┌─────────────────────────────────────────────────────────────────┐│││统一检索接口│││└─────────────────────────────────────────────────────────────────┘│││││├────────────────┬────────────────┬────────────────┐││▼▼▼▼││┌──────────────┐┌──────────────┐┌──────────────┐┌─────────┐│││知识库││项目││Web││自定义││││Provider││Provider││Provider││Provider││││(主要)││(可选)││(可选)││(SPI)│││└──────┬───────┘└──────┬───────┘└──────┬───────┘└───┬─────┘││││││││▼▼▼▼││┌──────────────┐┌──────────────┐┌──────────────┐┌────────┐│││FAQ/文档││源代码││网络文章││...││││历史问答││配置文件││技术论坛││││││团队笔记││日志│││││││└──────────────┘└─────────────┘└───────────────┘└────────┘││││││││└─────────────────┴─────────────────┴──────────────┘│││││▼││┌────────────────────────┐│││聚合排序││││→注入Prompt│││└────────────────────────┘│││└────────────────────────────────────────────────────────────────────────┘ 核心能力: - 统一检索接口:SearchProviderSPI,支持可插拔数据源
- 演示 Provider:内置知识库、项目、Web 的 Mock 实现(仅供演示和测试)
- 自定义扩展:通过实现SearchProvider接口,接入任意数据源(数据库、向量库、API)
- 业务价值:接入企业知识库提供准确答案、支持答案溯源、降低人工客服压力
配置示例: spring:ai:alibaba:codeact:extension:search:enabled:trueknowledge-search-enabled:true#知识库(默认Mock实现)project-search-enabled:false#项目代码(默认Mock实现)web-search-enabled:false#Web搜索(默认Mock实现)default-top-k:5search-timeout-ms:5000 💡 以上搜索功能默认提供 Mock 实现供演示测试。生产环境需实现SearchProviderSPI 接入实际数据源。
|