阿里开源 Assistant Agent，助力企业快速构建答疑、诊断智能助手

显示全部楼层

📖简介

Cloud Native

Assistant Agent是一个基于Spring AI Alibaba构建的企业级智能助手框架，采用代码即行动（Code-as-Action）范式，通过生成和执行代码来编排工具、完成任务。它是一个能理解、能行动、能学习的智能助手解决方案，可帮助企业快速构建智能答疑客服、系统诊断、运维助手、业务助理、AIOps等智能体。

仓库地址：spring-ai-alibaba/AssistantAgent

技术特性

🚀代码即行动（Code-as-Action）：Agent 通过生成并执行代码来完成任务，而非仅仅调用预定义工具，可以在代码中灵活编排、组合多个工具，实现复杂流程
🔒安全沙箱：AI 生成的代码在 GraalVM 多语言沙箱中安全运行，具备资源隔离能力
📊多维评估：通过评估图（Graph）进行多层次意图识别，精准指导 Agent 行为
🔄Prompt 动态组装：根据场景及前置评估结果动态注入上下文（经验、知识等）到 Prompt 中，灵活处理不同任务
🧠经验学习：自动积累成功经验，持续提升后续任务的表现
⚡快速响应：熟悉场景下，跳过 LLM 推理过程，基于经验快速响应

Assistant Agent 能帮你做什么？

Assistant Agent 是一个功能完整的智能助手，具备以下核心能力：

🔍智能问答：支持多数据源统一检索架构（通过 SPI 可扩展知识库、Web 等数据源），提供准确、可溯源的答案
🛠️工具调用：支持 MCP、HTTP API（OpenAPI）等协议，灵活接入海量工具，可组合调用实现复杂业务流程
⏰主动服务：支持定时任务、延迟执行、事件回调，让助手主动为你服务
📬多渠道触达：内置 IDE 回复，允许通过 SPI 可扩展钉钉、飞书、企微、Webhook 等渠道

为什么选择 Assistant Agent？

适用场景

智能客服：接入企业知识库，智能解答用户咨询
运维助手：对接监控、工单系统，自动处理告警、查询状态、执行操作
业务助理：连接 CRM、ERP 等业务系统，辅助员工完成日常工作

💡 以上仅为典型场景示例。通过配置知识库和接入工具，Assistant Agent 可适配更多业务场景，欢迎探索。

整体工作原理

以下是 Assistant Agent 处理一个完整请求的端到端流程示例：

项目结构

assistant-agent/├──assistant-agent-common#通用工具、枚举、常量├──assistant-agent-core#核心引擎：GraalVM执行器、工具注册表├──assistant-agent-extensions#扩展模块：│├──dynamic/#-动态工具（MCP、HTTPAPI）│├──experience/#-经验管理与快速意图配置│├──learning/#-学习提取与存储│├──search/#-统一搜索能力│├──reply/#-多渠道回复│├──trigger/#-触发器机制│└──evaluation/#-评估集成├──assistant-agent-prompt-builder#Prompt动态组装├──assistant-agent-evaluation#评估引擎├──assistant-agent-autoconfigure#SpringBoot自动配置└──assistant-agent-start#启动模块

🚀快速启动

Cloud Native

前置要求

Java 17+
Maven 3.8+
DashScope API Key

1. 克隆并构建

gitclonehttps://github.com/alibaba/assistant-agent.gitcdassistant-agentmvncleaninstall-DskipTests

2. 配置 API Key

exportDASHSCOPE_API_KEY=your-api-key-here

3. 最小配置

项目已内置默认配置，只需确保 API Key 正确即可。如需自定义，可编辑assistant-agent-start/src/main/resources/application.yml：

spring:ai:dashscope:api-key{DASHSCOPE_API_KEY}chatptions:model:qwen-max

4. 启动应用

cdassistant-agent-startmvnspring-boot:run

所有扩展模块默认开启并采用合理的配置，无需额外配置即可快速启动。

5. 配置知识库（接入业务知识）

💡框架默认提供 Mock 知识库实现用于演示测试。生产环境需要接入真实知识源（如向量数据库、Elasticsearch、企业知识库 API 等），以便 Agent 能够检索并回答业务相关问题。

方式一：快速体验（使用内置 Mock 实现）

默认配置已启用知识库搜索，可直接体验：

spring:ai:alibaba:codeact:extension:search:enabled:trueknowledge-search-enabled:true#默认开启

方式二：接入真实知识库（推荐）

实现SearchProvider接口，接入你的业务知识源：

packagecom.example.knowledge;importcom.alibaba.assistant.agent.extension.search.spi.SearchProvider;importcom.alibaba.assistant.agent.extension.search.model.*;importorg.springframework.stereotype.Component;importjava.util.*;@Component//添加此注解，Provider会自动注册publicclassMyKnowledgeSearchProviderimplementsSearchProvider{@Overridepublicbooleansupports(SearchSourceTypetype){returnSearchSourceType.KNOWLEDGE==type;}@OverridepublicList<SearchResultItem>search(SearchRequestrequest){List<SearchResultItem>results=newArrayList<>();//1.从你的知识源查询（向量数据库、ES、API等）//示例：List<Doc>docs=vectorStore.similaritySearch(request.getQuery());//2.转换为SearchResultItem//for(Docdoc:docs){//SearchResultItemitem=newSearchResultItem();//item.setId(doc.getId());//item.setSourceType(SearchSourceType.KNOWLEDGE);//item.setTitle(doc.getTitle());//item.setSnippet(doc.getSummary());//item.setContent(doc.getContent());//item.setScore(doc.getScore());//results.add(item);//}returnresults;}@OverridepublicStringgetName(){return"MyKnowledgeSearchProvider";}}

常见知识源接入示例

🧩 核心模块介绍

Cloud Native

评估模块（Evaluation）

作用：多维度意图识别框架，通过评估图（Graph）对信息进行多层次特质识别。

┌──────────────────────────────────────────────────────────────────┐│评估图(EvaluationGraph)示例│├──────────────────────────────────────────────────────────────────┤│││用户输入:"查询今日订单"│││││▼││┌─────────────────────────────────────────────────────────┐│││Layer1（并行执行）││││┌────────────┐┌────────────┐│││││是否模糊?││输入改写││││││清晰/模糊││（增强）│││││└─────┬──────┘└─────┬──────┘│││└─────────┼──────────────────────┼────────────────────────┘││││││└──────────┬───────────┘││▼││┌─────────────────────────────────────────────────────────┐│││Layer2(基于改写内容，并行执行)││││┌──────────┐┌──────────┐┌──────────┐│││││检索经验││匹配工具││搜索知识││││││有/无││有/无││有/无│││││└──────────┘└──────────┘└──────────┘│││└─────────────────────────────────────────────────────────┘│││││▼││┌────────────────────┐│││整合不同维度评估结果││││→传递给后续模块│││└────────────────────┘│││└──────────────────────────────────────────────────────────────────┘

核心能力：

双评估引擎：

LLM 评估：通过大模型进行复杂语义判断，用户可完全自定义评估 Prompt（customPrompt），也可使用默认 Prompt 组装（支持description、workingMechanism、fewShots等配置）
Rule-based 评估：通过 Java 函数实现规则逻辑，用户自定义Function<CriterionExecutionContext, CriterionResult>执行任意规则判断，适合阈值检测、格式校验、精确匹配等场景

依赖关系自定义：评估项可通过dependsOn声明前置依赖，系统自动构建评估图按拓扑执行，无依赖项并行、有依赖项顺序执行，后续评估项可访问前置评估项的结果
评估结果：支持BOOLEAN、ENUM、SCORE、JSON、TEXT等类型，传递给 Prompt Builder 驱动动态组装

Prompt Builder 模块

作用：根据评估结果和运行时上下文，动态组装发送给模型的 Prompt。示例：

┌─────────────────────────────────────────────────────────────────────────┐│PromptBuilder-条件化动态生成│├─────────────────────────────────────────────────────────────────────────┤│││评估结果输入:││┌────────────────────────────────────────────────────────┐│││模糊:是│经验:有│工具:有│知识:无│││└────────────────────────────────────────────────────────┘│││││▼││┌────────────────────────────────────────────────────────────────┐│││自定义PromptBuilder条件匹配││││││││模糊=是──────▶注入[澄清引导Prompt]││││模糊=否──────▶注入[直接执行Prompt]││││││││经验=有──────▶注入[历史经验参考]││││工具=有──────▶注入[工具使用说明]││││知识=有──────▶注入[相关知识片段]││││││││组合示例1:模糊+无工具+无知识──▶[追问用户Prompt]││││组合示例2:清晰+有工具+有经验──▶[快速执行Prompt]│││└────────────────────────────────────────────────────────────────┘│││││▼││┌────────────────────────────────────────────────────────────────┐│││最终动态Prompt:││││[系统提示]+[澄清引导]+[历史经验]+[工具说明]+[用户问题]│││└────────────────────────────────────────────────────────────────┘│││││▼││┌──────────┐│││模型│││└──────────┘│││└─────────────────────────────────────────────────────────────────────────┘

核心能力：

多个 PromptBuilder 按优先级顺序执行
每个 Builder 根据评估结果决定是否贡献、贡献什么内容
支持自定义 Builder，根据业务需求定制 Prompt 逻辑
非侵入式，在模型调用层拦截

对比传统方案：

学习模块（Learning）

作用：从 Agent 执行历史中自动提取并保存有价值的经验。

┌─────────────────────────────────────────────────────────────────────────┐│学习模块工作流程│├─────────────────────────────────────────────────────────────────────────┤│││┌────────────────────────────────────────────────────────────────────┐│││Agent执行过程││││││││输入──▶推理──▶代码生成──▶执行──▶输出│││││││││││││└────────┴──────────┴─────────┴────────┘││││││││└────────────────────────┼───────────────────────────────────────────┘││▼││┌────────────────────────┐│││学习上下文捕获││││-用户输入││││-中间推理步骤││││-生成的代码││││-执行结果│││└───────────┬────────────┘│││││▼││┌──────────────────────────────────────────────────────────────┐│││学习提取器分析││││┌────────────┐┌────────────┐┌────────────┐│││││经验提取器││模式提取器││错误提取器││││││成功模式││通用模式││失败教训│││││└─────┬──────┘└─────┬──────┘└─────┬──────┘│││└────────┼───────────────┼───────────────┼─────────────────────┘│││││││└───────────────┼───────────────┘││▼││┌────────────────┐│││持久化存储│──▶供后续任务参考使用││└────────────────┘│││└────────────────────────────────────────────────────────────────────────┘

核心能力：

After-Agent 学习：每次 Agent 运行完成后提取经验
After-Model 学习：每次模型调用后提取经验
Tool Interceptor：从工具调用中提取经验
离线学习：批量分析历史数据提取模式
学习过程：捕获执行上下文 → 提取器分析识别 → 生成经验记录 → 持久化存储供后续复用

经验模块（Experience）

作用：积累和复用历史成功执行经验。

┌─────────────────────────────────────────────────────────────────────────┐│经验模块工作示意│├─────────────────────────────────────────────────────────────────────────┤│││【场景1:经验积累】││││用户:"查询订单状态"──▶Agent成功执行──▶┌────────────────┐│││保存经验:││││-React决策经验││││-Code经验││││-常识经验│││└────────────────┘│││││▼││┌────────────────┐│││经验库│││└────────────────┘││││【场景2:经验复用】｜│││││用户:"查询我的订单状态"◀────匹配相似经验◀────────────┘│││││▼││┌─────────────────────────────────────────────────┐│││Agent参考历史经验，更快决策+生成正确代码│││└─────────────────────────────────────────────────┘││││【场景3:快速意图响应】││││┌─────────────────────────────────────────────────────────────────┐│││经验库││││┌─────────────────────┐┌────────────────────────────┐│││││经验A(普通)││经验B(✓已配置快速意图)││││││无快速意图配置││条件:前缀匹配"查看*销量"││││││→注入prompt供llm参考││动作:调用销量查询API│││││└─────────────────────┘└───────────┬────────────────┘│││└─────────────────────────────────────────────┼───────────────────┘│││条件命中││▼││用户:"查看今日销量"──▶匹配经验B快速意图──▶跳过LLM，直接执行│││││└─────────────────────────────────────────────────────────────────────────┘

核心能力：

多类型经验：代码生成经验、ReAct 决策经验、常识经验，为类似任务提供历史参考
灵活复用：经验可注入 Prompt 或用于快速意图匹配
生命周期管理：支持经验的创建、更新、删除
快速意图响应：

经验需显式配置fastIntentConfig才能启用
匹配已配置条件时，跳过 LLM 完整推理，直接执行预记录的工具调用或代码
支持多条件匹配：消息前缀、正则、元数据、状态等

触发器模块（Trigger）

作用：创建和管理定时任务或事件触发的 Agent 执行。

┌─────────────────────────────────────────────────────────────────────────┐│触发器模块能力示意│├─────────────────────────────────────────────────────────────────────────┤│││【定时触发】││││用户:"每天早上9点给我发送销售日报"│││││▼││┌─────────────────┐┌─────────────────┐┌─────────────────┐│││Agent创建││调度器││自动执行││││Cron触发器│────▶│09***│────▶│生成日报││││(自我调度)││││发送通知│││└─────────────────┘└─────────────────┘└─────────────────┘││││【延迟触发】││││用户:"30分钟后提醒我开会"│││││▼││┌─────────────────┐┌─────────────────┐┌─────────────────┐│││Agent创建││30分钟后││发送提醒││││一次性触发器│────▶│触发│────▶│"该开会了"│││└─────────────────┘└─────────────────┘└─────────────────┘││││【回调触发】││││用户:"满足xx条件时帮我xx"││││外部系统:发送事件到Webhook│││││▼││┌─────────────────┐┌─────────────────┐┌─────────────────┐│││接收回调││触发Agent││处理事件││││Webhook事件│────▶│执行任务│────▶│返回响应│││└─────────────────┘└─────────────────┘└─────────────────┘│││└─────────────────────────────────────────────────────────────────────────┘

核心能力：

TIME_CRON触发器：支持 Cron 表达式定时触发任务
TIME_ONCE触发器：支持一次性延迟触发
CALLBACK触发器：支持回调事件触发
Agent 可通过工具自主创建触发器，实现“自我调度”

回复渠道模块（Reply Channel）

作用：提供灵活的消息回复能力，支持多种输出渠道。

┌─────────────────────────────────────────────────────────────────────────┐│回复渠道模块能力示意│├─────────────────────────────────────────────────────────────────────────┤│││Agent需要向用户回复消息│││││▼││┌─────────────────────────────────────────────────────────────────┐│││回复渠道路由│││└─────────────────────────────────────────────────────────────────┘│││││├──────────────┬──────────────┬──────────────┐││▼▼▼▼││┌────────────┐┌────────────┐┌────────────┐┌────────────┐│││DEFAULT││IDE_CARD││IM_NOTIFY││WEBHOOK││││文本回复││卡片展示││消息推送││JSON推送│││└─────┬──────┘└─────┬──────┘└─────┬──────┘└─────┬──────┘││││││││▼▼▼▼││┌──────────┐┌──────────┐┌──────────┐┌──────────┐│││控制台││IDE││IM││第三方││││终端回复││富文本卡片││(可扩展)││系统│││└──────────┘└──────────┘└──────────┘└──────────┘││││【使用示例】││││用户:"分析完成后发送结果"│││││▼││Agent:send_message(text="分析结果...")│││││▼││用户收到消息:"📊分析结果:..."│││└─────────────────────────────────────────────────────────────────────────┘

核心能力：

多渠道路由：Agent 可根据场景选择不同渠道回复
配置驱动：动态生成回复工具，无需编码
同步异步支持：支持同步和异步回复模式
统一接口：屏蔽底层实现差异
内置示例渠道：IDE_TEXT（演示用）
可扩展渠道（通过实现ReplyChannelDefinitionSPI）：如IDE_CARD、IM_NOTIFICATION（钉钉/飞书/企微）、WEBHOOK_JSON等，需用户自行实现

工具扩展模块（Dynamic Tools）

作用：提供高度可扩展的工具体系，让 Agent 能够调用各类外部工具完成任务。

┌─────────────────────────────────────────────────────────────────────────┐│工具扩展架构│├─────────────────────────────────────────────────────────────────────────┤│││Agent需要执行操作│││││▼││┌──────────────────────────────────────────────────────────────────┐│││CodeactTool工具体系│││└─────────────────────────────────────────────────────────────────┘│││││├─────────────┬─────────────┬─────────────┬──────────────┐││▼▼▼▼▼││┌────────────┐┌────────────┐┌────────────┐┌────────────┐┌───────┐│││MCP││HTTP││Search││Trigger││自定义││││Tools││API││Tools││Tools││Tools││││││Tools│││││││││└─────┬──────┘└─────┬──────┘└─────┬──────┘└─────┬──────┘└───┬───┘│││││││││▼▼▼▼▼││┌──────────┐┌──────────┐┌──────────┐┌──────────┐┌──────┐│││任意MCP││RESTAPI││知识检索││定时任务││...││││Server││OpenAPI││项目搜索││事件回调│││││└──────────┘└──────────┘└──────────┘└──────────┘└──────┘│││└─────────────────────────────────────────────────────────────────────────┘

核心能力：

MCP 工具支持：一键接入任意 MCP Server，复用 MCP 工具生态
HTTP API 支持：通过 OpenAPI 规范接入 REST API，调用企业现有接口
内置工具类型：搜索（Search）、回复（Reply）、触发器（Trigger）、学习（Learning）等
自定义工具 SPI：实现CodeactTool接口，轻松扩展新工具

知识检索模块（Knowledge Search）

作用：多数据源统一检索引擎，为 Agent 的问答和决策提供知识支撑。

┌─────────────────────────────────────────────────────────────────────────┐│多数据源检索架构│├─────────────────────────────────────────────────────────────────────────┤│││用户问题:"如何配置数据库连接池？"│││││▼││┌─────────────────────────────────────────────────────────────────┐│││统一检索接口│││└─────────────────────────────────────────────────────────────────┘│││││├────────────────┬────────────────┬────────────────┐││▼▼▼▼││┌──────────────┐┌──────────────┐┌──────────────┐┌─────────┐│││知识库││项目││Web││自定义││││Provider││Provider││Provider││Provider││││(主要)││(可选)││(可选)││(SPI)│││└──────┬───────┘└──────┬───────┘└──────┬───────┘└───┬─────┘││││││││▼▼▼▼││┌──────────────┐┌──────────────┐┌──────────────┐┌────────┐│││FAQ/文档││源代码││网络文章││...││││历史问答││配置文件││技术论坛││││││团队笔记││日志│││││││└──────────────┘└─────────────┘└───────────────┘└────────┘││││││││└─────────────────┴─────────────────┴──────────────┘│││││▼││┌────────────────────────┐│││聚合排序││││→注入Prompt│││└────────────────────────┘│││└────────────────────────────────────────────────────────────────────────┘

核心能力：

统一检索接口：SearchProviderSPI，支持可插拔数据源
演示 Provider：内置知识库、项目、Web 的 Mock 实现（仅供演示和测试）
自定义扩展：通过实现SearchProvider接口，接入任意数据源（数据库、向量库、API）
结果聚合：支持可配置的排序策略
业务价值：接入企业知识库提供准确答案、支持答案溯源、降低人工客服压力

配置示例：

spring:ai:alibaba:codeact:extension:search:enabled:trueknowledge-search-enabled:true#知识库（默认Mock实现）project-search-enabled:false#项目代码（默认Mock实现）web-search-enabled:false#Web搜索（默认Mock实现）default-top-k:5search-timeout-ms:5000

💡 以上搜索功能默认提供 Mock 实现供演示测试。生产环境需实现SearchProviderSPI 接入实际数据源。