当前,AI Agent的相关技术与 其应用正同步处于高速迭代与落地应用的进程中。这种双重推进的态势,使得诸多应用尚未抵达成熟阶段,便因新技术的持续冲击,出现应用成熟度逆向发展甚至商业模式被彻底颠覆的情况。深入了解AI及Agent的技术及发展状态,能够更有效地辅助企业管理者在商业战略布局中,借助AI技术的应用实现创新突破。
大模型、GenAI技术是AI Agent原生企业落地的基础底座和关键技术。为更全面了解AI Agent原生应用的技术及发展状态,报告基于Gartner技术成熟度曲线进行了分析。
由于GenAI的爆发,Gartner自2023年起将传统AI(人工智能)和Gen AI(生成式人工智能)拆分为两条独立的技术曲线。其中AI曲线侧重于传统行业的智能化转型和AI治理,GenAI曲线侧重于基于生成式人工智能的创新、泛用和颠覆性用例。
(一)传统AI技术曲线
Artificial Intelligence技术曲线(2023年—2024年)
从Hyper cycle for Artificial Intelligence(2024年)的技术曲线来看,目前共有29项细分技术类型,与2023年的数量基本相当。类型主要包括:AI行业应用和AI治理两类。
整体趋势来说,新技术在不断涌现,多数技术尚处于刚起步和爬升阶段;少数部分发展多年的技术,逐步趋于成熟,进入了稳步爬升周期甚至滑出了曲线关注范围;但也有个别技术,像Edge AI、Cloud AI Service由于受到了某些因素影响出现倒退趋势。
应用类的AI技术包括:计算机视觉、增强型智能应用、知识图谱、自动驾驶、决策智能、嵌入式AI、基础模型、GenAI、智能应用程序、Cloud AI Services、Edge AI等。由于AI技术历经了长期演进,各项技术的起步时间与发展成熟度呈现一些差异。
其中,少部分应用技术,如,计算机视觉、增强型智能应用、知识图谱、自动驾驶已经开始离开“幻灭低谷期”进入“稳步爬升期”。
GenAI、合成数据、基础模型,尽管还处于炒作高峰期,但演进速度较快,已经越过了巅峰拐点,Gartner认为它们将会在2~5年内进入主流应用。建议企业尽早采用这些技术带来显著的竞争优势,并缓解与在业务流程中使用AI模型相关的问题。
由于GenAI等新技术的介入,Cloud AI Services、Edge AI、决策智能技术的成熟度出现了不同程度的倒退。也进一步说明,在当前的时间周期内,AI技术的加速迭代和AI应用的加速落地同步,这也导致很多应用还未成熟,就会由于新技术出现,导致行业应用成熟度倒退或企业商业模式颠覆。
此外,相比2023年,具身智能(Embodied AI)、量子AI(Quantum AI)作为两项新兴技术在2024年首次被单独列出,引起了广泛关注。其中,具身智能的市场关注度在急剧上升,尽管目前处于实验与原型验证阶段,但可能会成为AI发展的下一阶段核心突破口之一,尤其在实现通用智能(AGI)路径上具有战略意义。而量子AI代表的是长期颠覆性潜力,技术尚处于实验性研发与概念验证阶段,非短期落地技术。
主要包括:负责任的AI、AI TRiSM(人工智能信任、风险和安全管理)、Prompt Engineering(PE,提示工程)和主权AI。这些技术整体看,正在进入技术炒作“高峰期”,显示出由于企业和个人对AI使用的迅速扩大,在治理和安全方面的担忧日益增加。
负责任的人工智能(Responsible AI)是指在人工智能系统的设计、开发、部署和使用过程中,充分考虑伦理、社会、法律及环境影响,确保AI技术对人类和社会产生积极价值,同时规避潜在风险的理念与实践框架。其核心目标是让AI系统具备可解释性、公平性、安全性,并对其决策结果承担责任,避免技术滥用或对特定群体造成伤害。受大模型落地应用的影响,相比2023年,人们对该技术寄予了更多期望,认为其在2-5年内会得到广泛应用。
AI TRiSM框架是Gartner 于2022年提出的AI信任、风险和安全管理框架,旨在通过控制措施和信任机制,提供应对AI使用风险和自身安全风险的管理措施,帮助企业确保人工智能模型的治理、可信度、公平性、可靠性、稳健性、有效性和数据保护。从2024年的曲线来看,AI TRiSM已经攀升到了炒作周期的顶峰,目前正处于备受瞩目的关键阶段。
PE也是Gartner 2022年提出来的,主要是通过格式化或非格式化的输入使GenAI给出更符合人类期望的输出结果。目前作为人类与AI交互的一门新语言学科在快速发展。随着大语言模型智力的升级,有人预测PE或许只是AI发展初期阶段的过渡性技术,未来格式化的PE有可能会消失。
(二)GenAI技术曲线
Gen AI技术曲线(2023年—2024年)
Hyper cycle for Generative AI(2024年)技术曲线,整体来看:Gen AI还是一项较新的技术,但细分技术类别却达到了28项,共分为:大模型、AI工程工具、应用和用例、支持技术和基础设施4大类。
趋势上,GenAI领域的新技术正呈指数级涌现,技术密集度较2023年在显著增加,并且当前还有技术越过“幻灭低谷期”。但研究认为,其中70%的技术都将会在2~5年内成为主流应用。这也说明:GenAI技术正呈现集中式爆发的趋势,并且技术发展与市场渗透率几近同频。然而,这种爆发式发展也可能使应用主体面临不确定性的挑战。
AI Agent技术在落地过程中,国内外AI研究团队都先后提出过不同的系统框架的思想。典型的有:复旦大学NLP团队提出了“大脑、感知、行动”框架;中国人民大学提出了“分析、记忆、规划、行动”通用框架;OpenAI工程师翁丽莲提出了“LLM、记忆、规划、工具使用”架构。有研究又将这些框架又分成三模块结构和四模块结构。
总体来看,这些理念并非相互对立,都包含大模型、感知和工具调用三个基本模块,核心区别在于Agent执行逻辑上是否包含“任务规划”。
从Agent技术架构演进和发展过程来看,这些思想也是早期ReAct架构和Plan-and-Execute架构的具体体现。ReAct和Plan-and-Execute,是Agent演进过程中生成Agent向自主型Agent演进的两个基本思想框架,是Agent技术迭代的两个阶段性特征,为Agent技术实现奠定了坚实的基础。当前阶段,人们对Agent最主流的理解是“感知、规划、决策和行动”,Plan-and-Execute架构是相对主流的架构。
随着AI Agent落地应用,在ReAct和Plan-and-Execute基础上,陆续发展了Multi-Agent(多智能体协同架构)、Memory-Augmented Agent(记忆增强型)、Graph-based Agent (图式流程驱动)、平台托管型等应用架构。
AI Agent技术架构及演进
(1)ReAct架构(Reasoning and Acting,推理-行动)
最早由Google提出,是最基础的Agent架构。
(2)Plan-and-Execute(规划-执行)架构
重构了执行可靠性和可控性,主要由于OpenAI、LangChain推广开来。
(3)Multi-Agent 架构(多智能体协同)
通过多个协同Agent(不同角色)解决复杂任务,支持分工、协商、反馈等智能体行为。典型工作流程是:任务分派→多角色Agent协作→主控Agent评估结果→整合输出。
(4) Memory-Augmented Agent架构(记忆增强型)
Agent拥有可持续更新的长期记忆系统,用于上下文关联、习惯学习、知识积累。
(5)Graph-based Agent架构(图式流程驱动)
以节点(任务)+边(控制流)形式构建复杂任务图,实现可视化调度与并行控制。
(6)Agent-as-a-Service架构(平台托管型)
将Agent作为一个托管服务运行,支持多用户接入、权限控制、状态管理等。
AI Agent应用系统作为AI Agent原生企业的核心业务系统,是驱动企业运营的命脉与战略发展的基石。其本质是基于大语言模型与Agent构建的数智化系统,通常由大模型、AI Agent应用/平台、知识系统与交互系统四个基础模块组成。
AI Agent应用系统的基本原型
(1)基础模型
大模型是AI Agent应用系统的“智能底座”和“大脑”,提供自然语言理解、知识生成、通用推理等核心智能,可以赋予Agent理解、思考和规划能力,是所有Agent智能决策的核心引擎。
(2)AI Agent应用/平台
AI Agent应用/平台是大模型行为能力的主要载体,也是企业实现智能业务流程、自动化应用、垂直智能体的技术框架。该模块将模型能力封装为标准化功能组件,并通过集成API、插件、数据库等工具链,支持多任务、多智能体协作。产品形态有:应用、平台、服务三种。
(3)知识系统
知识系统通过企业专属知识注入(私有知识库),语义搜索与上下文检索(RAG),支撑Agent的知识增强与长期记忆,弥补大模型本身无法实时更新或记忆的缺陷。通常包括结构化数据、非结构化文本、知识图谱、向量数据库等。
(4)交互系统
交互系统是用户与Agent 交互的前端模块,提供对话入口或图形界面,可接入语音、图像、视频等多模态输入,支持对话管理、多轮上下文维护及可视化展示等功能。是实现“人-机协作”的直接媒介,决定用户体验。
从信息系统四层结构来看,Agent应用系统相比传统信息系统有很大区别。
传统信息系统与AI Agent应用系统的结构对比
系统层,从硬件和操作系统为核心的服务器进化为以提供“算法+算力”为主的智能基础设施;
数据层,数据类型从结构化数据库(如MySQL、Oracle)扩展为用于模型训练与推理的非结构化/多模态大数据;
应用层,从模块化的业务流程软件进化为支持自然语言驱动、业务编排与执行能力的智能Agent应用/平台;
表示层,从传统表单、按钮式交互升级为支持多模态、人机对话、自然语言交互的用户界面。
2025年5月,Agentico创始人Oliver Morris与变革管理专家Simon Torrance合作在AI Risk平台上提出并发布了“Agentic AI Stack for Enterprises”企业级框架。
该框架从企业运营角度映射到Agentic AI生态系统,旨在为企业提供一个战略视角理解Agentic AI生态系统的方式。自下而上分为:数据层、能力层、交互层三大层级,分别从技术与运营管理两个维度,明确了企业从传统系统向Agent驱动架构演进的路径。可以帮助企业以战略思维和可控方式,从底层到前端系统性地向“Agent 原生”演进。
Agentic AI Stack for Enterprises
(1)数据层(Data Tier)
数据层聚焦于底层数据基础与治理,构成Agentic AI系统的知识根基。核心价值确保所有智能体的输入输出有据可查,实现学习可验证与审计追踪。
功能包括:构建结构化和非结构化的数据存储系统(数据库、数据湖、知识图谱、向量存储),管理数据质量、审计与合规性,提供用于Agent训练、推理和自我审查的数据流水线。
(2)能力层(Capabilities Tier)
能力层是构建企业级Agent系统的“智能中枢”,由Controls、Orchestration、Intelligence、Tools四个子模块构成。
(3)交互层(Engagement Tier)
交互层是AI Agent与人或系统交互的前端界面,是“感知与呈现”的窗口。包括Interfaces和Third-party Agents两个组成部分。核心价值是让Agent能够跨平台被发现、组合、执行与授权,是Agent服务化的入口。