在2025年4月9日,Google 正式官宣了Agent2Agent(A2A)协议。这是一个专门为 AI 代理之间的通信设计的开放标准 — 如果说过去我们关心的是人和 AI 如何协作,那 A2A 关注的,就是“AI 之间怎么互相理解、分工、配合”。
我第一时间读完了官方文档,下面我就试着用“尽量通俗但技术靠谱”的方式,给大家拆解一下这个协议的关键点。 ✨官方地址:https://google.github.io/A2A/#/
Agent2Agent(A2A)协议是一个由 Google 主导、开放社区共同参与构建的标准协议,它的设计目标,就是让用不同框架(LangChain、CrewAI、OpenAgents等)、跑在不同云上、由不同厂商构建的 AI 代理们,可以无缝协作,像一个团队一样办事。 这项标准并不是 Google 单打独斗搞出来的,而是联合了超过 50 家技术和咨询公司,包括: 在聊 A2A 之前,先来科普一个相关概念:MCP(模型上下文协议),这是 Anthropic 推出的,用于给代理提供工具、资源、上下文接入能力。A2A 与 MCP 具有互补关系,因为其核心目标是使这些代理能够相互通信。目前像 Google ADK(代理开发工具包)已经开始支持两者打通,开发者体验在逐步提升。读完协议文档后,总结了以下几个关键词(很有意思,基本上每个都和真实企业应用痛点相关): 跨平台协作
不要求共享内存、上下文或资源
代理之间可以以任务为中心灵活沟通
建立在已有标准上
基于 HTTP、SSE、JSON-RPC 等广泛支持的标准协议
很容易集成进现有 IT 基础设施
支持长时间任务 + 实时状态更新
可处理从几秒到几天的任务执行过程
支持异步反馈、流式信息回传
多模态数据传输
除了文本,还支持音频/视频/Web UI 数据的互通
说明未来的 AI 协作很可能是“多模态协同”,而不是“纯对话式工作流”。 4.A2A如何工作?A2A 促进了“客户端”代理和“远程”代理之间的通信。客户端代理负责制定和传达任务,而远程代理负责处理这些任务,以尝试提供正确的信息或采取正确的作。此交互涉及几个关键功能: 功能发现(Function Discovery)每个代理通过发布「Agent Card」来描述其能力,格式为 JSON,便于其他代理自动发现、选择合适的合作对象。
任务管理(Task Management) 代理之间以“任务(Task)”为核心通信单位。每个任务拥有完整生命周期,可以实时更新状态。任务的执行结果称为Artifact(工件)。
协作消息(Collaboration) 代理通过消息交换上下文信息、任务状态、构件内容,或用户指令,实现动态协作。
用户体验协商(UX Negotiation) 每条消息可包含多个模块,代表具体内容(如文本、图像、iframe 等)。通过这些模块,代理可就格式、展示方式等进行协商,提升用户交互体验。 以下是 A2A 在实际场景中的典型应用: 场景:企业希望通过 AI 自动化招聘流程
流程: 这些代理之间靠 A2A 通信完成整个招聘流程。听起来像是“AI团队远程协作”,而不是一个大模型做所有事。 Agent2Agent 协议,它不是在重新造轮子,而是在标准化现有碎片化代理系统之间的连接方式。未来如果 AI 代理真成为企业基础设施的一部分(就像微服务系统),那 A2A 这种协议很可能就是那个“TCP/IP”层的角色。 |