谷歌重磅开源A2UI：让AI开口“说”UI，彻底革新界面生成方式！ - 链载Ai

当我们谈论生成式AI时，脑海中浮现的往往是那些能够妙笔生花写文章、思路清晰编代码的强大能力。AI在文本和代码领域已经展现出令人惊叹的创造力。然而，让AI直接生成一个复杂、交互性强的用户界面（UI），却一直是个不小的挑战。

想象一下，你希望AI不仅能理解你的意图，还能直接帮你“画”出你想要的界面，并且这个界面能完美适配各种设备和框架，同时还要足够安全。听起来是不是像科幻电影里的场景？

现在，谷歌给出了他们的答案：A2UI (Agent-to-User Interface)。这是一个全新的开源项目，旨在彻底解决AI智能体在生成和呈现丰富交互式UI方面的难题。

简单来说，A2UI就是让AI学会“说UI”。它提供了一种优化的格式，让AI智能体能够生成或填充各种丰富的用户界面。未来，你和AI的交互将不再局限于文字或简单的指令，而是能直接看到AI为你动态生成的、可交互的界面。

A2UI组件画廊

A2UI 渲染卡片画廊，展示了 A2UI 可以实现的各种 UI 组合。

当前，生成式AI虽然擅长文本和代码生成，但在呈现复杂的、可交互的界面时却力不从心，尤其是在远程或跨信任边界运行时。将AI生成的任意代码直接在用户界面上运行，还可能带来巨大的安全隐患。

A2UI的出现，正是为了解决这一核心痛点。它是一个开放标准和一套库，允许AI智能体“说出”UI的意图。智能体发送一个描述UI“意图”的声明式JSON格式数据，而客户端应用程序则使用其自身的原生组件库（如Flutter、Angular、Lit、React等）来渲染这个界面。

这种方法确保了AI生成的UI兼具数据的安全性和代码的表达力。

A2UI的设计理念，深刻洞察了AI时代UI生成面临的挑战：

1. 安全至上（Security first）：运行LLM生成的任意代码存在安全风险。A2UI是声明式数据格式，而非可执行代码。客户端应用程序维护一个经过预批准的、受信任的UI组件“目录”，智能体只能请求渲染目录中的组件，从根本上杜绝了安全隐患。
2. LLM友好且可增量更新（LLM-friendly and incrementally updateable）：UI被表示为一个扁平的组件列表，带有ID引用，这使得LLM能够轻松地逐步生成和更新UI，实现渐进式渲染和响应式用户体验。智能体可以随着对话的进行，高效地对UI进行增量修改。
3. 框架无关与高度可移植（Framework-agnostic and portable）：A2UI将UI的结构与UI的实现分离。智能体发送的是组件树及其数据模型的抽象描述，而客户端应用程序负责将这些抽象描述映射到其原生组件。这意味着，同一份A2UI JSON数据包，可以在不同框架构建的多个客户端上渲染，无论是Web组件、Flutter组件、React组件还是SwiftUI视图。
4. 极度灵活（Flexibility）：A2UI还支持开放注册模式，允许开发者将服务器端类型映射到自定义的客户端实现。通过注册“智能包装器”（Smart Wrapper），你可以将任何现有UI组件（包括安全的iframe容器）连接到A2UI的数据绑定和事件系统，从而将安全性牢牢掌握在开发者手中，根据需求实施严格的沙盒策略。

A2UI的应用场景非常广泛，将极大提升AI交互的智能化水平：

A2UI的核心架构巧妙地将UI的生成与UI的执行分离开来，确保了灵活性和安全性：

1. 生成阶段：AI智能体（使用Gemini或其他LLM）生成或使用预生成的 A2UI Response，这是一个描述UI组件组成及其属性的JSON数据包。
2. 传输阶段：此消息通过特定协议（如A2A协议、AG UI等）发送到客户端应用程序。
3. 解析阶段：客户端的 A2UI渲染器 解析JSON数据。
4. 渲染阶段：渲染器将抽象组件（例如，type: 'text-field'）映射到客户端代码库中的具体实现。

目前A2UI处于v0.8的公开预览阶段，但功能已可使用。如果你想亲身体验AI生成UI的魔力，可以运行其提供的示例。

前置条件：

运行餐厅查找器Demo：

1. 克隆仓库：

git clone https://github.com/google/A2UI.git
cd A2UI

2. 设置API Key：

export GEMINI_API_KEY="your_gemini_api_key"

3. 运行智能体（后端）：

cd samples/agent/adk/restaurant_finder
uv run .

4. 运行客户端（前端）： 打开新终端窗口

# 安装并构建Lit渲染器
cd renderers/lit
npm install
npm run build

# 安装并运行shell客户端
cd ../../samples/client/lit/shell
npm install
npm run dev

对于Flutter开发者，可以关注使用A2UI的GenUI SDK。此外，CopilotKit也提供了一个公开的A2UI Widget Builder供大家尝试。

A2UI项目遵循Apache 2.0许可协议，谷歌希望与社区一起努力，共同构建AI智能UI的未来。项目的路线图包括：

如果你对未来AI与UI的融合充满热情，欢迎查阅项目的贡献指南，加入到A2UI的建设中来。

A2UI不仅仅是一个技术项目，它更是对未来人机交互模式的一次大胆探索。它打破了AI在界面生成上的壁境，让AI智能体能够更直接、更安全、更灵活地以可视化的方式与我们交互。

可以预见，随着A2UI的不断发展和完善，未来的应用开发将迎来一次颠覆性的变革。开发者或许不再需要从零开始手写繁琐的UI代码，而是专注于定义AI智能体的“意图”，让AI直接为你“画”出一切。这不仅将大幅提升开发效率，也将为用户带来前所未有的智能体验。

AI智能生成界面的时代，或许比我们想象中来得更快。

GitHub项目地址：
https://github.com/google/A2UI