链载Ai

标题: 深度解读大模型最火的智能体(Agent) [打印本页]

作者: 链载Ai    时间: 昨天 10:00
标题: 深度解读大模型最火的智能体(Agent)

大模型 Copilot 和 Agent 有什么区别?

文章出来之后引起了讨论,有同学留言觉得 copilot 和 Agent 没啥区别,核心原因是认为,Copilot是传统软件使用AI 增强,这时被包裹成为copilot,另种形式 Agent 是AI系统(目前常见各种对话)包裹传统系统API,这时称为Agent。这两者没有明显区别,同样的实现逻辑。

其实这个是有误区的。

核心概念区别

Agent 和 Copilot 最核心区别在于是否能自主完成任务,并不是是否调用其他能力。类似自动驾驶里面的 L2,L3的区别。agent 也可以包在传统软件里面,是否包,还是独立的,不是这个核心区别。

AI Agent 是一种智能实体,它能够感知环境、进行决策和执行动作。AI Agent 通常具有自主性,能够根据给定的目标或任务,独立地进行规划、执行和反思。它们可以分解复杂任务,自我批评和自我反思,从错误中学习,并改善结果。AI Agent 可以被视为具有一定程度自主性和复杂推理能力的系统,它们可以在没有人类直接干预的情况下完成任务。

AI Copilot,另一方面,通常是指一个通过AI技术赋能的智能助手,它协助人类完成各种任务。AI Copilot 可能在特定领域(如编程、写作、驾驶等)提供帮助,通过与人类的交互来提高效率和创造力。AI Copilot 可能更多地依赖于人类的输入和指导,而不是完全自主地完成任务。

简而言之,AI Agent 更强调自主性和独立完成任务的能力,而 AI Copilot 更侧重于作为人类的助手,协助完成特定任务。AI Agent 可能在复杂性和自主性方面更为先进,而 AI Copilot 则更注重与人类的协作和辅助。

讲完概念,今天继续深度下 Agent 的架构,当前问题,业界典型范例给大家参考。

典型Agent 架构

下图是一个典型的 Agent 架构。


一个 Agent 里面核心几大块:

1、大模型:负责思考,给出执行,调用的参数。

2、能力库:外挂的各种能力,比如约会议,查文档都是调用另外的系统完成。

3、历史:主要是记录上下文

4、用户澄清:当前 Agent 比较难脱离人的检查确认,所以一般有这一步用户的确认和修改过程。

5、最终展示:有多种展示形式,卡片式,或者给自然语言展示结果。

接下来看下 Agent 实际的范例和当前存在的问题。

业界 Agent 范例

Copilot 有很多成功的范例,最出名的有 GitHub copilot,Microsoft office 365 copilot。大模型已经成功在编程,文案,创意等方向有不错的实践。

当前智能体 Agent 还处在比较早期的阶段,已经有一些比较明显的成果,当前有些典型的尝试:

不过总的来说特别实用的 agent 其实还没有孵化出来。

从另外一个角度思考,大模型是一个全新的领域,,从成熟度角度,可以认为:

GPU > LLM > Agent builder > Agent&Application

越是底层越成熟,也只有底层成熟了才能孵化上层的业务。因此如果要有一个比较不错的 Agent,可能需要成熟的 Agent builder。可能有又有小伙伴想知道都有哪些 Agent builder,后面找时间详解一下业界都有哪些 Agent builder各自特点是什么。

下图是 AI Stack 典型技术栈,给忘记的同学回顾:


当前Agent 存在的问题

人工智能大牛吴恩达是 Agent 的拥趸,先简单回顾吴恩Agent 四范式:


Agent大家未来肯定看好,但是 agent 当前还是存在比较多的问题,仍能需要工业界持续去改进。

传统互联网产品性能都是毫秒级,调用大模型需要等待的时间较长,一些场景下用户不愿意等待的。

纯大模型很难上线,还要套用规则或者其他一些手段补充和弥补

业务真实场景下,调用大模型成本还是很高。

没有把多个 bot组织起来,快速构建大量的智能体。吴恩达认为多agent 效果会很好,但是怎么组合调用,还没有看到很好的成果经验。

总的来说,前途是光明的,道路还是曲折的







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5