链载Ai

标题: 大型语言模型社会的“心智”探索沟通代理 [打印本页]

作者: 链载Ai    时间: 1 小时前
标题: 大型语言模型社会的“心智”探索沟通代理

ingFang SC", "Microsoft YaHei", sans-serif;font-size: 14px;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">“是什么神奇的技巧让我们变得聪明?其实并没有什么神奇的技巧。我们的聪明才智来自于我们极其丰富的多样性,而非任何单一的、完美的原则。”

ingFang SC", "Microsoft YaHei", sans-serif;letter-spacing: normal;text-align: start;text-wrap: wrap;">

--马文·明斯基,《心智社会》

ingFang SC", "Microsoft YaHei", sans-serif;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">1 读后感

ingFang SC", "Microsoft YaHei", sans-serif;font-size: 14px;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">以往的工作流程主要通过人与 LLM 的交互来控制。文中作者使用一个 Agent 来取代人的计划和决策,而另一个 Agent 负责执行具体的操作。通过这两者的交互,实现复杂工具,从而把人们从繁重的工作中解脱出来。为了示范这个过程,作者开发了一个股票投资机器人。同时通过实验发现并总结了 Agent 交互过程中可能出现的问题,以及相应的解决方法。

ingFang SC", "Microsoft YaHei", sans-serif;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">3 摘要

ingFang SC", "Microsoft YaHei", sans-serif;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">4 引言

ingFang SC", "Microsoft YaHei", sans-serif;font-size: 14px;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">面对现实世界任务的复杂性,通常需要多个步骤才能解决。大模型的成功很大程度上依赖于人类的投入,引导对话朝正确的方向发展。然而,制作有效的提示通常需要对特定知识领域的深刻理解和专业知识,这无疑增加了难度。那么,如何在最少的人工监督下引导对话完成任务呢?

ingFang SC", "Microsoft YaHei", sans-serif;font-size: 14px;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">作者提出了一种名为角色扮演的新型合作代理框架,以自动化沟通代理之间的合作。这种方法只需要人类的初步想法来引导对话朝着复杂的任务解决方向发展。具体来说,这种方法涉及使用角色扮演和启动提示来自主引导沟通代理完成任务。

ingFang SC", "Microsoft YaHei", sans-serif;letter-spacing: normal;text-align: start;text-wrap: wrap;background-color: rgb(255, 255, 255);">5 方法

开发了:助手 - 用户场景,在开始时给出了一个初步的想法。智能体将把这个想法概念化为一个特定的任务,并通过对话自主完成它。

5.1 角色扮演框架

任务的目标是开发一个股票交易机器人。任务涉及角色包括作为Python 程序员的 AI 助手代理和作为股票交易员的 AI 用户代理。任务说明使代理使得任务更具体化,从而能够为助手提供具体明确的任务。AI 用户和 AI 助手都有明确的任务指定,通过多轮对话,他们共同完成指定任务,直至 AI 用户确认任务完成。此外,我们还引入了批评者代理,它能够从角色扮演代理中选择建议,或向角色扮演代理提供反馈。

具体来说,是开发配备情绪分析工具的交易机器人,该工具能够监控社交媒体平台上对特定股票的正面或负面评论,并根据情绪分析结果进行交易。

5.2 启动提示

提示的主要作用在于对话的初始阶段。它由三个不同的部分组成:任务说明符提示 (PT)、AI 助手系统提示 (PA) 和 AI 用户系统提示 (PU)。AI 助手系统提示和 AI 用户系统提示在大多数情况下是对称的,包含了任务分配、角色、通信协议、终止条件,以及避免不良行为的限制或要求的相关信息。请参考图 -2 以获得具体的说明。

6 实验

6.1 常见问题

6.2 终止条件

7 附录

附录 A 中,展示了从获取股票信息到编写程序,再到进行交易的示例过程。

8 启发

以 AI 编程为例,往往是语言模型 (LM) 扮演上例中“Python 程序员”的角色,而人则是“AI 用户”的角色:提问,接收反馈,运行,并再次提问,直到问题得到解决。

在这里,我们希望 AI 能扮演“人”的角色。虽然代理模型(Agent)在语言模型 (LM) 出现后很快就成为了热门,但目前我们的大部分工作还是由人和 LM 协作完成,还有很大的优化空间:理论上,只要我们能想明白,描述清楚,所有可重复的工作都可以由 LM 完成。

在优化代理模型方面,我们的主要目标是让语言模型 (LM) 通过提示或训练,能够更好地扮演“人”的角色。过去的引导学习主要集中在聊天场景的优化上,使 LM 能够更好地与人沟通。未来,我们可能会扩大其应用范围,覆盖所有可描述的工作。






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5