返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

吴恩达老师 AI 代理工作流程的四种设计模式之一:反思

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 21:18 |阅读模式 打印 上一主题 下一主题

上周,我描述了 AI 代理工作流程的四种设计模式,我相信它们将在今年推动重大进展:反思、工具使用、规划和多智能体协作。代理工作流不是直接LLM生成最终输出,而是多次提示,LLM使其有机会逐步构建更高质量的输出。在这封信中,我想讨论一下反思。对于实现速度相对较快的设计模式,我已经看到它带来了令人惊讶的性能提升。

你可能有过这样的经历:提示 ChatGPT/Claude/Gemini,收到不满意的输出,提供关键反馈以帮助LLM改善其响应,然后得到更好的响应。如果您自动执行提供关键反馈的步骤,以便模型自动批评自己的输出并改进其响应,会怎么样?这是反思的关键所在。
以要求一个LLM 编写代码为任务。我们可以提示它直接生成所需的代码来执行一些任务 X。之后,我们可以提示它反思自己的输出,可能如下:

下面是用于任务 X 的代码:[以前生成的代码]

仔细检查代码的正确性、风格和效率,并就如何改进它提出建设性的批评。

有时这会导致LLM发现问题并提出建设性的建议。接下来,我们可以提示上下文,LLM包括 (i) 先前生成的代码和 (ii) 建设性反馈,以及 (iii) 要求它使用反馈重写代码。这可以带来更好的响应。重复批评/重写过程可能会产生进一步的改进。这种自我反思过程允许发现LLM差距并改进其在各种任务上的输出,包括生成代码、编写文本和回答问题。

我们可以通过提供有助于评估其产出LLM的工具来超越自我反省;例如,通过一些单元测试运行其代码,以检查它是否在测试用例上生成正确的结果,或者搜索 Web 以仔细检查文本输出。然后,它可以反思发现的任何错误并提出改进的想法。

此外,我们可以使用多智能体框架实现 Reflection。我发现创建两个不同的智能体很方便,一个提示生成良好的输出,另一个提示对第一个智能体的输出提出建设性的批评。由此产生的两个代理之间的讨论导致了改进的响应。

反思是一种相对基本的代理工作流类型,但我很高兴它在一些情况下改善了我的应用程序的结果。我希望你能在自己的工作中尝试一下。如果你有兴趣了解更多关于反思的知识,我推荐这些论文:

  • “自我细化:自我反馈的迭代细化”,Madaan 等人,2023年

  • “反思:具有言语强化学习的语言代理”,Shinn 等人,2023年

  • “批评家:大型语言模型可以通过工具交互式批评进行自我纠正”,Gou 等人,2024 年

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ