首先,我们得决定智能体在规划过程中是否能接收外部反馈。没有外部反馈的情况下,智能体就像一个孤独的思考者,它依靠内部的逻辑和预设的规则来制定计划。比如,使用CoT(Chain of Thought)模型,智能体会将复杂问题分解成多个推理步骤,每一步都紧密相连,引导LLM按顺序解决问题。这就像按照食谱做菜,食谱上的每个步骤都直接对应下一步,确保了最终的菜肴能够成功完成。
还有一种是多路径推理,这就像我们在做决定时,脑海中可能会同时出现好几个选项。例如,ToT(Tree of Thoughts)模型,它将推理步骤组织成一个树状结构,每个中间步骤都可能有多个子步骤,模拟了人类在每个决策点上的多种可能性。