关于总结,LangChain提供的load_summarize_chain的解决方案有3种:[4] [6]
- Stuff:只需将所有文档“塞入”一个提示中即可,可以考虑更大的上下文窗口模型,如16k token的OpenAIgpt-3.5-turbo-1106和100k tokens的Anthropic Claude-2,一般来说,中文字符一个token,一个英文单词一个token);
- Map-reduce:在“映射”步骤中单独总结每个文档,然后将摘要“缩减”为最终摘要;
- Refine:通过根据第一个文档生成初始总结,然后循环其余文档以完善其总结来折叠文档。这是顺序操作的,因此不能并行化。