ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;display: table;border-bottom: 2px solid rgb(15, 76, 129);color: rgb(63, 63, 63);visibility: visible;">引言现在的大模型都是泛化模型,每个领域都知道一点,但是,又不够深入,有时回答的模棱两可,你还需要结合搜索引擎、原始论文、书籍进一步验证模型的准确性。同时,受限于模型的规模,成本,对于实时性要求较高的场景,无法很好地满足。要解决这些问题,就需要对模型做优化,常见的方案,full fine tuning,peft,RAG,Prompt engineering:- Full Fine-tuning(微调)是指在预训练模型上,进一步训练以适应特定任务或数据集,全量调整模型参数,提高模型性能。
- PEFT(Prompt
Engineering Fine-Tuning)通过降低模型训练规模,按照模型的输入要求,给到训练样本,调整部分参数,提高生成质量。
- RAG(Retrieval-Augmented Generation)结合了信息检索和生成技术,一般通过向量数据库,给提示词附加上上下文内容,提升生成质量。
- Prompt
engineering(提示词工程),通过调整提示语的形式和内容,指导模型生成特定风格或内容的文本。
ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;border-left: 3px solid rgb(15, 76, 129);color: rgb(63, 63, 63);">调优技术及其关键实现步骤
1. 全参数微调(Full Fine-tuning)2.PEFT(Parameter-efficient Fine-tuning)
3. 提示词工程(Prompt Engineering)
4. 检索增强生成(Retrieval Augmented Generation, RAG)ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;border-left: 3px solid rgb(15, 76, 129);color: rgb(63, 63, 63);">调优技术对比
适用场景全参数微调:适用于需要模型完全理解特定领域知识的场景。 参数高效微调:适用于计算资源有限,但仍需模型适应特定任务的场景。 提示工程:适用于快速迭代和测试不同输出格式的场景。 检索增强生成:适用于需要结合外部最新数据源提供信息的场景。
实现成本
模型准确性全参数微调:通常能提供最高的准确性,因为模型完全针对任务数据进行了优化。 参数高效微调:准确性接近全参数微调,但可能在某些任务上略有不足。 提示工程:准确性依赖于提示的设计,可能无法完全匹敌人工微调的结果。 检索增强生成:在需要最新信息的场景中准确性较高,但可能不如微调方法在特定领域的适应性强。
时效性全参数微调:更新模型以反映最新数据成本最高,最慢,需要定期重新训练。 参数高效微调:可以较快地适应新数据,但仍需进行微调。 提示工程:几乎零成本,可以快速适应新的输出格式或结构要求。 检索增强生成:时效性最好,有一定的开发和信息维护的成本,适应动态变化的数据环境。
|