返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

LLM大模型4种微调方式,Full fine tuning,peft, prompt工程和rang,你怎么选?

[复制链接]
链载Ai 显示全部楼层 发表于 1 小时前 |阅读模式 打印 上一主题 下一主题

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;display: table;border-bottom: 2px solid rgb(15, 76, 129);color: rgb(63, 63, 63);visibility: visible;">引言

现在的大模型都是泛化模型,每个领域都知道一点,但是,又不够深入,有时回答的模棱两可,你还需要结合搜索引擎、原始论文、书籍进一步验证模型的准确性。同时,受限于模型的规模,成本,对于实时性要求较高的场景,无法很好地满足。要解决这些问题,就需要对模型做优化,常见的方案,full fine tuning,peft,RAG,Prompt engineering:
  • Full Fine-tuning(微调)是指在预训练模型上,进一步训练以适应特定任务或数据集,全量调整模型参数,提高模型性能。
  • PEFT(Prompt Engineering Fine-Tuning)通过降低模型训练规模,按照模型的输入要求,给到训练样本,调整部分参数,提高生成质量。
  • RAG(Retrieval-Augmented Generation)结合了信息检索和生成技术,一般通过向量数据库,给提示词附加上上下文内容,提升生成质量。
  • Prompt engineering(提示词工程),通过调整提示语的形式和内容,指导模型生成特定风格或内容的文本。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;border-left: 3px solid rgb(15, 76, 129);color: rgb(63, 63, 63);">调优技术及其关键实现步骤


1. 全参数微调(Full Fine-tuning)

  • 准备任务特定的标注数据集。

  • 预处理数据,使其适用于模型输入。

  • 配置模型超参数,如学习率、批量大小和训练周期。

  • 使用任务数据对模型进行训练,监控验证集上的性能以防止过拟合。

  • 在测试集上评估模型性能,使用如BLEU、ROUGE等指标。

  • 根据评估结果迭代优化模型性能。

2.PEFT(Parameter-efficient Fine-tuning)

  • 选择性地更新模型中的一小部分参数。

  • 利用如LoRA(Low-Rank Adaptation)等技术减少可训练参数的数量。

  • 保持预训练模型的大部分权重不变,只对选定参数进行更新。

  • 进行训练,重点关注更新的参数部分。

  • 评估并迭代模型以达到最佳性能。


3. 提示词工程(Prompt Engineering)

  • 设计输入提示,引导模型输出期望的响应。

  • 使用zero-shot或few-shots,根据需要提供示例。

  • 通过链式思考提示引导模型进行详细的问题解决。

  • 测试并调整提示词以提高模型的准确性和鲁棒性。


4. 检索增强生成(Retrieval Augmented Generation, RAG)

  • 构建或访问一个与应用上下文相关的外部数据源。

  • 实现检索组件,将数据转换为向量并存储在向量数据库中。

  • 结合检索到的信息和用户查询,为模型提供额外的上下文。

  • 将检索到的文档与原始查询合并,生成最终响应。

ingFang SC", Cambria, Cochin, Georgia, Times, "Times New Roman", serif;border-left: 3px solid rgb(15, 76, 129);color: rgb(63, 63, 63);">调优技术对比


适用场景

  • 全参数微调:适用于需要模型完全理解特定领域知识的场景。

  • 参数高效微调:适用于计算资源有限,但仍需模型适应特定任务的场景。

  • 提示工程:适用于快速迭代和测试不同输出格式的场景。

  • 检索增强生成:适用于需要结合外部最新数据源提供信息的场景。


实现成本

  • 全参数微调:成本较高,需要大量计算资源和时间。

  • 参数高效微调:成本较高,比全参数成本低一些,因为只更新模型的一小部分参数。

  • 提示工程:成本最低,主要涉及编写和测试提示。

  • 检索增强生成:成本中等,需要实现检索组件和处理外部数据源。


模型准确性

  • 全参数微调:通常能提供最高的准确性,因为模型完全针对任务数据进行了优化。

  • 参数高效微调:准确性接近全参数微调,但可能在某些任务上略有不足。

  • 提示工程:准确性依赖于提示的设计,可能无法完全匹敌人工微调的结果。

  • 检索增强生成:在需要最新信息的场景中准确性较高,但可能不如微调方法在特定领域的适应性强。


时效性

  • 全参数微调:更新模型以反映最新数据成本最高,最慢,需要定期重新训练。

  • 参数高效微调:可以较快地适应新数据,但仍需进行微调。

  • 提示工程:几乎零成本,可以快速适应新的输出格式或结构要求。

  • 检索增强生成:时效性最好,有一定的开发和信息维护的成本,适应动态变化的数据环境。



回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ