万不得已，不要对 LLM 进行微调？

显示全部楼层

文章内容总结

文章《Fine-Tuning LLMs Is a Huge Waste》认为微调LLM并非必要，强调其风险。文章指出，微调不是知识注入，而是对现有知识的破坏性覆盖，可能导致神经模式的意外改变。例如，基础模型生成80%男性、20%女性的客户分布，微调后可能变为近100%女性，显示输出偏置显著变化（文章中提及的Figure 6）。文章建议，对于90%的用例，微调被错误用于知识注入，带来灾难性、不可见的损害。替代方法包括RAG、适配器模块、LoRA和提示工程，这些方法能注入新信息而不损害模型。

Hacker News 的精彩讨论

支持微调

反对微调

目的

特定任务优化（如医疗、方言输出）

风险覆盖现有知识，不适合知识注入

性能

Medgemma基于Gemma 3 4b在医疗数据上微调，表现优于基础模型

Medgemma 的预训练阶段

才是关键

成本与效率

使用较小模型微调节省成本，替代大型模型

成本高，需频繁重新调整，资源浪费

替代方案

接受部分泛化不相关领域的牺牲

推荐RAG、LoRA等，安全高效，无破坏性

关于LORA

妥妥的就是微调，完全可以合并到原始权重中。

虽然和微调功能类似，但 LoRA 可以独立存放，模块化应用，保持原始模型的输出能力。

最后完整的总结

关于大语言模型（LLM）是否需要微调，存在争议。微调可以优化模型在特定任务上的表现，例如医疗诊断，但也可能导致“灾难性遗忘”，即模型失去原有知识。替代方法如检索增强生成（RAG）和低秩适应（LoRA）被认为更安全且成本更低。

所以，大模型高级应用开发（对于初级提示词开发），就是三板斧：

RAG 增强知识
LoRA 微调训练特殊技能，解决特定任务
MCP & Agent 使用外部工具