链载Ai

标题: 为什么大语言模型会产生幻觉?如何解决大语言模型幻觉问题? [打印本页]

作者: 链载Ai    时间: 2 小时前
标题: 为什么大语言模型会产生幻觉?如何解决大语言模型幻觉问题?

随着ChatGPT 的兴起,大语言模型再次被提及,越来越多的行业开始探索,如导购、政府、教育、医疗等行业;

大语言模型的突破,展现出了类人的通用智能“涌现”能力,能够学习多个领域的知识、处理多种任务,因此被称为通用大模型,通用大语言模型具备特点也具备不足,大模型特点主要参数模型大、泛化能力强、支持多模态,如 GPT、豆包、通义等在语言交互场景回答问题表现出色。虽然大语言模型在多个指标展现的能力可能超出人类,但大语言模型也存在诸多不足:

01

为什么大语言模型产生幻觉问题?

什么是大模型幻觉:在大语言模型中幻觉表示模型输出了内容,但是内容是虚假文本,容易导致一些错误发生。

让模型产生幻觉的原因可能是:

因此通用大模型以发展通识为目标,更侧重泛化性,在专业性方面很难满足具体行业的特定需求,存在“有幻觉”等情况。

通用大模型在toB垂直领域,由于缺乏细分专业知识,所以更容易产生幻觉。每一个客户都有自己独特的数据、业务、流程等,因此需要训练行业大模型,紧密结合业务系统实现可落地的智能应用。客户针对行业大模型加上自己的数据进行训练和微调,才能大打造出适合企业智能服务。



02

如何解决大语言模型幻觉问题?

在解决大语言模型幻觉构建行业大模型的过程中,由于需求和目标不同,目前有四种方式提示词工程、检索增强生成、微调、预训练。

1、引导:提示工程

提示工程(prompt engineering) 指通过针对性的设计提示词(prompt)来引导大模型产生出特定应用场景所需要的输出。
大语言模型的相应质量取决于用户提供的提示和指令,我们与大模型互动给予其指令显著影响其生成答案的质量。
提示工程啥上手相对简单,不需要批量采集数据以及构建数据集,更不需要调整或训练模型本身。因此在在企业构建行业大模型的落地中,解决模型幻觉问题,可以采用这种方式来探索进行快速落地。
提示工程适用于快速探索应用的场景,如文案创作、对话系统等,优化提示词可以显著提升生成内容的质量。

2、外挂:检索增强生成

增强增强生产(RAG,retrieval - Augmented Generation) 指在不改变大模型本身的基础上,通过外挂知识库等方式,为模型提供特定领域的数据信息输入,实现对特定领域更加精准的信息检索和生产。
主要优点:
RAG的核心能力是检索和生成。基本的流程是将私有化知识进行切片并进行向量化,回答问题时,当用户提出出一个问题,RAG对问题进行向量化,利用向量检索私有数据,找到问题的相关信息,再结合提示词将问题和检索到的信息作为上下文输入到通用大模型,模型接收到这个强提示后,将自己的内部知识综合,最后生成更准确的内容。
检索增强生成适用于需要引用大量知识的场景,如问答系统、专业咨询等,生成内容准确性高,并且保证了自有数据所有权。

3、优化:微调

微调(FT,Fine - tuning)是在已经预训练的大模型基础上,基于特定数据集进一步调整大模型的部分参数,使大模型更好地适应业务场景、准确完成特定任务。微调目前是较为常用的行业大模型构建方法。
微调适用于特定行业领域对大模型有更好性能要求的场景,在实际的行业应用中,当通用大语言模型无法理解或生成专业的行业内容时,可以通过微调的方式,提升大模型理解行业特定术语和正确应用行业知识的能力,确保大语言模型的输出符合特定行业或业务诉求。
微调后的通用大模型不仅保留了原有的通用知识,还会将行业知识内化到大模型参数中,较为准确的理解和使用行业知识,更好地适应特定行业的场景,提供更加贴合实际需求的解决方案。
微调适用于系统通过大模型在行业应用场景表现的更好的场景,具备较好的行业泛化能力。

4、原生:预训练

预训练适用于现有通用大模型差异比较大的场景,以及通过提示词、检索增强生成、微调无法达到需求标准时,构建一个专门为特定行业的大模型。
预训练的方式需要收集并标注大量的行业特定数据集,涵盖文本、图像、交互记录等,以及特殊格式数据。在训练过程中,模型通常采用从底层参数开始训练,或者基于具备一定能力的通用模型进行后训练(二次增训,post-training),目的是大模型更好地理解特定领域的知识、术语,提供大模型在行业应用中的准确性,确保领域的专业性。
预训练的方式一般需要投入较大的成本,需要大量的计算资源和长期的训练过程,一般较少使用这种方式。
预训练适用于通用大模型缺乏目标任务相关的知识和能力的场景,专业性高能够准确理解并执行特定任务。


03‍

典型案例‍‍‍‍‍‍‍‍‍‍‍‍‍‍

在具体的落地中,通常不会只使用一种方式,而是组合使用以实现最佳效果,如在目前构建的智能客服问答系统中会综合使用提示词工程、检索增强生成和微调等方式。
大模型结合RAG(检索增强生成)构建的客服系统结合多种方式提升RAG的问答准确率。
提示工程(Prompt Engineering):






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5