链载Ai

标题: 大语言模型,从基础认知开始 [打印本页]

作者: 链载Ai    时间: 前天 17:32
标题: 大语言模型,从基础认知开始


1.概念

先看下大语言模型的回答?

大语言模型是什么?

大语言模型,Large Language Model。

2. 本质

大语言模型的本质,我们可以简单理解为文字接龙游戏,不断地执行 NTP(Next Token Prediction)。用户输入一段文字,大语言模型基于概率预测下一个字(token)并输出,如此反复,直到遇见终止符。

文字接龙

既然是基于概率预测,那每次预测都是取概率最高的那一个嘛?语言是一门艺术,不是一门科学。

文字接龙

图片引用:《大模型应用开发极简入门:基于GPT-4和ChatGPT》

我们通过一个「生成句子补全」的示例(初始句子为"我爱__"),结合不同策略的执行过程,解释几种常见策略的特点(示例中概率值为虚构的简化数据)

  1. 贪婪搜索(Greedy):总选概率最高的token,结果确定但可能单调。

    参数配置:无额外参数,直接选最高概率

    执行过程:







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5