返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

一文彻底搞懂大模型 - 人工神经网络与贝叶斯网络

[复制链接]
链载Ai 显示全部楼层 发表于 12 小时前 |阅读模式 打印 上一主题 下一主题
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.034em;">ANN History
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);">大模型,特别是那些ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);">拥有数十亿甚至更多参数的深度学习模型ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);">,往往是以ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);">人工神经网络ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);">为基础的。这些模型通过ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);">堆叠多个隐藏层、增加神经元数量和使用复杂的非线性激活函数ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: var(--articleFontsize);">,来构建能够处理复杂任务(如自然语言处理、图像识别等)的深度神经网络。
ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.034em;">大语言模型

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;visibility: visible;">一、大模型与人工神经网络的关系

什么是人工神经网络(ANN)?人工神经网络(ANN)是一种模仿生物神经网络结构和功能的计算模型。它由多个层组成,包括输入层、隐藏层(可能有多层)和输出层。每一层都包含多个神经元(或称为节点),这些神经元通过带权重的连接相互连接。
ANN
输入层接收外部数据,隐藏层对数据进行处理,输出层则产生最终的输出。神经元的激活通常通过一个非线性函数(如sigmoid、ReLU等)来实现,这使得网络能够学习复杂的非线性关系。

ANN
大模型与人工神经网络的关系:LLM的核心是ANN(人工神经网络),基于人工神经网络构建更大规模和复杂度更高的深度学习模型。
  1. PLM(预训练模型):预训练语言模型通常使用互联网上的海量文本数据作为训练语料,这些语料库可能包含数十亿甚至数千亿个单词。这些模型通过在大量的未标注文本数据上进行学习,掌握了语言的共性和规律,进而能够应用于各种NLP下游任务。

  2. 数据 + 算力:算力作基础,数据为驱动;无监督预训练(Pre-training),有监督微调(Fine-tuning)。

  3. 权重w和偏置b:模型参数包括每一层的权重(weight)和偏置项(bias)。这些参数在训练过程中通过反向传播算法进行调整,以最小化损失函数。

LLM 》DL ANN

二、人工神经网络与贝叶斯网络的关系

什么是贝叶斯网络(BN)?贝叶斯网络(Bayesian Network,简称BN)是一种基于概率推理的图形模型,用于表示变量之间的依赖关系。它由一个有向无环图(Directed Acyclic Graph,DAG)和条件概率表(Conditional Probability Table,CPT)组成。
Bayesian Network
  • 有向无环图(DAG):用于表示变量之间的依赖关系。图中的节点代表变量,有向边(或称为弧)则表示变量之间的依赖关系。如果两个节点之间存在有向边,则意味着一个节点的状态会影响另一个节点的状态。

  • 条件概率表(CPT):与DAG中的每个节点相关联,用于描述节点与其父节点之间的概率关系。条件概率表详细列出了在给定父节点状态下,当前节点取各个可能值的概率。

Bayesian Network

人工神经网络与贝叶斯网络的关系两者都是有向图模型,其中每个节点的取值或状态仅依赖于其直接前驱节点,即遵循马尔可夫假设。这种结构使得模型能够清晰地表示变量之间的依赖关系。
ANN vsBayesian Network
  • 有向图模型:一种使用有向图来表示变量之间关系的数学模型。在有向图中,节点代表变量,而有向边则代表变量之间的依赖关系。

Direction Graph

  • 马尔可夫假设:一种简化模型复杂性的假设,它指出一个节点的状态(或取值)仅依赖于其直接前驱节点的状态(或取值),而与更前面的节点状态无关。

Markov Chain

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ