链载Ai

标题: 大模型的发展历史及简要介绍 [打印本页]

作者: 链载Ai    时间: 昨天 11:58
标题: 大模型的发展历史及简要介绍

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 1.2em;font-weight: bold;display: table;margin-right: auto;margin-bottom: 2em;margin-left: auto;padding-right: 0.2em;padding-left: 0.2em;background: rgb(15, 76, 129);color: rgb(255, 255, 255);">前言

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">本章内容,我们将简要介绍大模型,其中的内容包含大模型的发展历史、大模型的特点、大模型底层架构Transformer的简单了解以及最后对于人工智能的思考。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 1.2em;font-weight: bold;display: table;margin: 4em auto 2em;padding-right: 0.2em;padding-left: 0.2em;background: rgb(15, 76, 129);color: rgb(255, 255, 255);">人工发展历史

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 1.1em;font-weight: bold;margin-top: 2em;margin-right: 8px;margin-bottom: 0.75em;padding-left: 8px;border-left: 3px solid rgb(15, 76, 129);color: rgb(63, 63, 63);">早期探索阶段(1940s-1950s)

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">人工智能的概念开始形成,早期的计算机科学家和数学家探索机器是否能够模拟人类智能。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">重要事件:1956年,达特茅斯会议上首次提出“人工智能(Artificial Intelligence,简称AI)”这一概念,标志着人工智能学科的诞生。随后,人工智能领域取得了一系列令人瞩目的研究成果,如字符识别程序、学习功能的跳棋程序等,掀起了人工智能发展的第一个高潮

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;font-size: 1.1em;font-weight: bold;margin-top: 2em;margin-right: 8px;margin-bottom: 0.75em;padding-left: 8px;border-left: 3px solid rgb(15, 76, 129);color: rgb(63, 63, 63);">符号主义(1950s-1970s)

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">这一阶段的AI主要依靠符号处理和规则引擎,强调逻辑推理。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;margin: 1.5em 8px;letter-spacing: 0.1em;color: rgb(63, 63, 63);">关键技术

知识工程和专家系统(1970s-1980s)

随着计算能力的提升,专家系统开始流行,旨在模拟人类专家的决策过程。

关键事件:人工智能从理论研究走向实际应用,专家系统开始广泛应用于医疗、化学、地质等领域,实现了人工智能从一般推理策略探讨转向运用专门知识的重大突破,推动了人工智能应用发展的新高潮。

AI寒冬(1980s-1990s)

由于期望过高和技术限制,资金和研究兴趣减少,导致AI研究陷入低谷。

重要事件:随着人工智能应用规模的扩大,专家系统存在的问题逐渐暴露,如应用领域狭窄、缺乏常识性知识、知识获取困难等,导致人工智能的发展再次陷入低迷。‌

机器学习和数据驱动的AI(1990s-2010s)

随着计算能力和数据量的增加,机器学习(尤其是统计学习)开始兴起。

关键技术

深度学习的崛起(2010s-至今)

深度学习技术的突破使得AI在多个领域取得显著进展。

关键技术

关键事件: 2012年,AlexNet模型的提出,标志着深度学习在计算机视觉领域的突破。2018年,BERT模型的提出,开启了自然语言处理领域的大模型时代。

大模型/通用人工智能(AGI)的探索(2020s-至今)

随着Transformer架构的横空出世,大模型技术取得迅猛的发展。

关键事件: 2022年11月30日,ChatGPT3.5发布。

关键技术

大模型简介

大模型通常指的是具有大量参数(具有数亿到数千亿参数的深度学习模型)的深度学习模型,这些模型在处理复杂任务时展现出显著的性能提升。

"大"模型层数

大模型的encoder或decoder的层数通常在几十层到几千层不等。

“大”参数数量

大模型通常具有数亿到数千亿个参数。例如:阿里巴巴推出的最新大模型Qwen2-72B,其参数量为72B,即 72 billion(720亿)个参数。

"大"算力需求

大模型对算力和显存的要求也非常高,一般情况下:

"大"数据规模

大型语言模型通常使用数十亿到数万亿个 token 进行训练。例如,GPT-3 使用了约 570 亿个 token 的数据集。

与红楼梦的比较: 红楼梦 约80万字,如果我们将其视为800,000 tokens

这意味着,使用 570亿个 token 的大模型相当于约 712,500 本红楼梦。

"大"电力需求

大模型的训练,特别是涉及大量参数的模型,需要巨大的算力支持,这直接导致了大量的电力需求。

例如,训练Open AI的GPT-3模型耗电量约为1.287吉瓦时,这相当于120个美国家庭一年的用电量。

AIGC生成式人工智能应用

大模型一般是通俗的叫法,其学术术语一般叫生成式人工智能(AIGC),其目前的应用场景有:

人工智能类型

在人工智能的类型中,判别式模型和生成式模型是两种不同的建模思想。判别式

生成式

判别式模型专注于类别之间的边界,适合分类任务;而生成式模型则关注数据的生成过程,是一种发明创造的过程。

思考

人类自从工业革命至今,历经三次革命:

那么,此时被誉为第四次工业革命的人工智能,它会怎样改变我们的生产和生活呢






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5