链载Ai

标题: 一口气讲清楚:向量库、训练集、多模态 [打印本页]

作者: 链载Ai    时间: 2 小时前
标题: 一口气讲清楚:向量库、训练集、多模态

这是“一口气讲清楚”AI系列第三篇文章。

前面两篇文章,分别介绍了AGI、RAG、AIGC、LLM、MCP、EMB这六个在AI大模型领域的核心术语。想要真正了解AI大模型及各种工具的特点和原理,离不开这六个专业术语。

但如果想要进一步深入理解大模型的实现原理和当前阶段的大模型特性,就需要进一步了解它的训练过程,那这个时候就离不开这三个专业术语:向量库、训练集、多模态。

这篇文章,我会尽量用通俗易懂的语言,讲清楚这三个术语的含义,它的作用和背后的技术原理,帮助大家更好地理解AI。


一、向量库:Vector Database

向量库(Vector Database)是一种专门用于存储、管理和检索向量数据的数据库系统

在人工智能领域,向量的定义通常指通过模型(如BERT、ResNet)将文本、图像、音频等非结构化数据转换为高维数值表示(例如由数百或数千个数值组成的序列)。这种转换称为嵌入(即前面提到的EMB),旨在捕捉数据的语义或特征信息。

你可以理解为,向量化的过程类似于大数据领域的数据清洗,核心有两点:统一数据格式、统一存储

例如:一段文本内容“可爱的猫咪”经过嵌入处理后,可能变成类似“[0.2, -1.3, 0.8, ..., 0.5]”的向量。而向量库的核心功能就是通过数学方法快速找到与用户输入的提示词(也称之为查询向量)相似的存储于向量库中的向量。

这里的快速检索相似向量的方法,类似于传统数据库中的索引功能

1、向量库的核心特性

2、向量库的核心作用

3、向量库的使用场景

假设你要在电商平台搜索男士运动鞋,上传了一张自己鞋子的照片进行搜索,下面是AI搜索并返回结果的过程:

4、向量库的主流工具选型

工具选型的关键在于,支持的数据规模大小、数据检索时延(RT)、向量库的运维管理成本


二、训练集:Training Set

训练集(Training Set)是机器学习中用于训练模型的数据集合,包含输入样本及对应的输出标签(特指监督学习)

核心作用是让模型通过学习集合中的输入特征与目标变量之间的关联规律,不断调整模型本身的参数,进而做出预测(大模型是一个概率预测机器,通过解析用户输入内容,进行向量化,然后在向量库进行相似性检索,最终输出用户可能需要的答案)。

一句话概括:让模型通过大量数据训练,掌握数据关联逻辑,然后做出决策

1、训练集的核心特点

2、训练集的核心作用

3、训练集的典型应用场景

我们所熟知的智能驾驶、图片分类、短视频推荐、文生内容(包含文生文、图、视频)等领域的大模型都经过了大量高质量数据的长期训练,才能具备现在的能力。

4、构建数据集的注意事项

一句话总结训练集核心:训练集的数据质量直接决定大模型的输出准确性,高质量数据的重要性可见一斑。这也是前两年各大图书馆的电子数据和专业实验室的数据被各个AI公司高价购买的原因。


三、多模态:Multimodal

多模态(Multimodal)指的是系统能同时处理和理解不同来源或类型的数据(文本、图像、音频、视频、传感器数据)的能力

多模态技术的核心目标,是通过跨模态的关联与融合,模拟人类通过多种感官(视觉、听觉、触觉等)感知世界的方式,从而实现对复杂信息的全面理解与交互。

比如人与人沟通时,会通过语言、眼神、肢体动作和表情甚至借助其他工具来尽可能让对方理解自己的想法。而多模态的目的就是希望让工具/机器具备类似的能力,综合多种输入形式作出更准确的决策

1、多模态技术的主要特点

2、多模态技术的核心作用

3、通俗易懂的实例说明

假设你通过手机拍摄衣橱中的衣服并提问:“明天去郊游,如何搭配”?拥有多模态能力的AI助手会这样思考并回答你:

4、多模态技术的应用场景


关于AI大模型的专业术语,暂时先介绍到这里。在后续的文章中,我会用通俗易懂的语言为大家介绍Manus的技术架构、AI Agent的发展和工程迭代历史,敬请期待。







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5