链载Ai

标题: 聊聊SORA背后技术之一(三):VAE [打印本页]

作者: 链载Ai    时间: 昨天 09:30
标题: 聊聊SORA背后技术之一(三):VAE

技术总结专栏



本文将对热门的SORA视频生成中使用到的模型VAE进行原理介绍。

变分自编码器(Variational AutoEncoder,VAE)是一种结合了自编码器和概率图模型的思想的生成模型。它通过学习数据的潜在分布,可以生成新的数据样本。常常听到的潜层语义特征,就是靠VAE才能实现。

论文地址:https://arxiv.org/abs/1312.6114

项目地址:https://github.com/AntixK/PyTorch-VAE(非官方)


核心思想

这部分比较偏向数学原理,不感兴趣的同学可以直接跳过~



整体结构

上图为VAE的整体结构,主要可以分为encoder端和decoder端。





总结

VAE的优点包括:


VAE的缺点包括:







欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5