
1、统一动态3D高斯场模型
PortraitGen通过建立一个统一的动态3D高斯场,使视频帧之间在结构和时间上保持一致性。每一帧的肖像通过3D高斯分布来表示,其中高斯分布的中心、方差和旋转等参数都是可学习的,这使得模型可以精确地控制视频中人物的三维形态变化。
2、神经高斯纹理机制
这一机制是PortraitGen的核心创新之一,它通过在3D高斯场上叠加一层神经纹理来增强编辑的表达力和风格多样性。
3.、多模态输入的融合
项目支持多种输入模式,如文本指令、图像样本和照明条件等,这些输入通过不同的网络模块处理后,融入到高斯纹理特征中,从而实现基于多种指令的视频编辑。