链载Ai

标题: 淘宝全新图生视频大模型“淘宝法象”,助力商家降本增效 [打印本页]

作者: 链载Ai    时间: 昨天 17:24
标题: 淘宝全新图生视频大模型“淘宝法象”,助力商家降本增效

ingFang SC", system-ui, -apple-system, "system-ui", "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;visibility: visible;line-height: 1.75em;">作为一种新的商品表现形态,内容几乎存在于手淘用户动线全流程,例如信息流种草内容、搜索消费决策内容、详情页种草内容等。通过低成本、高时效的AIGC内容生成能力,能够从供给端缓解内容生产成本高的问题,通过源源不断的低成本供给倒推消费生态的建立。过去一年,我们通过在视频生成、图文联合生成、个性化文案、人设Agent等核心技术上的持续攻关,AIGC内容生成在手淘多个场景取得了规模化落地价值。本专题《淘宝的AIGC内容生成技术总结》是我们摸索出的一部分实践经验,我们将开启一段时间的内容AI专题连载,欢迎大家一起交流进步。

图片ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;visibility: visible !important;width: 114px !important;"/>

淘宝法象视频生成大模型能力介绍

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;visibility: visible;margin-top: 8px;margin-bottom: 8px;line-height: 1.75em;">

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;visibility: visible;margin-top: 8px;margin-bottom: 8px;line-height: 1.75em;">图生视频作为最贴近电商应用场景的核心视频生成模型能力,对训练数据、GPU资源、模型结构和训练策略,都有非常高的要求。我们的图生视频模型框架也紧跟行业技术的发展,经历了从UNet架构到DiT架构的演变,进行了长达一年半时间的技术探索、模型迭代和数据积累。目前,我们完成了一版效果稳定的具有电商服饰营销视频特色的图生视频大模型--淘宝法象。

ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;visibility: visible;line-height: 1.75em;">

淘宝法象图生视频模型架构


ingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;font-size: var(--articleFontsize);">技术优势:



模型特色:



业务应用:帮助巨浪外投平台降本增效。基于上述视频生成和编辑模型矩阵,支持了10+不同的素材创意类型。目前AI视频产能整体已占到视频大盘的50%+,CTR、CTCVR分别高于非AI视频70%+和50%+,月曝光PV 4.5亿次,唤端后会话内购买人数和购买金额也已占到大盘的30%和50%,GMV转化效率是非AI视频的2.7倍。


业务应用:帮助商家降门槛、提效率。我们与千牛-生意管家深度合作,推出了视频生成应用,帮助商家降低视频制作门槛和制作成本,生成适用于各类电商营销场景(商品展示、种草等)的视频,支持对各类视频元素的便捷调整,提供了方便快速的商品视频制作体验。当前基于输入平铺服饰图的视频生成产品已在生意管家上线,并开放给淘宝商家使用,其他产品能力也将于近期上线。当前生成视频的商家采纳率为40%+,可以体现为商家侧助力的巨大应用潜力。

图片
淘宝法象视频生成大模型应用场景


商家上传平铺服饰图,直接生成带有卖点讲解文案的可用于主图和种草场景的5-15s视频。此场景已在千牛-生意管家产品上线并开放给商家使用,欢迎试用。



商家上传一组实拍模特图,为每个模特图生成一个视频片段并合成长视频。同时,可生成人物场景化的内容种草视频,也可保持主图牛皮癣营销信息不动从而直接用于主图视频。此产品能力将于3月中旬在千牛-生意管家产品上线并开放给商家使用,敬请期待。


提供一张平铺服饰图和一组模特图,自动生成商品讲解文案,驱动虚拟人形象介绍该商品,虚拟人可做到讲解服饰的自动上身,同时根据模特图生成视频素材,混剪到虚拟人讲解视频中,形成素材样式丰富的商品讲解视频。


通过视频换衣(video tryon)模型,商家上传一段实拍模特视频,根据商品图生成展示新服饰的模特视频,可借此快速丰富店内其他商品的主图视频素材。




通过视频生视频(video2video)模型,帮助商家使用已有视频直接生成新视频,可调整人物动作和视频场景,生成自有版权的视频,提升视频丰富性,在不同场域投放。


通过视频换背景(video background editting)模型,帮助商家对已有视频直接替换背景,生成新场景下的营销视频,满足不同场景营销诉求的同时提升视频丰富性。



通过动作驱动的图生视频模型,复刻典型的商家拍摄模特视频的动作模板,生成可直接投放的服饰展示视频。


应用场景8:视频延展
通过视频延展(video outpainting)模型,可以帮助商家对已有视频直接生成不同尺寸的多个营销视频,满足不同应用场景下的差异化尺寸要求。


结合人脸生成、视频换衣和口唇驱动三项算法,可以帮助虚拟人讲解营销视频进行从人脸到服饰的形象多样化生成,提升虚拟人营销视频的多样性和转化效率。






欢迎光临 链载Ai (https://www.lianzai.com/) Powered by Discuz! X3.5