|
Hunyuan-DiT是腾讯出品的,支持中英双语提示词、具有细粒度中文理解的高性能多分辨率 Diffusion Transformer 模型。 中文提示词首个中文提示词比英文提示词强的开源AI绘图模型! 
您可以使用类似于自然语言文本的简单提示 画一只穿着西装的猪 画一头穿西装的猪 生成一幅画,赛博朋克风,跑车 生成一幅画,赛博朋克风格,跑车
或多回合语言交互以创建图片。 画一个木制的鸟 画一只木鸟 变成玻璃的 变成玻璃
(无需翻译,直接输入中文提示词即可) 多轮对话Text2Image 生成理解自然语言指令并与用户进行多轮交互非常重要 文本到图像系统。它可以帮助构建一个动态和迭代的创建过程,将用户的想法变为现实 一步一步。 多次对话,理解需求生成和改进图片: 
作为国产大模型,古诗词、俚语、传统建筑、中华美食等中国元素的生成上表现出色: 
Hunyuan-DiT简介一种非常先进的技术,就像一个会画画的翻译器,它能够理解你说的话,然后用画来表达出来,而且画得还特别棒。 ? 比较为了全面比较浑源DiT等模型的生成能力,腾讯构建了一个4维测试集,包括文本-图像一致性、排除AI伪影、主体清晰度、美学。超过50名专业评估员进行评估。 


? 可视化


? 版本和显卡要求此处腾讯放出了2个版本: DialogGen(提示增强模型)和 Hunyuan-DiT(文本到图像模型)。 
由于“提示增强模型”需要32G的显存,大部分非专业级用户显卡无法达标,所以AI启动器暂时只提供非增强版本。专业级显卡用户可联系作者获取增强版本。 部分专业卡打游戏有点垃,但是跑AI很强,4090目前打游戏跑AI都很强,但是显存不足。有粉丝吐槽部分专业卡都能买辆小车了 ,后续时机成熟,作者将出一期显卡推荐文章。 一键运行AI启动器,简介: 上百个开源项目,一键运行!零基础上手Ai

找到Hunyuan-DiT项目,下载完成后点击启动:

(运行界面) 小结腾讯混元决定全面开源他们的文生图模型,有助于更多的开发者和创作者参与进来,一起探索、共创基于 DiT 架构的视觉生成生态,更好地去验证、挖掘这个技术架构的潜力。 |