返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

(AI启动器)Hunyuan-DiT:三年磨一剑,腾讯万亿混元大模型,开源!(附整合包)

[复制链接]
链载Ai 显示全部楼层 发表于 1 小时前 |阅读模式 打印 上一主题 下一主题

Hunyuan-DiT是腾讯出品的,支持中英双语提示词、具有细粒度中文理解的高性能多分辨率 Diffusion Transformer 模型。

中文提示词

首个中文提示词比英文提示词强的开源AI绘图模型!

您可以使用类似于自然语言文本的简单提示

画一只穿着西装的猪

画一头穿西装的猪

生成一幅画,赛博朋克风,跑车

生成一幅画,赛博朋克风格,跑车

或多回合语言交互以创建图片。

画一个木制的鸟

画一只木鸟

变成玻璃的

变成玻璃

(无需翻译,直接输入中文提示词即可)

多轮对话Text2Image 生成

理解自然语言指令并与用户进行多轮交互非常重要 文本到图像系统。它可以帮助构建一个动态和迭代的创建过程,将用户的想法变为现实 一步一步。

多次对话,理解需求生成和改进图片:

作为国产大模型,古诗词、俚语、传统建筑、中华美食等中国元素的生成上表现出色:

Hunyuan-DiT简介

一种非常先进的技术,就像一个会画画的翻译器,它能够理解你说的话,然后用画来表达出来,而且画得还特别棒。

? 比较

为了全面比较浑源DiT等模型的生成能力,腾讯构建了一个4维测试集,包括文本-图像一致性、排除AI伪影、主体清晰度、美学。超过50名专业评估员进行评估。

? 可视化

  • 中国元素

  • 长文本输入

? 版本和显卡要求

此处腾讯放出了2个版本:

DialogGen(提示增强模型)和 Hunyuan-DiT(文本到图像模型)。

由于“提示增强模型”需要32G的显存,大部分非专业级用户显卡无法达标,所以AI启动器暂时只提供非增强版本。专业级显卡用户可联系作者获取增强版本。

部分专业卡打游戏有点垃,但是跑AI很强,4090目前打游戏跑AI都很强,但是显存不足。有粉丝吐槽部分专业卡都能买辆小车了,后续时机成熟,作者将出一期显卡推荐文章。

一键运行

AI启动器,简介:

上百个开源项目,一键运行!零基础上手Ai


找到Hunyuan-DiT项目,下载完成后点击启动:

(运行界面)

小结

腾讯混元决定全面开源他们的文生图模型,有助于更多的开发者和创作者参与进来,一起探索、共创基于 DiT 架构的视觉生成生态,更好地去验证、挖掘这个技术架构的潜力。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ