返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

有点东西!Qwen开源会写中文的生图模型Qwen-Image

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 21:54 |阅读模式 打印 上一主题 下一主题

会写中文,这基本上是开源图片生成模型的独一份了。

这次开源的Qwen-Image 的最大卖点是“像素级文字生成”。它能直接在像素空间内完成排版:从小字注脚到整版海报均可清晰呈现,且同时支持英文字母与汉字。

以下图片均来自官网的生成演示。

388978ba-a564-46c5-ba8b-daf3ac3144f7.png

官方在技术博客中称,它专为复杂文字渲染与精准图像编辑而生,将生成与编辑两条链路纳入统一架构,意在向开发者与设计师提供“一站式视觉创作底座” 。

9b170227-a883-4b06-b29e-95475ece8d99.png

基准显示,在 LongText-Bench、ChineseWord 等评测里,英文渲染可比肩 GPT-4o,中文更是当前开源最佳,不管是人物风景还是字体色彩,整体上都饱和度非常的高,比较的悦目。

2c4dbf5d-959d-47a8-9eb2-d67cfe2efb67.png

海报、招贴、信息图等场景下文字边缘锐利、排版稳定,很少会出现叠图层常见的错位或锯齿问题。

6db3dd38-2a02-4678-a083-3b791de7eb43.png

在图像能力上,模型仍保持全能属性。得益于扩散-Transformer 结构与多任务训练,它可在写实、印象派、二次元、极简等风格间自由切换。

2f95ba31-ce68-4657-9d43-c86008881558.png

宽高比与分辨率设定灵活,可覆盖社媒封面、竖屏短视频首图乃至 4K 宽幅海报,很适合于作为自媒体宣传材料使用。

里面最值得提的就是它的丰富的“正向/负向提示词魔法”,进一步降低了非专业用户的上手门槛,基本上不需要特别复杂的提示词就可以生成比较精美的图片。

8c9c6779-03aa-446f-bd48-892fa3b8f944.png

除了生成,Qwen-Image 还原生集成了精准编辑工具链:支持文字替换、物体增删、风格迁移、姿态调整和超分辨率放大。

简单在其官网试用了一下,整体的风格和效果还不错,主体艺术是没有什么问题,字体都比较的锐利清晰,但如果是遇到小字,可能会产生变形无法辨认。

438b781c-6b5c-4509-a3c9-d7eda63aed67.png

目前模型采用 Apache-2.0 许可证发布,权重已同步上传至 Hugging Face 与 ModelScope,并在 GitHub 提供示例脚本。

部署要求方面,Qwen官方建议使用 transformers≥4.51.3 与 diffusers 最新版,一张 40 GB 显存的 GPU 即可跑通推理;若想微调,可按需求水平扩展多卡或使用 A100 80 GB 以上设备

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ