摘要:8 月 19 日消息,版本。Qwen-Image-Edit 基于 20B 的 Qwen-Image 模型进⼀步训练,成功将 Qwen-Image 的独特的文本渲染能力延展至图像编辑领域,实现了对图片中文字...
8 月 19 日消息,版本。
Qwen-Image-Edit 基于 20B 的 Qwen-Image 模型进⼀步训练,成功将 Qwen-Image 的独特的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。
此外,Qwen-Image-Edit 将输⼊图像同时输⼊到 Qwen2.5-VL(实现视觉语义控制)和 VAE Encoder(实现视觉外观控制),从而兼具语义与外观的双重编辑能力。用户可以访问 Qwen Chat (chat.qwen.ai)并选择“图像编辑”功能进行体验。
Qwen-Image-Edit 的主要特性包括:
- 语义与外观双重编辑:Qwen-Image-Edit 不仅⽀持 low-level 的视觉外观编辑(如元素的添加、删除、修改等,要求图片其他区域完全不变),也支持 high-level 的视觉语义编辑(如 IP 创作、物体旋转、风格迁移等,允许整体像素变化但保持语义一致)。
- 精准文字编辑:Qwen-Image-Edit 支持中英文双语文字编辑,可在保留原有字体、字号、风格的前提下,直接对图片中的文字进行增、删、改等操作。
- 强大的基准性能:在多个公开基准测试中的评估表明,Qwen-Image-Edit 在图像编辑任务上具备 SOTA 性能,是一个强大的图像编辑基础模型。
Qwen-Image-Edit 的一大亮点在于其语义与外观双重编辑能力。所谓语义编辑,是指在保持原始图像视觉语义不变的前提下,对图像内容进行修改。
应用场景:从创意设计到商业落地
Qwen-Image-Edit 的多功能特性使其适用于多种场景,包括但不限于:
- 海报与广告设计:生成具有视觉冲击力的宣传海报,支持复杂文本排版和风格迁移。
- IP 内容创作:基于品牌吉祥物(如 Qwen 的 Capybara)生成 MBTI 主题表情包,保持角色一致性。
- 教育与培训:快速生成高质量插图和图表,提升课程内容的视觉吸引力。
- 游戏与影视:支持角色设计、背景生成和新视角合成,优化资产开发流程。
用户反馈显示,Qwen-Image-Edit 的直观操作和高质量输出使其成为非专业设计者的理想工具。例如,一位内容创作者表示:“Qwen-Image-Edit 让我在几分钟内完成营销视觉设计,文本渲染精准,效果堪比专业软件。”
1AI附开源地址:
- ModelScope:https://modelscope.cn/models/Qwen/Qwen-Image-Edit
- Hugging Face:https://huggingface.co/Qwen/Qwen-Image-Edit
- GitHub:https://github.com/QwenLM/Qwen-Image
声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
上一篇:OpenAI CEO:我们开源是因为 DeepSeek
下一篇:淘宝灰度测试“AI 万能搜”新功能