AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库 AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库
  • 主页
  • AI动态
  • PHP
  • QQ:420220301
    Wechat:w420220301
QQ:420220301
Wechat:w420220301
  • 主页
  • AI动态
  • PHP
首页 AI动态 全能图像编辑 AI 模型 Qwen-Image-Edit 发布:哪里不对改哪里,文字也能随心换

全能图像编辑 AI 模型 Qwen-Image-Edit 发布:哪里不对改哪里,文字也能随心换

管理员 2025-08-19 11:19:47

摘要:8 月 19 日消息,版本。Qwen-Image-Edit 基于 20B 的 Qwen-Image 模型进⼀步训练,成功将 Qwen-Image 的独特的文本渲染能力延展至图像编辑领域,实现了对图片中文字...

8 月 19 日消息,版本。

Qwen-Image-Edit 基于 20B 的 Qwen-Image 模型进⼀步训练,成功将 Qwen-Image 的独特的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。

此外,Qwen-Image-Edit 将输⼊图像同时输⼊到 Qwen2.5-VL(实现视觉语义控制)和 VAE Encoder(实现视觉外观控制),从而兼具语义与外观的双重编辑能力。用户可以访问 Qwen Chat (chat.qwen.ai)并选择“图像编辑”功能进行体验。

Qwen-Image-Edit 的主要特性包括:

  • 语义与外观双重编辑:Qwen-Image-Edit 不仅⽀持 low-level 的视觉外观编辑(如元素的添加、删除、修改等,要求图片其他区域完全不变),也支持 high-level 的视觉语义编辑(如 IP 创作、物体旋转、风格迁移等,允许整体像素变化但保持语义一致)。
  • 精准文字编辑:Qwen-Image-Edit 支持中英文双语文字编辑,可在保留原有字体、字号、风格的前提下,直接对图片中的文字进行增、删、改等操作。
  • 强大的基准性能:在多个公开基准测试中的评估表明,Qwen-Image-Edit 在图像编辑任务上具备 SOTA 性能,是一个强大的图像编辑基础模型。

Qwen-Image-Edit 的一大亮点在于其语义与外观双重编辑能力。所谓语义编辑,是指在保持原始图像视觉语义不变的前提下,对图像内容进行修改。

应用场景:从创意设计到商业落地

Qwen-Image-Edit 的多功能特性使其适用于多种场景,包括但不限于:

  • 海报与广告设计:生成具有视觉冲击力的宣传海报,支持复杂文本排版和风格迁移。
  • IP 内容创作:基于品牌吉祥物(如 Qwen 的 Capybara)生成 MBTI 主题表情包,保持角色一致性。
  • 教育与培训:快速生成高质量插图和图表,提升课程内容的视觉吸引力。
  • 游戏与影视:支持角色设计、背景生成和新视角合成,优化资产开发流程。

用户反馈显示,Qwen-Image-Edit 的直观操作和高质量输出使其成为非专业设计者的理想工具。例如,一位内容创作者表示:“Qwen-Image-Edit 让我在几分钟内完成营销视觉设计,文本渲染精准,效果堪比专业软件。”

1AI附开源地址:

  • ModelScope:https://modelscope.cn/models/Qwen/Qwen-Image-Edit
  • Hugging Face:https://huggingface.co/Qwen/Qwen-Image-Edit
  • GitHub:https://github.com/QwenLM/Qwen-Image

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。

上一篇:OpenAI CEO:我们开源是因为 DeepSeek
下一篇:淘宝灰度测试“AI 万能搜”新功能
猜你喜欢
  • 当AI学会"看"声音:MIT团队让机器通过音频重建完整视觉世界
  • 阿里巴巴发布最强语言模型挑战者:扩散模型能否颠覆ChatGPT?
  • OpenAI 申请 GPT-5 中国商标遇挫,相关申请均被驳回
  • 指责苹果偏袒 ChatGPT 后,马斯克与 Altman 在网上互喷
  • 每日AI必读资讯:AI人工智能领域最新热点资讯汇总(2025年8月20日)
  • 微软突破性框架让AI智能体像学生一样持续进化学习
  • 看不见摸不着的虚假声音,为何让我们的大脑如此"上当"?——卡迪夫大学解密语音感知新机制
  • 浙江大学团队揭秘AI写作新现象:中间过程竟比最终答案更准确
  • 当AI聊天助手遇上挑剔用户:Salesforce如何让机器真正理解你的心思
  • 我国首个法律垂直大模型发布:整合 2 亿余份裁判文书、420 万余部法律法规
19 08, 2025
新加坡南洋理工大学重新定义3D重建:像智能手机看视频一样理解三维世界
Str Tom
站长
Str Tom 网络工作室
254
文章
0
评论
0
获赞
  • 主页
  • AI动态
  • PHP
Powered By AI知识网 © 2025 strtom网络工作室. 公安备案号:冀公网安备13011102001189号 网站备案号:冀ICP备2024070905号-2 网站地图
友情链接: 各类知识收集 PHP接单网 YzmCMS官方网站 YzmCMS交流社区 YzmCMS官方博客