Qwen Image
「Qwen Image」は、複数行のテキスト描画やプロンプトによる複雑な画像編集が可能な画像生成モデルである。
概要
特徴
- テキスト描画: 複数行のテキストを正確に描画 (英語/中国語) → 日本語は完全ではない
- 多言語対応: 英語/中国語/日本語プロンプト
- デュアル編集: 「意味」と「見た目」を正確に理解/認識して編集
- オープンソース: Apache 2.0 ライセンス/商用利用可
応用例
- オブジェクト追加/除去
- テキスト編集
- スタイル変換
- バーチャル試着
モデル
- BF16 版:
40.9
GB - DF11 版:
28.4
GB (VRAM 32 GB で実行可能) - FP8 版:
20.4
GB (VRAM 24 GB で実行可能) - GGUF 版: Q4_K_M
13.1
GB / Q5_K_M14.9
GB
※モデルサイズが超巨大なため、オリジナルのモデルをそのままローカルで動作させるのはかなり厳しい。ローカルで利用する場合は、FP8 版、あるいは、GGUF 版を利用する。
参考:
Qwen Image は何がすごい? FLUX.1 Krea と比較する次世代画像生成 | One More Vision
Qwen Image – 日本語は本当に描けるのか?を検証してみた | WEEL
日本語プロンプト
100% の精度ではないものの、日本語でプロンプトを入力してもほぼプロンプト通りの画像が生成される。日本の景色や日本人らしい顔もかなり高精度に再現されることが多い。
参考:
Qwen Image で生成できる日本の情景 | Catapp-Art3D
Image Edit
参考:
Qwen Image Edit – ComfyUI 正式対応!ローカルで画像編集処理! | たねやつの木
ComfyUI で Qwen Image Edit を試す (FP8 版/Lightning 使用) | まゆひらa
Qwen Image Edit – 画像編集 AI/テキスト編集 & デュアル編集の使い方を完全解説 | ハカセアイ
Qwen Image Edit 2509 – 画像編集向け生成モデルをアリババが公開 | ASCII.jp
Control Net
参考:
Qwen Image Inpaint / Outpaint – ControlNet でAIの粗を完全支配する神ワークフロー配布 | ハカセアイ
Qwen Workflow with ControlNet – reddit
ComfyUI
リンク:
Qwen Image – ComfyUI Examples | Comfy-Org
入手:
Comfy-Org/Qwen-Image_ComfyUI | Hugging Face
Comfy-Org/Qwen-Image-Edit_ComfyUI | Hugging Face
参考:
Qwen Image Edit 2509 – ComfyUI ネイティブ対応 | AI 愛 create
GGUF 版
入手:
city96/Qwen-Image-gguf | Hugging Face
参考:
ComfyUI で FP8 / GGUF 版の Qwen Image を試す | まゆひらa
Lightning
リポジトリ:
ModelTC/Qwen-Image-Lightning – GitHub
入手:
lightx2v/Qwen-Image-Lightning | Hugging Face
参考:
ComfyUI で Lightning や Distill を利用した Qwen Image の高速な生成 (FP8 / GGUF) | まゆひらa
ニュース
Qwen Image – 登場/高品質画像を生成可能で複数行の漢字を自然に描写できる驚異的テキスト描画性能をアピール | GIGAZINE
Qwen Image – 画像生成モデルリリース/精度の高い画像生成、編集機能と強力なテキストレンダリング機能を両立 | gihyo.jp
リポジトリ
チュートリアル
Qwen Image Edit – 画像編集 AI/テキスト編集 & デュアル編集の使い方を完全解説 (ハカセ & ラム)
Qwen Image Inpaint / Outpaint – 画像修正/ControlNet ワークフロー (ハカセ & ラム)