次の項目は別ページに分割しました。
関連ページ:
DALL-E
公式サイト:
Hunyuan Image
An Efficient Diffusion Model for High-Resolution (2K) Text-to-Image Generation
- 中国語表記: 混元 (混沌としている天地の始まり/根源)
動画:
世界1位/ComfyUI での使い方/徹底解説 v2.1 (ハカセ & ラム)
公式サイト:
Hunyuan Image 2.1 | Tencent [Official]
リポジトリ:
Tencent-Hunyuan/HunyuanImage-2.1 – GitHub
入手:
tencent/HunyuanImage-2.1 – Hugging Face
calcuis/hunyuanimage-gguf – Hugging Face
PromptEnhancer/PromptEnhancer-32B – Hugging Face
Hunyuan Image 2.1 GGUF | Civitai
デモ:
Hunyuan Image v2.1 | Hugging Face Space
リンク:
参考:
世界1位に輝いた Hunyuan Image 2.1 とは? ComfyUI での使い方と「VRAM の壁」を最安で乗り越える方法を徹底解説 | ハカセアイ
Artificial Analysis results for Hunyuan Image 2.1 are in, and apparently it’s the new No.1 – reddit
Hunyuan Image 2.1 GGUF – reddit
Hunyuan Image 2.1 with Refiner now on ComfyUI – reddit
Hunyuan Image 2.1 – FP8 model on a 4090 with ComfyUI – reddit
Ideogram
動画:
Ideogram v3 – 噂のデザイン AI がロゴもポスターも超綺麗に生成/使い方から活用術まで徹底解説 (ハカセ & ラム)
公式サイト:
リンク:
New Features v3.0 | Ideogram [Official]
デモ:
参考:
Ideogram 3.0 – 使い方/料金/商用利用 | Ai-Bo
Ideogram v3 – 噂のデザイン AI がロゴもポスターも超綺麗に生成/使い方から活用術まで徹底解説 | ハカセアイ
Ideogram 3.0 – 建築画像を生成してみる | 繁戸和幸
Midjourney
公式サイト:
参考:
Midjourney Beta – キーワードを元に AI の力でアーティスティックな画像を生成してくれるサービス!無料のオープンベータ版を利用可能! | 3D人
NovelAI
公式サイト:
NovelAI – The GPT-Powered AI Storyteller [Official]
リンク:
NovelAI Improvements on Stable Diffusion | NovelAI [Official]
参考:
NovelAI で超ハイクオリティな二次元イラストを生成してみる | saito aka PSYPIYO
超高精度なイラストを生成できると話題の NovelAI は本家 Stable Diffusion にどんな改善を加えたのか? | GIGAZINE
Qwen Image
特徴
- テキスト描画: 複数行のテキストを正確に描画 (英語/中国語) → 日本語は完全ではない
- 多言語対応: 英語/中国語/日本語プロンプト
- デュアル編集: 「意味」と「見た目」を正確に理解/認識して編集
- オープンソース: Apache 2.0 ライセンス/商用利用可
応用例
- オブジェクト追加/除去
- テキスト編集
- スタイル変換
- バーチャル試着
注意事項
※モデルサイズが超巨大なため、オリジナルのモデルをそのままローカルで動作させるのはかなり厳しい。ローカルで利用する場合は、FP8 版、あるいは、GGUF 版を利用する。
- BFloat16 版:
41
GB - DFloat11 版:
28.42
GB (VRAM 32 GB で実行可能) - FP8 版
- GGUF 版
動画:
Qwen Image Edit – 画像編集 AI/テキスト編集 & デュアル編集の使い方を完全解説 (ハカセ & ラム)
Qwen Image Inpaint / Outpaint – 画像修正/ControlNet ワークフロー (ハカセ & ラム)
How to Use Qwen Image Edit 2509 – ComfyUI (AIdea Lab)
リポジトリ:
入手:
Comfy-Org/Qwen-Image_ComfyUI | Hugging Face
Comfy-Org/Qwen-Image-Edit_ComfyUI | Hugging Face
city96/Qwen-Image-gguf | Hugging Face
リンク:
Qwen Image – ComfyUI Examples | Comfy-Org
参考:
Qwen Image は何がすごい? FLUX.1 Krea と比較する次世代画像生成 | One More Vision
ComfyUI で FP8 / GGUF 版の Qwen Image を試す | まゆひらa
Qwen Image – 日本語は本当に描けるのか?を検証してみた | WEEL
Qwen Image Edit 2509 – ComfyUI ネイティブ対応 | AI 愛 create
Qwen Image Edit – 画像編集 AI/テキスト編集 & デュアル編集の使い方を完全解説 | ハカセアイ
Qwen Image Inpaint / Outpaint – ControlNet でAIの粗を完全支配する神ワークフロー配布 | ハカセアイ
Qwen Workflow with ControlNet – reddit
Seedance
動画:
リンク:
Seedance | ByteDance [Official]
参考:
Seedance 1.0 Mini – 高品質な動画生成モデルを試してみました | miya
Seedance 1.0 – 史上最高の動画生成 AI/Veo 3 や Sora 超えの驚きの性能を徹底解説 | WEEL
Seedance 1.0 Pro – 動画生成の未来図の実現 | チャエンの AI 研究所
Seedream
バージョン 4.0
- バッチ入力/出力: 複数の参照画像/連続した画像の生成
- プロンプトによる画像編集
- 多様な描画スタイル: 90年代風、バロック様式、油彩、3DCG 風、など
- 知識と推論に基づくプロンプトの解釈
動画:
Seedream – 性能比較 & 無料で試す4つの方法 v4.0 (嗚呼蛙)
Forget Nano Banana! This is Better and Lower Censorship v4.0 (AI Samson)
リンク:
Seedream 4.0 | ByteDance [Official]
ドキュメント:
User Guide – Seedream v4.0 | ByteDance [Official]
デモ:
Stable Diffusion
リポジトリ:
Stability-AI/stablediffusion: High-Resolution Image Synthesis with Latent Diffusion Models – GitHub
入手:
stabilityai/stable-diffusion-2-1 | Hugging Face
リンク:
Stable Diffusion ローンチのお知らせ | Stability AI [公式]
Waifu Diffusion
入手:
hakurei/waifu-diffusion | Hugging Face
LoRA
ある一定の描画スタイルやキャラクターを多数出力したい場合、LoRA を用いると容易に行える。オープンソースのモデルや生成システムは LoRA を作成する機能が整っている場合が多い。プロンプトや参照画像のみで描画スタイルやキャラクターを固定することは現状困難であり、同じスタイルを多用する場合、オープンソースのモデルや生成システムをワークフローに取り入れることは必然的に検討される。
参考:
比較
動画:
Seedream / Nano Banana – 徹底比較!使うべき画像生成 AI はコレ! (あずきちゃんねる)
チュートリアル
AI Generated Images are Getting Too Real (bycloud)
AI Generated Images are Getting Too Realistic (Vincent Vendetta)
How to Create Photorealistic AI Images – Stable Diffusion (Binks)