AIイメージ生成の現在地
- 年後半からFLUX.1がAIイメージ生成の主役に躍り出た。Black Forest Labs(Stability AIの元共同創業者が設立)が開発したFLUX.1は、テキストレンダリング能力、プロンプト遵守率、画像品質の全てでSDXLを上回る。KGAのクリエイティブチームが両モデルを実務で使い込んだ比較結果を共有する。
FLUX.1のモデルラインナップ
FLUX.1は3バージョンで提供される。FLUX.1 Pro: 最高品質、API経由のみ($0.055/画像)。FLUX.1 Dev: Proに次ぐ品質、open-weight(non-commercial license)。FLUX.1 Schnell: 高速生成(4ステップ)、Apache 2.0ライセンスで商用利用可能。
KGAでは用途に応じて使い分けている。クライアント向け成果物: Pro。社内コンテンツ: Dev。プロトタイプ・ラフ案: Schnell。
FLUX vs SDXL: 実践比較
- 種類のプロンプト(人物、風景、建築、プロダクト、抽象アート等)で両モデルを比較した。評価はデザイナー3名の主観評価(5段階)と定量メトリクス(FID、CLIP Score)の併用。
プロンプト遵守率: FLUX 4.5 vs SDXL 3.2。テキストレンダリング: FLUX 4.8 vs SDXL 1.5。人物の自然さ: FLUX 4.3 vs SDXL 3.8。背景の複雑さ: FLUX 4.4 vs SDXL 3.6。生成速度(RTX 4090): FLUX Dev 8秒 vs SDXL 6秒。
最も顕著な差はテキストレンダリングだ。FLUXは画像内のテキスト(看板、ロゴ、UIモックアップ等)を正確に描画できる。SDXLではテキストが崩壊するケースが80%以上だったが、FLUXでは90%以上の精度で正しいテキストを生成する。
ComfyUIでのワークフロー構築
ComfyUIはノードベースのUIで、画像生成パイプラインを視覚的に構築できる。KGAではComfyUIを標準の画像生成環境として採用している。
基本的なFLUXワークフローはシンプルだ。CLIPテキストエンコーダ→FluxGuidance→KSampler→VAEデコーダ→画像出力。SDXLと異なりネガティブプロンプトの概念がなく(FLUXはguided distillationアーキテクチャ)、プロンプトの書き方も異なる。
高度なワークフローとして、ControlNetを使った構図制御がある。FLUX用のControlNetモデル(depth、canny、pose)が公開されており、参照画像の構図を維持しつつ新しい画像を生成できる。KGAのクライアント事例では、商品写真の背景差し替えにFLUX + ControlNetを使い、従来のPhotoshop作業(1枚30分)を2分に短縮した。
プロンプトエンジニアリング: FLUX vs SDXL
FLUXのプロンプトはSDXLとは根本的に異なるアプローチが必要だ。SDXLではキーワード羅列型(例: "professional photo, woman, studio lighting, bokeh, 8k, photorealistic")が効果的だったが、FLUXでは自然言語の文章型プロンプトの方が良い結果を出す。
FLUX向けプロンプトの例: "A professional photograph of a woman in a modern office, natural lighting from large windows, shallow depth of field, the warm afternoon sun creating soft shadows on her face"。このように場面を文章で描写する方がFLUXの理解力を活かせる。
LoRA fine-tuning: ブランド一貫性の確保
KGAのクライアント案件で最も需要があるのが、ブランド一貫性のある画像生成だ。FLUX Dev用のLoRA fine-tuningにより、特定のブランドスタイル(色調、構図、フォントスタイル等)を学習させる。
ai-toolkitを使用したfine-tuning手順。学習画像20-50枚+キャプション(BLIPで自動生成後に手動修正)。LoRA rank 16、学習ステップ1500-3000、learning rate 4e-4。RTX 4090で約1時間。出力モデルサイズは約150MB。
KGAのクライアント(アパレルブランド)では、LoRA fine-tuningにより商品カタログ用の画像を自動生成。従来のフォトシューティング(1回100万円以上)を、AI生成+人間レタッチ(1回10万円以下)に置き換えた。品質はクライアントの品質基準を満たし、ECサイトのコンバージョン率に統計的な差は出なかった。
今後の展望
FLUXの登場でSDXLは旧世代となったが、SDXLのエコシステム(ControlNet、LoRA、拡張機能)の蓄積は依然として価値がある。短期的にはFLUX用のエコシステムが急速に拡充されるが、完全にSDXLを置き換えるにはあと半年程度かかるだろう。KGAでは新規案件はFLUX、既存パイプラインのメンテナンスはSDXLという移行戦略を取っている。