ComfyUI職人が明かす、生成AI画像の「質」と「安定性」を劇的に上げる5つの秘伝ノード設定

未分類

正直、驚いた。
Stable Diffusionのプロンプトを一切変えず、これだけ画質が変わるのか。
ComfyUIのノード設定には、公開されていない「本当の効き目」がある。

ここだけの秘密を話そう。
数え切れない夜を費やし、数千枚の画像を生成してやっと見つけた。
アーティストとしての「目」を満足させる、確かな設定値がある。


生成の「土台」を変える:KSamplerの真実

プロンプトが良くても、サンプラー設定が雑なら台無しだ。
特に「ステップ数」と「CFG」の関係は盲点が多い。

20ステップでCFG 7.0。
これが多くのデフォルトだが、これでは不十分だ。

私は、少なくとも30ステップ、CFGは5.0から6.5の範囲に落とす。
特にアニメ調や繊細なイラストでは、この設定が劇的にノイズを減らす。

なぜか?
高CFGは指示への忠実度を上げるが、画像の自然な「まとまり」を壊す。
ステップ数を増やし、CFGを抑えることで、AIが描画を「熟考」する余地が生まれる。

深夜の実験で気づいた。
CFG 8.0で生じる不自然な陰影や、テクスチャの破裂が消えていった。

VAEの選択が「色」を決める:sdxl_vae.safetensorsの死角

モデルに同梱されるVAEをそのまま使っていないか?
それは大きな機会損失だ。

安定した発色とディテールのために、私は必ず「sdxl_vae.safetensors」を別途ロードする。
しかし、ここからが本番だ。

「VAE Decode」ノードをダブルクリックして詳細設定を開く。
ここに「tiled_vae_decode」という項目がある。

これを有効にし、デコードタイルサイズを「256」に設定する。
この一手間が、高解像度出力時の「色むら」や「グレーの斑点」を完全に駆逐する。

512×768程度のサイズでは違いが分かりにくい。
だが、横長の壁紙や詳細なイラストを生成する時、この設定の有無で成果が決定的に分かれる。

情熱なくしては気づけない、地味だが強力な一手だ。

LoRAの「強さ」を精密制御する:Model Mergeの黄金比

LoRAを適用する時、単純に「strength」を1.0にするのは乱暴だ。
モデルとLoRAの「喧嘩」を招き、絵柄を崩す。

私は「Lora Loader」ノードではなく、「Model Merge」ノードを経由する。
LoRAを「モデル」としてロードし、本モデルとマージするのだ。

その比率は、本モデル:LoRA = 0.85 : 0.15。
これが、キャラクターデザインを保ちつつスタイルを染み込ませる黄金比だ。

0.2を超えるとLoRAの特徴が強すぎて破綻し、0.1以下では効果が薄すぎる。
0.15という値は、キャラクターの瞳の色や髪の質感を変えずに、画風だけを移す絶妙なラインだ。

何十回も失敗した末に見出した、確かな数字である。

細部を「彫る」:UltimateSDUpscaleの職人技

単純なアップスケールでは、ディテールは「ぼかされる」だけだ。
真の質感は「再生成」によって生まれる。

「UltimateSDUpscale」ノードは必須だ。
しかし、その設定が全てを分ける。

「upscale_model」は「4x_NMKD-Siax_200k.pth」を選ぶ。
シャープネスと自然さのバランスが、私の探求の中で最も優れていた。

「seed」は-1(ランダム)にせず、元画像のseedをそのまま流用する。
「tile_width」は512、「tile_height」は512に固定する。

最も重要な「denoise」は0.2から0.35の間。
0.4を超えるとタイルの継ぎ目が目立ち始め、0.1では効果が薄い。

この範囲で、画像の質感が「描き直された」ような豊かさを獲得する。
革のツヤ、布の織目、髪の一本一本が立ち上がってくるのを、この目で見てきた。

出力の最終関門:Image Scaleの「アルゴリズム選択」

最後の最後で画像を台無しにしていないか?
ComfyUIの「Image Scale」ノードには、多数のアルゴリズムが用意されている。

「Lanczos」や「Bicubic」がデフォルトだが、それではダメだ。
アニメ・イラスト系の最終出力には「Nearest-exact」を選ぶ。

なぜか?
他のアルゴリズムは拡大時に「色を混ぜて」滑らかにしようとする。
これが、クリアなセル画調の輪郭線を鈍らせ、色を濁らせる原因だ。

「Nearest-exact」はピクセルを単純に引き伸ばす。
その結果、AIが生成したシャープな輪郭と鮮やかな色味が、そのまま保たれる。

この知識がなければ、せっかくの生成画像が最終出力で輝きを失う。
もどかしさと戦いながら得た、確かな答えである。


知識を「収益」に変える:ComfyUI学習環境の最適解

これらの設定は、試行錯誤のための「時間」と「環境」があって初めて活きる。
高速なGPUと、知識を体系化する学習環境がなければ、発見は生まれない。

特に、ノードの組み合わせを何度も試すComfyUIでは、生成速度が創作のリズムを左右する。
RTX 4070 Ti以上のGPU環境は、もはや趣味の領域ではなく、創作の必須条件だ。

しかし、高額なGPUを個人で購入する必要はない。
クラウドで高性能GPUを必要な時だけ使えるサービスがある。

『RunPod』や『Vast.ai』といったGPUレンタルサービスだ。

特にRunPodは、ComfyUIがプリインストールされたテンプレートを用意している。
数分で最高性能の環境が立ち上がり、1時間単位の従量課金で利用できる。

自前のPCで深夜まで待つ必要はない。
ストレスなく大量の試行錯誤ができ、発見の速度が桁違いに上がる。

創作の情熱を、技術的・経済的な壁で削がれてはいけない。
まずはRunPodの「Stable Diffusion + ComfyUI」テンプレートで、無料クレジットから始めてみよう。

プロンプト一つで世界を創るこの技術と、真剣に向き合うための環境へ。
あなたの「こだわり」を、次の現実にする第一歩だ。

コメント

タイトルとURLをコピーしました