【StableDiffusion】環境構築をしてはじめよう/簡単な言葉で画像を生成する/AUTOMATIC1111画面のtxt2imgタブ

StableDiffusion
StableDiffusion
この記事は約9分で読めます。

おはようございます!

8月29日 木曜日。晴れ間射す曇り。夜には雨が降る模様。台風が近づいてきております。
最高気温32℃。蒸し暑い~😖💦

今日も颯爽と学びを始めてまいります。

 

今日の教材はこちら、

スポンサーリンク


よしやっていこう!

 

 

CHAPTER2 環境構築をしてはじめよう

 

Section 2-4

簡単な言葉で画像を生成する

※下記画面は日本語化しています。また、青丸数字は教材としている書籍に特に説明がなかったので調べて記載しています。その他も補足等しています。

 

Prompt(プロンプト)
 生成してほしい画像の特徴を文字列(よく言われるのが「呪文」)にして入力する欄。

 

Negative prompt(ネガティブプロンプト)
 生成してほしくない画像の特徴を文字列にして入力する欄。

 

サンプリング方法
 AIが推論を行うアルゴリズムの種類を選択する。画像の描き方。ノイズまみれのキャンパスからノイズを取り除いて絵を描く際に、どのようにサンプリングを行うかを決定するパラメータ。

 

サンプリングステップ数
 AIが推論を行う回数を設定。画像生成の品質と処理時間に影響を与える重要な要素。ノイズ除去する回数を設定する。サンプリングステップ数を増やすと、生成される画像の詳細度が向上するが、処理時間も長くなる。

 

幅、高さ
 出力画像のサイズをピクセル単位で指定するパラメータ。

 

バッチ回数
 1度の生成(ボタン⑩)で出力される画像の枚数を指定するパラメータ。(最大100)

 

バッチサイズ
 平行して生成する画像の枚数を指定するパラメータ。大容量のVRAM(グラボのメモリ)を積んでいなければ基本1を指定。(最大8)

 

CFGスケール
 記述したプロンプトに対して、どれだけ忠実な画像を生成するかを指定するパラメータ。この値が大きいほど、プロンプトに忠実な画像を生成しようとするが、画像が崩れる可能性も高まる。逆に、小さい値ではプロンプトから離れる可能性が高まるが、生成される画像の品質は向上する。

 

 

 

シード
 AIが推論を行うための初期値を指定するパラメータ。画像生成の際に使用される制御要素。同じプロンプトを指定しても、異なるシード値を指定すると生成される画像が変わる。シード値を手動で固定することで、同じキャラクターで違う表情や服装・ポーズの画像を生成できるが、全く同じではない。

プロンプトを「1cat」、シード値を「123456」にして生成した2枚の画像。一見全く同じに見えるが、右前足の黒柄が一つあるのとないのとで微かに異なる。(でもほぼいっしょ)

異なる画像を出力させたい場合は、「-1」を設定することでランダムに生成される。

プロンプトを「1cat」、シード値を「-1」にして生成した2枚の画像。

 

生成
 画像生成を開始するボタン。右クリックするとオプションを選択することができる。

 ※すみません、日本語化しちゃったのでもとの文字列がなんだったのか、調べなきゃわかりませんが、すみません調べません。悪しからず🙇

 

生成ビュアー
 生成途中の様子が確認でき、生成終了すると生成した分の画像が確認できる。また、⑫~⑱の下に設定した内容、エラー、経過時間が表示される。

 

 

 

Open images output directory.
 生成した画像が保存されているフォルダを開くが、画面の1番前には表示されない。。※colab環境の場合は使用不可。

 

Save the image to a dedicated directory (log/images).
 生成した画像を保存。(⑫のフォルダに自動保存されるんだが、、corab環境は違うのかな?)

 

Save zip archive with images to a dedicated directory (log/images).
 生成した画像をまとめてZIP形式で保存。

 

Send image and generation parameters to img2img tab.
 生成した画像をimg2imgタブに渡す。

 

Send image and generation parameters to img2img inpaint tab.
 生成した画像をimg2img インペイントタブに渡す。

 

Send image and generation parameters to extras tab.
 生成した画像をExtrasタブに渡す。

 

Create an upscaled version of the Current image using hires fix setting.
 生成した画像をHiRes fixタブに渡す。㉑ので設定してある内容を踏まえて再度生成する。

 

Stable Diffusion checkpoint
 使用するモデルのリロードと選択をする。

 

Schedule type
 ノイズスケジューラのタイプを選択する項目。ノイズスケジューラは、画像生成の際にノイズをどのように加えたり除去したりするかを決定するもので、生成される画像の質に大きな影響を与える。以前は③のサンプリング方法(sampling method)と一緒に選択されていたが、最近のアップデートで「Schedule type」として分離された。

 

高解像度補助
 サイズが大きい高解像度の画像を生成したいときに、画像が崩れることを防ぐオプション。低解像度で生成した後にこのオプションを使うことで、高解像度化が実現する。このオプションにチェックを入れて生成することで⑱を押下する手間が省ける。

 

Refiner
 画像生成の品質を向上させるための新機能。Refinerモデルを追加することで細部を改善し、より高品質な作品を作成できる。具体的には、ノイズを減少させたり、細かいディテールを強化したりすることで、全体的な画像のクオリティを高めることができる。

 

 

 

スクリプト
 画像生成の際に変数を与えて色々な画像を生成する機能。txt2imgで使えるスクリプトは以下。

 ・プロンプトマトリックス (Prompt matrix):複数のプロンプトを比較できるよう1枚の画像にマトリックスで表してくれる。マトリックスにしたいプロンプトを「 | 」で括る必要がある。

 

※プロンプトマトリックスの具体的なやり方は以下のブログに書きました。ご参照ください。

 

 ・ファイルかテキストボックスからプロンプトを入力する (Prompts from file or textbox)「入力プロンプトのリスト」には1行ごとにプロンプトを入力し、1行ごとプロンプトの画像が生成でき、下図は3行記載しているため3枚生成されている。1枚ごとの画像のプロンプトは、[1行ごとのプロンプト]+[上部のプロンプト]となる。
下の「入力プロンプトをアップロードする」は、1行ごとプロンプトを記載したテキストファイルをアップロードするやり方のエリア。アップロードしたら即「入力プロンプトのリスト」欄にファイルの内容が反映される。

 

 X/Y/Zプロット (X/Y/Z plot)プロンプトマトリックスはプロンプトのについてのマトリックスに対し、X/Y/Zプロットはパラメータのマトリックス。

 

 

 

最後に「SD VAE」を表示させる手順についてご紹介します。

SD VAE
 画像生成の品質を向上させるための重要な要素。VAE(Variational Autoencoder)モデルを導入することで、鮮明度・色使いの改善や、細かい描写や装飾などのパーツが補正されるなど、画像の品質を向上させることができる。
なお、万能のVAEが一つあるわけではなく、モデル(checkpoint)に対して親和性のあるVAEがあるとのこと。

 

(1)「設定(Setting)」タブをクリック

 

(2)左側の「ユーザーインターフェース」をクリック

 

(3)「[info]クイック設定」にて「sd_vae」を追加

(追加した状態)

 

(4)設定を適用し、UIをリロードする

 

(5)リロード後、画面上に「SD VAE」が表示される

 

 

 

よし、、そろそろこの記事を終わりにしないと、HPがゼロの状態でほふく前進してる状態なので、、、明日に、、響いてしまう。。。。_: ( _๑´д`) :_

 

あ、Section2-4はまだ「画像を生成してみる」「画像の保存場所を確認する」「AUTOMATIC1111を終了させる」っていう項目があるんですが、、、

 

例の如くスキップします。。

 

ではでは、体力回復に全力を注ぐのでこれにて終了です。

 

おつかれさまでした~( 一一)ノ

 

 

 

コメント

PAGE TOP
タイトルとURLをコピーしました