プレイグラウンドAI:フィルター解説パート1
テーブルの内容:
1.はじめに
2.プレイグラウンドAIについて
3.RPGモデル
4.プロトジェン3.4
5.プロトジェン5.3
6.リアリスティックビジョン
7.プロトジェンモデルの違い
8.トリガーワードの活用方法
9.フォトリアリスティックな結果のためのポイント
10.おわりに
RPGモデルの特徴と使い方
プレイグラウンドAIに追加された4つのモデルの中で、まずは「RPGモデル」について見ていきましょう。RPGは「ロールプレイングゲーム」の略であり、このフィルターは「ゲーム・オブ・スローンズ」や「エルデンリング」、「スカイリム」といったキャラクターを対象としたスタイルを備えています。このモデルは画像サイズ512×768でトレーニングされましたが、640×832でも十分に良い結果を得ることができます。プロンプトのガイドラインとしては、3から9の範囲での指定が最適で、品質と詳細度は30から150の範囲で指定できますが、一般的には50から75でも十分な結果が得られます。
RPGモデルは、ローグやシーフのキャラクター、サムライや重装備の戦士を作成したい場合に最適なフィルターです。RPGでは、シンプルなプロンプトでもかなり良い結果を得ることができますが、より詳細なプロンプトを使うとさらに素晴らしい結果が得られます。例えば、「革で縫い付けられたような鎧」というような言葉をプロンプトに入れると、特定の鎧の見た目を強調することができます。実際のアーマーの種類は異なるかもしれませんが、それらの言葉をプロンプトに入れることで、アーマーの見た目がさらに引き立つでしょう。
これらのモデルは、写真のリアリズムを非常に優れたものにすることができますが、それに限定されるわけではありません。RPGに最適なサンプラーは、「DPM++のバリエーション」ですが、現在はプレイグラウンドで使用できません。代わりに、「DPM2」や「Euler Ancestral」の使用をおすすめします。
以下、いくつかの具体例をご紹介します。最初の例は、サムライというプロンプトです。細部のディテールが素晴らしく、色合いとコントラストが素晴らしいです。次の例は、サイバーパンクのキャラクターをベースにしたもので、アウトフィットの細部がはっきりと定義されており、環境の表現も素晴らしいです。同じプロンプトに2D要素を追加してみました。アニメやデジタルアート、CGIの要素を取り入れ、アクションのポーズを追加しました。特に「ダイナミックなアクションポーズ」と「戦闘の構え」という言葉を使うと、アームや足の位置に反応してくれます。
*プロ:写真のリアリズム、詳細なプロンプトに対する反応、多様なキャラクタータイプに対応
*コン:DPM++のバリエーションが利用できない
次に、プロトジェン3.4について見ていきましょう。なぜ最初にRPGをカバーしたかというと、プロトジェン3.4と5.3は、プロトジェンシリーズに加えて、他のいくつかのモデルを組み合わせて作られているからです。3.4には、ロボディフュージョン、オープンジャーニー、アナログフュージョンといった他のモデルも含まれています。
理想的な画像サイズは、512×768または640×832で、これらのサイズであればうまく機能します。具体的な違いについては後ほどお話しします。ここでは、RPGとプロトジェン5.3と3.4を比較してみましょう。以下の例では、同じシードを使用しています。上のサイバーパンクのキャラクターでも、3.4は少しエッジが効いていて、芸術的な表現がより強調されています。最大の違いは、ロボディフュージョンモデルが5.3にはないことです。その代わりに、ドリームライクなフォトリアルという別のモデルが使われています。
プロトジェン3.4と5.3のユニークな点は、トリガーワードを使用できるということです。これはリアリスティックビジョンでも同様であり、後ほど説明します。トリガーワードは、モデルの見た目とスタイルをより引き立たせるための方法です。以下では、シンプルなプロンプトの例(ベストを着た女性)に対して、いくつかのトリガーワードを使用した画像の比較を行っています。
プロトジェン5.3(何もトリガーワードを指定していない)、アナログスタイルのトリガーワードを指定した場合、メイクやイヤリング、ベストのディテールに微妙な違いがあります。次に、モデルシュートスタイルのトリガーワードを指定しました。メイクは少し濃いめで、イヤリングも変わっています。また、ベストを掴む手が追加されています。さらに、ミッドジャーニーV4スタイルのトリガーワードを指定した場合は、メイクや髪型、ベストの種類など、全体的なスタイルが大きく異なります。最後に、ロボディフュージョンモデルに基づくトリガーワードを指定しました。これはプロトジェン3.4にのみ存在しますが、5.3にも試してみました。髪の色が明るくなり、ミッドガーニースタイルと似た髪型になりますが、イヤリングやトップスも異なっています。トリガーワードを指定すると、画像がかなり変化することが明白です。
*プロ:トリガーワードの活用によるスタイルのバリエーション
*コン:プロトジェン5.3にはロボディフュージョンモデルがない
次に、リアリスティックビジョンについて取り上げましょう。リアリスティックビジョンは、プロトジェン3.4と5.3をはじめ、他のモデルも使用して作られています。このフィルターには、アナログスタイルとモデルシュートスタイルという2つのトリガーワードが付属しています。以下の例では、先ほどのプロトジェンモデルと同じプロンプトを使用し、同じシードを使用しています。
アナログスタイルというトリガーワードを使った場合、ヘアスタイルや服装など、オリジナルからのバリエーションが大きくなります。一方、モデルシュートスタイルのトリガーワードを使った場合、よりオリジナルに近い結果になりますが、アナログスタイルのものと比べるとやや変化があります。
リアリスティックビジョンでは、プロンプトのガイドラインとして、3から7の範囲での指定が最適で、品質と詳細度に関しては、25から30まで上げる必要はありません。サンプラーとしては、「Euler Ancestral」や「DPM2」を使用することをおすすめします。
*プロ:リアリズムのある結果、フォトリアリスティックな写真の撮影に最適
*コン:なし
以上が、「RPGモデル」「プロトジェン3.4」「プロトジェン5.3」「リアリスティックビジョン」についての概要です。次は、「プロトジェンモデル」や「リアリスティックビジョン」の設定方法やトリガーワードの活用方法について詳しく説明していきます。また、どのフィルターを取り上げたいかなど、他のフィルターについてもコメント欄で教えてください。さらに、ディスコードサーバーに参加して、作品を共有することもおすすめです。デイリーテーマやウィークリーテーマ、ウィークリーチャレンジなど、さまざまなコンテンツが用意されています。次の動画までお楽しみに!