チャットAIを使って画像生成AIの呪文(プロンプト)を作ろう!

画像生成AIで使うプロンプトを生成するにあたり、チャットAIの併用は非常に便利です。この記事では、その理由について解説!

Stable Diffusion」や「Novel AI」などの画像生成AIで使われるプロンプトとは、AIに何を生成するか指示するための文章のことです。
例えば、「森の中にいるエルフの少女を描いてください」といった具体的な指示がプロンプトとなります。AIはこのプロンプトを受け取り、それに基づいて画像を生成します。 しかし、プロンプトの作成はなかなか煩雑で難しい部分も。特に、具体的なイメージを持ちながら英単語で表現する必要があるため、思ったより時間がかかる作業になることも。
そこで、チャットAIを活用することで、プロンプト作成を効率化してしまおうというもの!

チャットAIは、人間と自然な会話ができるようにプログラムされたAIです。そのため、自然言語処理に優れており、人間が言葉で表現したイメージを理解し、それを英文にすることができます。この機能を活用して画像生成AIで使うプロンプトの作成を手軽に行うことができます。

それでは実際に利用してみます!

CatchyとChatGPTを活用

実はこのふたつ、どちらもOpenAIのGPT-3というAI言語モデルが使われています。
最近ニュースになることが多いのは「ChatGPT」ですが、自由度が多い反面、どう使っていいか迷ってしまう…という人もいるかもしれません。逆に「Catchy」はあらかじめ、使用目的別にカテゴライズされていることで使いやすく感じる人もいると思います。
それぞれの良さがあるので、使いやすい方で試していきましょう!

では早速…
  • 銀髪に青い目の青年
  • 近代的な夜景
  • 高いところから見下ろす
という絵を生成する呪文をお願いしてみたいと思います。
※なお、ネガティブプロンプトは一律で「EasyNegative」を使用しました

Catchyで呪文生成

まずは無料版で利用してみましょう。登録はこちらから
私はGoogleアカウントでログインして無料版を使っています。ちなみにこちら、実は最初からカテゴリに「画像生成 AI 用の英文」が用意されてます!
どんな画像を生成したいか日本語で書くと、Midjourney(ミッドジャーニー)や DALL·E(ダリー)、DreamStudio(ドリームスタジオ)に入力する最適な英文を生成します。 画像生成 AI 用の英文|Catchy
Stable Diffusion」の記述はありませんが十分に使えるので、試してみましょう。
画像生成 AI 用の英文|Catchy
  • どんな絵を描きたいか、簡単に入力してください。
    銀髪に青い目の青年
    近代的な夜景
    高いところから見下ろす
  • 絵のスタイルを指定してください
    最高に美しいイラスト
  • 文章の雰囲気(任意)
    丁寧
A young man with silver hair and blue eyes stands atop a high place, looking down at the night view. The sky is a deep navy blue, with stars twinkling in the night sky. Down below, the city stretches out in a sea of yellow, white, and orange lights. In the distance, tall buildings reach up towards the sky, their windows lit up with a soft white light. The man's clothes are a bright blue, and his eyes shine in the darkness. Art style: The most beautiful illustrations.
「Stable Diffusion」用の呪文は要素をシンプルに区切った方が伝わりやすいそうですが、十分に伝わっている気がします!

高いところから見下ろす」についてはやや外れたかもしれませんが、そもそも「見下ろす対象を指定していない」ことが原因だと思われますので、改めて『高いところから街を見下ろす』でお願いすれば、思った構図にさらに近くなりそうです。
くらつひわ
完全に文章なのでどうかなと思ってましたが、かなり綺麗に生成!
意外と文章での指定も良い感じ? ちょっと目から鱗でした。

ChatGPTで呪文生成

何と言っても自由度の高さが魅力! ただし、いきなり「画像生成AI用にプロンプトを作って」というのは無茶振りというもの。そこでプロンプトに関するルールや例を提示した上で、改めてプロンプトを生成してもらう形になります。

下記は一例です。要素やルール作りは自分なりにブラッシュアップしてみてください!

■目的:画像生成AIで使うプロンプトの生成
■プロンプトの生成ルール:
・全て英語の平文で作成
・要素の区切りには半角カンマ+半角スペース(, )を使用
・上記の記号以外に使えるのは、要素の綴りで必要となった時の「-」のみ
・プロンプトの文頭には女性なら”1girl, solo,”、男性なら”1boy, solo,”を必ず含める
・その次に、写真ではなくイラスト画風を指定するので「super fine illustration」を入れる
・続けてクオリティ要素として「an extremely delicate and beautiful」「best quality」を入れる
・「年齢」「髪色」「髪型」「髪の長さ」「目の色」「視線の向き」「表情」「服装などの外見」要素を入れる
・背景となる場所の要素を入れる(室内、屋外、森の中、海辺など)
・ポーズの指定も要素として入れる
・顔のアップなのか、全身図なのか、顔~胸までなのか、といった構図の要素も入れる
・プロンプトにはDanbooruのタグを使える
■プロンプト例
1boy, solo, super fine illustration, an extremely delicate and beautiful, best quality, silver hair, blue eyes, handsome, cool, modern, night cityscape, skyscraper, balcony, leaning against railing, looking down, city lights, urban scenery, futuristic.

以上のルールを踏まえた上で、以下のプロンプトを30要素以内で生成してください

■概要
銀髪に青い目の青年
近代的な夜景
高いところから見下ろす

1boy, solo, super fine illustration, an extremely delicate and beautiful, best quality, silver hair, blue eyes, handsome young man, 25 years old, modern cityscape, overlooking from a skyscraper, night view.
最初に一度やっておくと次からは「下記をプロンプトにして」で通じるようになって便利。そのうちルールを忘れられることがあるので、その時は再度ルールを教え込む形を取ります。
くらつひわ
本当はもっと洗練された内容のものが存在するのですが、リンクも引用もNGとされているのでここでは詳細を割愛…
ちなみにその内容で生成されたプロンプトと生成結果だけ掲載!
1boy, solo, silver hair, blue eyes, modern cityscape, looking down from a height, leaning against a railing
  • “1boy, solo”:男性の一人称視点で描くための指定
  • “silver hair”:主人公の髪の色を銀色に指定
  • “blue eyes”:主人公の目の色を青色に指定
  • “modern cityscape”:現代的な夜景を描くための指定
  • “looking down from a height”:高い場所から見下ろすシーンを描くための指定
  • “leaning against a railing”:手すりに寄りかかっている様子を描くための指定
※プロンプトと共に、その概要も教えてくれる質問の仕方がされていて素晴らしい…
くらつひわ
具体的な年齢指定がないので「1boy」から少年が生成されてますが、ベースとなる呪文さえ生成されれば、あとは手動で調整してカスタマイズできるので、ゼロから考えるよりずっとラクチン!

あると便利なツールたち

呪文のベース作りをしてもらった後、細かく微調整をしたいところ。
ここでは、あると便利なツールをご紹介。これらを活用して思った通りの絵面を生成!

あると便利な拡張機能

くらつひわ
例えば「silver eyes」と入れかけると、より適切な「grey eyes」を候補として出してくれます。綴りがうろ覚えでも途中まで入れると変換予測が!
もちろん、出ない単語もあるのでその時は下記で対応しときましょう。

あると便利な「DeepL翻訳」

DeepL翻訳」がとても便利なので入れておくと大活躍!
タグ生成時だけではなく、主に英文で書かれてることが多い拡張機能の概要や説明文なども翻訳できるので理解が深まります。(インストールは自己責任でお願いします)

オマケ:画像生成AI用の呪文生成

まとめ

以上のように、チャットAIを活用することで、画像生成AIで使うプロンプトの作成を手軽に行うことができます。上手く活用して便利に使いましょう!
くらつひわ
具体的なポーズが決まってる場合は、ControlNetの「openpose」を使った方が圧倒的に手っ取り早いです。ガチャしなくて済みます。
ただ、構図自体がふんわりしてる時はこちらの方が提案してもらえてイメージを固めやすいというのもあります。目的別にどうぞ!
他にもプロンプト(呪文)生成を楽にしてくれる機能の紹介記事をまとめました。
よろしければあわせてご参照ください。