何回も指示出してもGPTが言う通り描いてくれないときの対処法
GPTが言うことを聞かないときの理由は3つ。
・GPTの画像生成は数値を大体で捉える
・GPTが美しいと思う画像に近づけようとする
・OpenAIの規制
画像生成の場合テキストプロンプトだけだと限界がある。例えば角度。
顔が上を向いて、目が見えなくなるくらいで人物を描いて。といって出てきたのが
アオリで!と言ってGPTが出してくる限界
それでも何度やっても、図示してもここが限界だった
GPT側が安全性、整合性を保とうとして自動で補足演出を入れる。そのせいでユーザーの意図と出力画像がズレることがある。「GPTがいれた補足演出は何か」を問うことで問題点が見つかる。そのあと「顔が崩れてもいい」「顔がどんな方向を向いていてもいい」と、補正点にポジティブな言葉を付け足すと治ることが多い。
「顔崩れちゃうからかけないよー」とGPTがいってきたので、顔崩れていいから描いて。といって出してきた構図。
ギャルピース(逆ピース)
画像を作成して提示したけど
最大に頑張った角度。ピースって単語を使わず、ギャルピースの形状、位置などを提示してようやく出た。
考察 : 理由は2つ。AIはもともと指をかけなかった。そのため手の形状単体で補正が入ってるため、指の形の自由度が低い。
もうひとつは、手の形は卑猥な物や、攻撃的な形状があるため想定以外の形、向きを取れないと思われる。
二人の間の目線、体の向き(左の人が左端のディスプレイを見ていて、右のキャラクターは左のキャラクターを向く) が普通の構図としておかしいが、物語の演出として必要だった
間が“演出として選んでいるズレ”の多くが、GPTや画像生成AIによって「修正対象」だと誤認され、補足演出として自動処理されてしまう
GPT,DallEの画像生成では、コンプライアンスを重視する「安全制限」や「文脈解釈」の影響を強く受けるため、Stable Diffusionのような「明示的な抑制」は効きにくい。
「~をしないでください」「~をやめてください」などの否定文は効果がほぼない。そのためNegativePrompt的な使い方ができない。そのため、GPTが不自然だ!と提示してくる項目に対してポジティブに返すと描いてくれることがある。
・違和感を覚えてもいい(×自然じゃなくていい)
・一般常識から外れていい(×一般常識に従わなくていい)
日本語テストかよ!