GPTに渡した作りたい画像
GPTが出した画像
いちど、「自分が何を注目してこの画像プロンプトを提示してるか」をGPTに伝えて、そこを解説させる。その後その解説をプロンプトに加えたうえで画像を作らせる。
そのフローを考える
「あなたはプロの 漫画家です」と GPT に宣言
添付画像を、画像に含まれる要素を以下の観点から詳しく描写してください。人物配置、画角構図、表情、目線に注目して言葉で表現してください。 また、人物がそれぞれどんな感情や意図があるかも描写してください。
① 主題(何を描いているか/誰が中心か)
② 感情(登場人物の表情や感情、意図)
③ 構図(カメラアングル、人物の配置、前後関係)
④ 背景(舞台となっている空間や時間帯)
⑤ 色調・ライティング(明暗、トーン、主な色)
⑥ スタイル(アニメ風、写実風、水彩風など)
ここで、自分が「画像プロンプトのどの部分が重要なポイントなのか」を伝える
「その整理結果をもとに、GPT(DALL·E)向けの自然な文章プロンプトを作成してください。 主題、人物、構図、背景、感情、スタイルをバランスよく含めた一文または二文にまとめてください」
→ 出力を見て気になる部分は STEP-1 に戻って追記・修正
GPTが出してきたプロンプト
Main prompt(自然文):
A confident woman with braided purple-highlighted hair is seated at an office desk, calmly using a tablet. Behind her, a girl with star-shaped hair clips and pastel twin buns stands frozen, eyes wide in shock, in a warm-lit open-plan workplace. The style is clean cel-shaded anime, with realistic body proportions and expressive facial details.
Negative prompt(避けたい要素):
No distorted faces, no extra limbs, no embedded text or logos, no unnatural lighting, no blurry backgrounds, and no chibi proportions.
添付した画像
この後出してきた画像
構図の再現度かなり高くなった
❶ネーム→➋構図描写→➌プロンプト化→➍描画
コマ単位の文章プロットの画面構成をGPTに投げてアイディアを出させる→
いいものの選んだあと「ChatGPTで最適なプロンプト化に対応した、構造画像化に最適な形で詳細描写してください。」
「画面構成に基づき、GPT(DALL·E)向け最適化プロンプト を作成してください」
通常の構図補正を避けるためにこの形式を使います。
今後も、意図的な「ゆがみ」「演出主導構図」「様式化表現」
AIの“安全判断”や“デフォルト補正”を回避し、
構図最優先で崩れて見えてもよいという意図を
漫画・アニメ構図の極端表現/意図的デフォルメ/構造の主観化をDALL·Eに渡すとき、
通常の構図補正を避けるためにこの形式を使います。
今後も、意図的な「ゆがみ」「演出主導構図」「様式化表現」
DALL·Eでは「ポジティブプロンプト(肯定形)を厳密に構成」する方がずっと重要。
「ヌードは描かないで」ではなく「恥部は隠した状態で出力して」と命令する。
GPTは「安全制限」や「文脈解釈」の影響を強く受けるため、Stable Diffusionのような「明示的な抑制」は効きにくい。