ChatGPT4o画像生成を使って日本人・写真素材を生成【建築パース・CGパース】

建築パース・CGパースの制作において、目的の日本人人物素材がなくて困った経験はないだろうか。特に、和装の人物や幼児、高齢者、教職員など、特定のシチュエーションに適した素材を探そうとすると、その選択肢は一気に限られてしまう。既存の素材サイトではバリエーションに乏しく、合成作業のたびに同じ人物ばかりが登場してしまうといった悩みも少なくないだろう。

こうした課題を解決する手段として、ChatGPT-4oの画像生成機能が有効だ。特に最近のアップデートにより、日本語のプロンプトを打ち込むだけで、AIっぽさが軽減された高品質な人物素材を柔軟に生成できるようになった。

本記事では、ChatGPT-4oを活用して日本人のカットアウト素材を効率よく生成する方法を、具体的なプロンプト例とあわせて紹介する。素材不足に悩む制作者にとって、実用的なヒントとなることだろう。

目次

1. ChatGPTでの画像生成方法

GPT-4oでは、テキストによるプロンプトを入力するだけで画像を生成できる。操作は非常にシンプルで、複雑な設定や英語の知識を必要としない点が大きな魅力だ。日本語にも完全対応している。

画像生成はChatGPTの有料プラン(Plus)で利用でき(無料プランでも限定的ではあるが利用できりょうになった)、Webブラウザ上で完結するため、特別なソフトや環境も必要ない。素材探しに時間をかけるよりも、必要なものをその場で生成してしまうという発想が、今後の制作フローに新しい選択肢をもたらすだろう。

ChatGPT-4oを使った画像生成は、次のような手順で行うことができる。

  • ChatGPT(GPT-4o)の画像生成機能を開く
    有料プラン(ChatGPT Plus)に加入していると、GPT-4oを選択した状態で画像生成機能が利用できる。画面下部のプロンプト入力欄に、生成したい画像の説明文を入力する。
  • 日本語でプロンプトを入力する
    プロンプトは日本語で問題ない。たとえば「白背景の中、歩いている日本人男性。後ろ姿。ビジネススーツを着用」など、できるだけ具体的に内容を記述することで、希望に近い画像が生成されやすくなる。
  • 数分で画像が生成される
    入力後、2~3分程度で画像が表示される。気に入らない場合は同じプロンプトで再生成したり、少し表現を変えて修正することも可能だ。
  • 必要であれば画像をダウンロードする
    生成された画像は、ダウンロードアイコンをクリックすれば保存できる。

以上が、GPT-4oを使った基本的な画像生成の流れである。特別なソフトは不要で、ブラウザ上だけで完結するため、思い立った時にすぐ素材を生成できるのが大きな利点だ。

2. ChatGPTによる人物生成の実例とプロンプト検証

GPT-4oによる画像生成は、日本語のプロンプトでも意図が伝わりやすく、比較的シンプルな指示でも実用的な人物素材が得られるようになってきている。本章では、実際に試した3つのプロンプトとその生成結果を紹介し、指示内容と出力画像の対応関係を見ていく。どの程度の情報を与えれば思い通りの人物が得られるのか、プロンプト表現の参考として活用してほしい。

2-1. 日本人男性が歩いている後ろ姿

最も基本的なシチュエーションとして「日本人男性が歩いている後ろ姿」というプロンプトで生成を試みてみる。

「日本人男性が歩いている後ろ姿」というシンプルなプロンプトを入力しただけで、想定以上にクオリティの高い画像が生成された。全身がフレーム内に収まり、ポーズやシルエットも自然で、そのままカットアウト素材として十分に活用できるレベルだ。この結果を踏まえ、プロンプトに要素を少しずつ加えて調整を試みた。

まず、「子連れの」という一文を追加してみたところ、男性のそばに子どもが寄り添って歩いている構図が生成され、こちらも驚くほどスムーズに意図が反映された。服装や動きに違和感はなく、シーンとしてのリアリティも十分である。

次に、「男性」を「夫婦」に置き換えてみると、男女二人が並んで歩く自然な後ろ姿の画像が生成された。歩幅や姿勢のバランスもよく、街中で撮影されたような印象すらある仕上がりだった。

これらの結果から、シンプルな単語の差し替えや追加だけでも、構図や登場人物の関係性がきちんと反映されることがわかる。プロンプトに過度な装飾を加えなくても、基本的な指示で精度の高い素材が得られるのは、GPT-4oの大きな強みといえる。

2-2. 立ち止まって話している日本人男女3名の若者

3人以上の人物が関わるシーンでは、構図の自然さや関係性の表現が難しくなる。ここでは「立ち止まって話している日本人男女3名の若者」というプロンプトをもとに、複数人物の自然な配置を試みた。

今回は「全身」というプロンプトを加えることで、人物の下半身が途切れず、カットアウト素材として使用できる形で生成することができた。実際、この指示がない場合は膝下が欠けるような画像が出力されることが多く、建築パース向けには不向きとなるため、「全身」はほぼ必須のキーワードといえる。

構図に変化をつけるため、3名すべてが正面を向いた状態ではなく、うち2名を後ろ姿にするよう指示を加えた。これにより、視線の流れや立ち位置に自然なリズムが生まれ、シーンとしてのリアリティが向上した。

さらに「ジェスチャーを交えて」というプロンプトを追加すると、手振りや身振りが加わり、会話をしている場面としての動きが感じられる画像に変化した。動きのある人物素材は、パース内での演出にも効果的であり、活用の幅が広がる。

2-3. カフェでくつろぐ男女

複数の人物が空間内で着席している場面では、立ち姿と比べて構図や要素の整理が難しくなる。本節では「カフェで座っている男女2名」というプロンプトをもとに、人物の位置関係や背景とのバランスを確認する。さらに、不要なオブジェクトを除外する指示がどの程度反映されるかも併せて検証した。

カフェでのシーンを想定し、「全身」「男性は後ろ姿」という構図の指定を加えて人物の生成を行った。2人の関係性や空間の奥行きを表現するためには、正面・背面のバランスを意識することが有効で、今回のプロンプトでも自然な構成が得られた。

カットアウト素材として使用することを前提に、人物以外の要素を除去する目的で「人物以外を消す」という指示を追加してみた。すると、構図の成立に必要な椅子やテーブルはそのまま残り、背景だけがうまく削除された

さらに「椅子とテーブルも消す」というプロンプトに切り替えることで、人物のみを抽出した状態の画像を生成することができた。空間の演出用・人物単体での利用など、用途に応じた柔軟な出力が可能である点は、ChatGPTの画像生成の大きな利点といえる。

3. 生成された画像のアレンジ方法

ChatGPTの画像生成は、単に1枚の画像を出力するだけでなく、生成された画像を部分的に修正したり、背景を透過させたりといったアレンジにも対応している。この章では、実際の操作手順とともに、素材として活用するための調整方法を紹介する。

3-1. 部分修正

人物の服装や持ち物、ポーズの一部など、特定の箇所だけを変更したい場合は、編集モードを利用して部分的に再生成することができる。前章で生成した若者3名の画像から、左側の女性がスカートを履いた状態に変更してみる。操作手順は以下の通りだ。

  • 修正したい画像をクリックして、編集モードに入り、ブラシアイコンを選択する
  • 修正したい箇所をなぞり、選択範囲を制作する
  • その範囲に対して「どのように修正したいか」をテキストで入力する

このようにして、画像全体を再生成せずに、必要な部分だけを調整できるため、制作物に合わせた微調整やバリエーション作成にも活用しやすい。

3-2. 背景透過

今回の画像生成アップデートによって、特に実用面で大きな進化といえるのが、背景透過画像の生成が可能になった点である。

プロンプトに「背景透過」と追加することで、人物だけが切り抜かれた状態のPNGデータとして出力できる。これは建築パースや広告など、人物をカットアウト素材として使いたい場合に非常に有効だ。

ただし注意点として、既に生成済みの画像に対して背景透過を指示した場合、見た目が少し異なる人物に再生成されることがある。そのため、カットアウト素材として活用する際には、最初から「背景透過」を含めたプロンプトで生成するのが確実である。

4. 生成AIの利点と業界への影響

今回のChatGPTにおける画像生成機能のアップデートは、人物表現の分野において極めて大きな技術的進化といえる。これまでの人物生成AIは、質感やディテールに不自然さが残り、業務用途での使用には厳しい面があった。Midjourneyを用いてようやく実用に近づくというレベルであり、プロフェッショナルな制作環境ではあくまで補助的な選択肢に留まっていた。

しかし、今回のアップデートによって状況は一変している。ChatGPT上で人物のカットアウト素材を業務水準に迫る品質で、短時間かつ簡易な操作で生成できるようになってきたのだ。この変化は、建築CGや広告ビジュアルといったビジュアライゼーション分野に携わる制作者にとって、大きな転換点となる可能性を秘めている。

とはいえ、現時点ではポリシーによる制限も多く、すべてのリクエストが意図通りに通るわけではない。人物表現に対しては特に慎重な対応が求められており、倫理的・社会的な配慮から、生成自体がブロックされるケースもしばしば発生する。開発元自身も、こうした状況を「20km/hしか出せないスポーツカーに乗っているようなもの」と表現しており、技術が持つ本来のポテンシャルを活かしきれていない現状を象徴している。

だが将来的にこれらの制約が緩和されれば、必要な人物素材を、構図や雰囲気を含めて瞬時に生成するという新しい制作フローが実現するだろう。これは、従来のようにストックフォトを探し回ったり、撮影や合成の手間をかけたりする従来の手法からの大きな脱却を意味する。

生成AIの導入は、単なる効率化にとどまらず、表現の自由度と制作スピードの両面において、業界全体に革新をもたらす可能性を秘めている。

5. ChatGPTで生成する人物素材についてのよくある質問

ChatGPTで人物素材を生成するには、どのようなプロンプトを使えばいいですか?

具体的かつ簡潔に、構図・服装・年代・性別・視点などを記述すると精度が高くなります。
例:「街中で立っている20代の日本人女性、カジュアルな服装、正面からの視点、背景は白」など。冗長になりすぎると逆効果になる場合もあるため、要点を絞るのがコツです。

人物の服装やポーズを細かく指定することは可能ですか?

ある程度までは可能です。「スーツ姿で歩いている」「座ってスマートフォンを操作している」など、具体的な動作や服装は反映されやすいです。ただし、手の表現や複雑なポーズは崩れやすく、精度には限界があります。

生成した人物素材を商用利用できますか?

ChatGPT(DALL·E)で生成された画像は、利用規約に従えば商用利用が可能です。ただし、ポリシー上の制限(有名人の似姿や不適切な表現)を避ける必要があり、念のため最終的な利用用途に応じた確認を行うことをおすすめします。

生成結果がうまくいかない/エラーになるのはなぜですか?

多くはOpenAIのポリシーによる自動検出フィルターが原因です。人物に関するリクエストはセンシティブな内容とみなされる場合があり、問題がないプロンプトでも拒否されることがあります。曖昧な単語や過度な細かさは避ける方が通過しやすい傾向があります。

Midjourneyや他の画像生成AIと比べて、ChatGPTの強みは何ですか?

ChatGPTでは日本語による対話的な指示と即時の画像生成がシームレスに行えるのが大きな特徴です。Midjourneyのような高解像度や芸術的な仕上がりには劣る場面もありますが、シンプルな人物素材を素早く出力する用途では非常に便利です。

6.まとめ

ChatGPTの画像生成AIによって、人物のカットアウト素材はついに業務利用が現実的な水準に達した。これまではAI特有の“違和感”やクオリティの限界により、建築パースや広告などでの実用には不安が残っていたが、今回のアップデートにより、状況は大きく変わりつつある。

とはいえ、現時点ではポリシーによる制限が多く、自由な人物生成にはまだ壁がある。特に子どもや女性の服装に関する生成は慎重に制限されており、想定通りのビジュアルを得るには工夫が必要だ。
ただし、こうした制約が今後緩和され、AIが本来持つ性能を引き出せるようになれば、ChatGPTだけで高品質な人物素材を生成する時代が到来する可能性は高い。

将来的には、「必要な人物を、必要な構図で、必要なタイミングに応じて生成する」ことが当たり前になるかもしれない。これは、ストック素材を探す手間や合成作業の負担を大きく軽減し、制作のスピードと柔軟性を飛躍的に高めてくれる。

人物が空間の意味や雰囲気を語るうえで欠かせない要素である以上、この画像生成AIの進化は、建築CGや広告ビジュアルの制作現場に確かな変革をもたらすだろう。

  • URLをコピーしました!
目次