AdpictoAdpicto
機能料金FAQ
日本語English
ログイン無料ではじめる始める
機能料金FAQログイン
日本語English
ブログ一覧に戻る
ハウツー

gpt-image-2でInstagram投稿画像を作る|参照画像1枚で全フォーマット展開【2026】

gpt-image-2の参照画像再現性・アウトペインティング・マスク編集で、1枚のInstagram用ショットをフィード(1:1・4:5)、ストーリーズ/リールカバー(9:16)、一貫したカルーセルへ展開する実務ガイド。

Adpicto Team2026年7月1日

1枚の商品ショットは、実際にInstagramで使えるようになるまでに、最低4つの姿に変わる必要があります。メインフィード用の1:1正方形、より広い画面を取れる4:5縦型、ストーリーズ/リール用の9:16カバー、そしてカルーセル投稿なら、同じ撮影に見えなければならない残り5〜8枚のスライドです。多くの現場はこれを2つの悪いやり方のどちらかで乗り切っています。面ごとに撮り直す・生成し直すと投稿ごとに商品の見え方がずれ、1枚だけ生成して他の比率を場当たり的にトリミングすると、元の画像を成立させていたフレーミングそのものを失います。

本稿はgpt-image-2の3つの能力の上に組み立てます。参照画像の高fidelity処理(実写真をアップロードすると、それを参照に使う全生成で認識可能なまま保たれる)、アウトペインティング(既存の構図を再生成せず新しいアスペクト比へ拡張する)、そしてネイティブのマスク編集(背景や紛れ込んだ1要素など一領域だけを変え、他はピクセル単位で保持する)です。組み合わせると、「面ごとに新しい画像を作る」が「一度作って、あらゆる面に展開する」に変わります。

最初に範囲を明記します。これは投稿戦略の記事ではなく、技術・ワークフローの記事です。実写真(実商品、創業者の顔、ブランドマスコット)がすでにある、あるいはカルーセルで何を言うべきか決まっている読者を前提に、正しいサイズ・比率で、同じ撮影に見えるピクセルをどう作るかだけを扱います。Instagramがなぜこの種の視覚的一貫性を評価するのかは、Instagram向けマーケティングの全体像を参照してください。

TL;DR

  • 4つの面、4つの仕様: フィード正方形1:1 = 1080×1080、フィード縦型4:5 = 1080×1350(画面占有が最大になるデフォルト)、ストーリーズ/リールカバー9:16 = 1080×1920、カルーセル = 1投稿あたり最大10枚、比率は統一。
  • 4回生成するのではなく、1枚のアンカーから展開する。主役ショットは一度だけ生成し、各面へアウトペインティングします。場当たり的なトリミングも、面ごとのゼロからの再生成もしません。
  • カルーセルの一貫性は参照画像アンカリングから生まれます — 同じプロンプトの繰り返しではなく、同じアンカー画像をすべてのスライド生成の参照入力として使い回します。
  • フルの再生成より先にマスク編集を検討してください。背景差し替えやオブジェクト除去はすでに正しかった部分を保持します。ゼロからの再生成は、生成のたびに商品の見え方が変わるリスクを負います。
  • これはモデル選定の記事ではありません。4人以上のシーン、画像内の日本語/CJKキャプション、低コストの大量バッチなど、gpt-image-2が得意でない仕事はマルチモデル戦略記事でNano Banana 2への切り替えどころを解説しています。

「Instagramカルーセルのベストプラクティス」ガイドとの違い

検索結果でも並びやすい2本なので、最初にはっきり分けます。英語版のInstagramカルーセルのベストプラクティスガイド(英語コンテンツ)はコンテンツ戦略の記事です — 各スライドが何を言うべきか、フック・バリュー・CTAの役割、保存されることの重要性、キャプションの書き方、投稿頻度。画像そのものの作り方には触れません。

本稿はその逆です。投稿頻度もハッシュタグも「フォロワーと交流しましょう」も出てきません — それはこのサイトのInstagramマーケティング・業種別記事群ですでに十分カバーされています。ここで扱うのはgpt-image-2特化の制作ワークフローだけです。参照画像起点の生成、Instagramの全比率へのアウトペインティング、参照アンカリングによるカルーセルの一貫性、クリーンアップ用のマスク編集。何を投稿するか決めるにはカルーセルガイドを、決まったら本稿を読んで実際に作ってください。

Instagramの4フォーマット、元画像は1枚

これはMetaが公表している仕様であり、ベンチマークではありません。FacebookとInstagramは同じMeta基盤上にあるため、同じ数値が共有されています。

面アスペクト比ピクセルサイズ備考
フィード正方形1:11080×1080無難なデフォルト。多くのフィード表示できれいにクロップされる
フィード縦型4:51080×1350フィードでの縦の画面占有が最大 ― 基本はこちらを目指す
ストーリーズ/リールカバー9:161080×1920全画面縦型。セーフゾーンはレシピ3参照
カルーセル1:1 または 4:5上記と同じ1投稿あたり最大10枚。全スライドで比率を統一する必要あり

カルーセル内で1:1と4:5は混在できません — 投稿全体で1つの比率に決めます。「10枚」は技術的な上限であり、何枚使うべきかという推奨ではありません。その判断はカルーセルベストプラクティスガイド(英語コンテンツ)の領分です。

なぜ参照画像1枚から始めるのか

gpt-image-2はアップロードされた参照画像を自動的に高fidelityで処理します — これは文書化されたモデルの挙動であり、新しい主張ではありません。だからこそ、実商品の写真も創業者の顔もブランドマスコットも、参照入力として再利用するすべての生成をまたいで認識可能なまま保たれます。ラベルの色は変わらず、プロポーションもそのまま、アップロードした形がそのまま返ってきます。

これがInstagramで効くのは、フィードがグリッドだからです。閲覧者は数秒であなたのタイルを何十枚もスクロールし、投稿ごとに商品の見え方が微妙に違うと、個々の画像自体はよくできていても量産感として読まれます。Nano Banana 2は高fidelityな参照処理ではなくプロンプト記述による被写体保持に依存するため、まさにこのジョブでドリフトしやすい傾向があります — 詳細はgpt-image-2 vs Nano Banana 2比較記事のジョブ5、Adpictoの回避策はマルチモデル戦略記事を参照してください。本稿はその比較結果を前提とし、その上にInstagram特化のワークフローを組み立てます。

日本のブランドアカウントでは特に、グリッド全体の「世界観」の統一感を重視する傾向が強いとよく言われます。投稿ごとに商品の見え方がぶれないことの価値は、その分だけ大きいはずです。

レシピ1: アンカーを生成する(1:1、1080×1080)

本稿のすべては、この1枚のアンカー画像から始まります。ここを正しく作れば、以降のレシピすべてがその恩恵を受けます。

題材として、小さなホームフレグランス/キャンドルブランドを最後まで使います。アンバーガラスの瓶にクラフト紙ラベルを貼った手作り大豆ワックスキャンドル、ブランドカラーは暖色のテラコッタとクリームです。

手順:

    • キャンドルの実写真を参照画像としてアップロードします — ムードボードではなく実物の写真です。
    • プロンプトでは、参照画像が「保持すべき被写体そのもの」であることを明示します。
    • 1:1、1080×1080で生成します。
    • この出力をアンカーとして保存します。以降のレシピはすべてこれを再利用します — 後で「似たような」バージョンを作り直さないでください。
テンプレート:
[Reference-anchored subject] on [surface], soft [light direction] light, [1–2 supporting props], [brand palette], editorial product-photography style, subject filling the central ~70% of frame, 1:1 aspect ratio (1080×1080). No text, no logos. Must match the reference exactly on [color / label / shape].

記入例:

The amber glass candle jar with the kraft-paper label shown in the reference image, on a pale oak wood surface, soft window light from the left, a small dried eucalyptus sprig and a folded linen napkin as supporting props, warm terracotta and cream palette, editorial product-photography style, subject filling the central ~70% of frame, 1:1 aspect ratio (1080×1080). No text, no logos. Must match the reference exactly on jar color, label design, and cap shape.

物理的な商品を売っていないサービス業(コンサルタント、コーチなど)でも、参照画像を創業者の顔やブランドマスコットに置き換えれば同じ仕組みが使えます — アンカーは「モノ」である必要はなく、以降の生成が一致すべき視覚的な1点であればよいのです。

なぜこれが効くのか: アップロード画像を「スタイル参照」ではなく「アンカー」として明示することが、以降のすべてのレシピを通じて商品をピクセル単位で認識可能に保つ鍵です。

レシピ2: アンカーを4:5にアウトペインティングしてフィード縦型を作る

アウトペインティングの一般的な仕組み(キャンバス準備、透明ボーダー技法)はgpt-image-2画像編集ワークフローにまとめています。ここではInstagram特化版だけを扱います。

1080×1080のアンカーを1080×1350の透明キャンバス中央に貼り付けます — 追加されるキャンバスは合計270px、上下均等なら1辺あたり約135pxです。構図に自然な方向性があれば(キャンドルの下により多くの面が続くなど)片側に重みを寄せても構いません。

テンプレート:

Extend the [surface] and [light direction] light [upward / downward / both] to fill a 1080×1350 4:5 canvas, continuing the same [palette] and editorial product-photography style. Add only environmental continuation — no new props, no second focal point. Keep [subject] in its current position and scale.

記入例:

Extend the pale oak wood surface and soft left-window light downward to fill a 1080×1350 4:5 canvas, continuing the same warm terracotta and cream palette and editorial product-photography style. Add only environmental continuation — a little more linen surface and a soft shadow gradient — no new props, no second focal point. Keep the candle jar in its current position and scale.

これは2つのデフォルトの置き換えです。「ゼロから2枚目を生成する」(再プロンプトした瞬間、レシピ1の参照ロックを失う)と、「別の画像から4:5を中央クロップする」(アンカーを成立させていたフレーミング=フレームの約70%を占める構図を失う)。アウトペインティングなら両方とも保持できます。

レシピ3: 9:16でストーリーズ/リールカバーを作る ― Instagram独自のセーフゾーン

Instagramの9:16は、実は1つのセーフゾーンではなく2つあり、しかも一致しません。

ストーリーズは上部にプロフィール画像・ユーザー名・投稿時刻が乗り、最下部には返信欄とスタンプトレイが乗ります。リールは構造が異なり、上部の帯は薄いプログレスバー程度で済みますが、下部にはキャプション・音源タイトル・フォローボタンが積み重なります。さらにリールにはストーリーズにない要素として、いいね・コメント・シェア・保存のアイコンが並ぶ右側の帯もあります。

MetaもInstagramも、こうしたオーバーレイの正確なピクセル数やパーセンテージを一般投稿(広告ではない通常投稿)向けには公表しておらず、しかも表示はデバイスやアプリのバージョンによっても微妙に変わります。どこかで見かける具体的なパーセンテージがあっても、それはデータを装った推測であり、設計の根拠にできる事実ではないと考えてください。実務的に頼れるのは定性的な基準です。被写体も画像内テキストも、上下左右すべての端から十分に離し、フレームの垂直方向の中央寄りに寄せておくこと。同じカバーをストーリーズとリールの両方に使う可能性があるなら、余白は少なめではなく多めに取ってください。リールの下部の積み重なりは、ストーリーズの返信欄よりも明らかに上まで及ぶためです。

テンプレート:

Extend the scene vertically upward and downward from the existing composition to fill a 1080×1920 9:16 canvas, continuing the same [surface], [light direction] light, and [palette]. Keep [subject] centered in the frame with generous empty margin at the very top and bottom — no critical detail near either edge. Add only environmental continuation in the new top and bottom areas — no new subjects, no text.

記入例:

Extend the scene vertically upward and downward from the existing composition to fill a 1080×1920 9:16 canvas, continuing the same pale oak wood surface, soft left-window light, and warm terracotta-and-cream palette. Keep the candle jar centered in the frame with generous empty margin at the top and bottom — no critical detail near either edge. Extend upward into a softly out-of-focus shelf and window edge, downward into more linen surface. No new subjects, no text.

レシピ4: 参照画像アンカリングによるカルーセルのスライド一貫性

本稿がそもそも何のために書かれているかに最も直結するレシピです。複数スライドのカルーセルを、10枚バラバラのレンダリングではなく、1つのデザインされた作品に見せます。

    • アンカースライド(通常はレシピ1のカバー、あるいはレシピ2の4:5版)を生成または選定します。
    • その同じアンカー画像を、以降のすべてのスライド生成の参照入力として使い回します。プロンプトの骨格は固定し、被写体や小道具のスロットだけを変えます(違う香り、違うSKU、教育コンテンツなら違うステップ番号)。
    • Instagramの実際の上限を守ります。1カルーセルあたり最大10枚、全スライドをアンカーと同じ比率にします — 途中で1:1と4:5を切り替えません。
これはgpt-image-2 vs Nano Banana 2比較記事のジョブ7が指摘する構造そのものです。gpt-image-2の参照画像駆動の一貫性はNano Banana 2のプロンプトのみの一貫性に勝ります(Nano Banana 2はスライドごとに影の角度や背景テクスチャがドリフトしやすい) — だからこのレシピはgpt-image-2に特化しています。これはAdpictoの投稿作成フローの実際の動きとも対応します。画像生成ステップは1回の生成に参照画像を添付する機能を備えており、これがカルーセル全体の参照アンカリングを、生のAPIを自分で組み上げなくても実行できるワークフローにしています。

このレシピが意図的にカバーしないのは、スライドを何枚使うか、各スライドが何を言うか、フック・バリュー・CTAの並べ方です。それは完全に英語版のカルーセルベストプラクティスガイド(英語コンテンツ)の領分です。まずそちらでスライドの役割を決め、決まったら本稿に戻って生成してください。

レシピ5: マスク編集 ― グリッドの統一感を保つ背景差し替え

範囲についての補足: このレシピと次のレシピは、OpenAI Images APIのマスク編集メカニクスを扱います。Adpictoの自社アプリ内編集フローはプロンプトベースで、マスクアップロードUIではありません(その違いは編集ワークフローガイドで解説しています)。

Instagram特有の「なぜ」はこうです。商品の実写真はブランドと関係のない場所で撮られがちです — カフェのカウンター、在庫置き場の棚、納品日の車のトランク。商品自体は問題なく、背景だけがグリッドの他の8枚と衝突します。マスク編集を使えば、再撮影なしで、かつフルの再生成が持つリスク(過程で商品自体が微妙に「再生成」されるリスク)なしに、商品をブランドの背景へ移せます。マスクの基本メカニクスはgpt-image-2画像編集ワークフローと、より詳しいgpt-image-2インペイントガイドを参照してください。

マスク: キャンドルの瓶とラベルは不透明、それ以外はすべて透明。

テンプレート:

Replace the masked background with [target backdrop description]. Match the existing subject's lighting — [light direction] light, [warm/cool] temperature. Add a soft contact shadow beneath [subject] consistent with that light direction. Do not alter [subject] itself.

記入例:

Replace the masked background with a pale oak wood surface and soft cream linen backdrop, matching this candle brand's usual feed look. Match the existing subject's lighting — soft window light from the left, warm temperature. Add a soft contact shadow beneath the jar consistent with that light direction. Do not alter the jar, label, or cap.

なぜこれが効くのか: 光の向きを合わせ、コンタクトシャドウを指定することが、差し替えた背景を「切り抜き感」にしないための鍵です。

レシピ6: マスク編集 ― グリッドに載せる前の不要要素の除去

道具は同じ、目的が違うだけです。フレーム端のスマホ充電ケーブル、主役の後ろの棚に残る廃盤商品の箱、窓に映り込んだ通行人。どれも撮り直すほどでも、フルの再生成をするほどでもありません。

マスク: 不要な要素だけ透明、商品を含むそれ以外はすべて不透明。

テンプレート:

Fill the masked area with a natural continuation of the surrounding [surface/texture], matching [light direction] light and existing color and grain. No new objects, no text, no shadow inconsistent with the scene's existing light.

記入例:

Fill the masked area with a natural continuation of the oak wood counter surface, matching the grain direction, color, and the existing soft window light from the left. No new objects, no text, no shadow inconsistent with the scene's existing light.

2つのマスクレシピが言いたいことは同じです。間違っている1点だけを直せば、すでに正しかった残り全部を保持できます — フルの再生成は商品そのものを振り直すことでもあり、レシピ1が固定しようとした「ピクセル単位の再現性」を自ら手放すことになります。

どの面にはどのパイプラインを使うか

  • ブランド/商品アセットから新規投稿を作る場合 → レシピ1。
  • 同じショットで2つ目のフィード比率が必要な場合 → レシピ2(トリミングや再生成ではなくアウトペインティング)。
  • ストーリーズまたはリールのカバーが必要な場合 → レシピ3。どちらの面にも使う可能性があるなら、上下の余白を多めに取ります。
  • カルーセルを作る場合 → スライド間の一貫性はレシピ4、各スライドが何を言うべきかはカルーセルベストプラクティスガイド(英語コンテンツ)。
  • 既存の写真がほぼ正しく、1点だけ気になる場合 → レシピ5または6。ゼロからの再生成ではありません。
  • 4人以上のシーン、画像内の日本語/CJKテキスト、大量・低コストのバッチが必要な場合 → gpt-image-2の得意分野ではありません。Nano Banana 2へ ― マルチモデル戦略記事と、根拠となる比較記事を参照。

よくある間違い

4:5や9:16をトリミングで作る(アウトペインティングを使わない)。 元画像を成立させていた構図判断を失います。トリミングではなくアウトペインティングなら、フレーミングを保ったままキャンバスを追加できます。

ストーリーズとリールのセーフゾーンを同一視する、あるいはTikTokと同じだと思い込む。 ストーリーズの返信欄・スタンプトレイの下部バンドと、リールのキャプション・音源タイトルの積み重なりは位置が異なり、どちらもTikTok独自のオーバーレイ構造とも一致しません。Instagram実際のオーバーレイに合わせて設計してください。

カルーセルの各スライドを毎回新しいプロンプトから生成する。 カバーからの参照アンカリングをしないと、技術的には悪くない10枚ができても同じ作品には見えません。すべてのスライドを同じ参照画像にアンカリングしてください。

マスク編集で済む場面でフルの再生成に手を伸ばす。 再生成のたびに商品の見え方が変わるリスクを負います。9割がすでに正しいなら、残り1割のためにその9割を賭けに出す必要はありません。

マスクをきつく切りすぎて、商品の端にフェザーがない。 きつすぎるマスクはモデルに馴染ませる余地を与えず、目に見える継ぎ目を生みます ― どの程度フェザーを残すかはインペイントガイドで解説しています。

カルーセルのバリュースライドの文字をgpt-image-2自身に描かせる。 複数行のテキストはこのモデルが最も弱い領域です。ネガティブスペースを確保してクリーンに生成し、実テキストは後から組んでください ― 言い回しはテキスト・レイアウトプロンプトレシピにまとめています。

次の投稿を、これから並ぶグリッドから切り離して単体で生成する。 1枚だけ見れば良い出来でも、すでに並んでいる直近の投稿と衝突することがあります。出す前に直近のグリッドと並べて確認してください ― 違和感があるなら、アンカー参照の使い回しか背景を合わせたマスク編集が正しい対処で、投稿頻度を見直す理由にはなりません。

ある午後で、アンカーから1バッチ分のInstagram素材まで

このキャンドルブランドが1回の午後でたどるワークフローです。瓶の実写真からレシピ1で1:1のアンカーを生成し、フィード縦型用に4:5へ(レシピ2)、ストーリーズ/リールカバー用に9:16へ(レシピ3、両アプリのUIオーバーレイを避けて余白を多めに取りながら)アウトペインティングします。これで1回の生成が3つの面をカバーします。

そこから、カバーを参照画像として残りのスライドに使い回し、香りとラベルだけをプロンプトごとに変えて(フィグ&シダー、バニラアンバー、シーソルトドリフトウッド)、サーフェス・光・パレットは固定したまま5〜6枚のカルーセルを組みます(レシピ4)。

別途、すでに存在するが撮影環境が良くなかった実写真を2枚用意します ― 雑然とした在庫棚の上の1枚と、ケーブルが写り込んだ1枚です。1枚目には背景差し替え(レシピ5)、2枚目には不要要素除去(レシピ6)のマスク編集を行い、どちらも撮り直しなしでグリッドに加えます。

すべてをネイティブ解像度(1080×1080、1080×1350、1080×1920)で書き出せば、2比率のフィード投稿1本、ストーリーズ/リールカバー1本、6枚のカルーセル1本、救済した写真2枚という、一貫して同じ商品に見えるバッチが1回の午後で完成します。

補足: レシピ3の9:16カバーは、リールの再生前・再生中にInstagramが表示する静止画であり、リールそのものの動く中身ではありません。動画自体が必要なら別の生成パイプラインです ― Sora 2でInstagramリールを作るガイドがその領域を扱います。

面が変わるたびに撮り直したり、ゼロからプロンプトを書き直したりするのに疲れていませんか? Adpictoを無料で試す — クレジットカード不要、無料プランで月5枚のAI画像生成。

まとめ

本稿のほぼすべては3つの動きに集約されます。1枚の参照画像を、撮り直すのではなくアウトペインティングで展開し、Instagramのあらゆる面(フィード正方形・フィード縦型・ストーリーズ/リールカバー)に対応させること。1枚のアンカーを、カルーセルの毎スライドで書き直すのではなく使い回すこと。そして、要素や背景の一部だけが間違っているときは、フルの再生成ではなくマスクを使うこと。

次に読むべきものです。本稿が意図的に扱わなかったスライド単位のコンテンツ戦略は、英語版のカルーセルベストプラクティスガイド(英語コンテンツ)へ。アウトペインティングとマスクの一般的な仕組みは画像編集ワークフローとインペイント詳解へ。gpt-image-2から離れてNano Banana 2を使うべき根拠はマルチモデル戦略記事と比較記事へ。何を投稿したいかは、もうわかっているはずです。これは、それを一度作って必要なすべての面に展開するための方法です。

gpt-image-2Instagram 投稿画像 AIAI画像生成Instagramカルーセル画像マスクアウトペインティング2026

関連記事

ハウツー

gpt-image-2インペイント実務ガイド|マスク・プロンプト・修正

SNS画像編集でgpt-image-2のインペイントを使う実務ガイド。マスク準備、領域指定プロンプト、複数パス修正、継ぎ目やにじみの避け方を解説。

ハウツー

ペットショップ・トリミングサロンのTikTok集客完全ガイド【2026年版】

ペットショップ・トリミングサロン・動物病院のTikTok運用ガイド。可愛さでバズらせて来店予約に繋げる実践フォーマット(ビフォーアフター、初登場、しつけTips)とAI活用法を解説。

ハウツー

学習塾のFacebook広告完全ガイド|保護者層リーチで体験申込を増やす方法【2026年版】

学習塾・スクール向けFacebook広告運用ガイド。30〜50代保護者へのターゲティング、地域コミュニティ活用、体験申込までの動線設計をAI活用で効率化。

この画像ワークフローをAdpictoで試す

gpt-image-2 と Nano Banana 2 をAIが自動で使い分け。プロンプトから画像を生成・編集できます。

無料で画像を作る

クレジットカード不要 · 月5枚まで無料

AdpictoAdpicto

目的から作る、SNS投稿AI。サービス・お店の情報を登録すれば、目的に合った構成・画像・文章をAIが組み立てます。

ユースケース

  • 中小企業向け
  • EC向け
  • 飲食店向け
  • 美容室向け
  • 不動産向け
  • フィットネス向け
  • 歯科医院向け
  • カフェ向け
  • ファッション向け
  • ホテル・宿泊業向け
  • 教育機関向け
  • ペット関連向け
  • フリーランス向け
  • フォトグラファー向け
  • 医療機関向け

プラットフォーム

  • Instagram
  • X(Twitter)
  • TikTok
  • Facebook
  • LinkedIn

比較

  • vs Canva
  • vs Buffer
  • vs Later
  • vs Hootsuite
  • vs Adobe Express
  • vs Ocoya
  • vs Predis AI
  • すべての比較を見る →

リソース

  • ブログ
  • ヘルプ
  • お問い合わせ

法的情報

  • 利用規約
  • プライバシーポリシー
  • 特定商取引法に基づく表記

© 2026 Adpicto. All rights reserved.