AdpictoAdpicto
機能料金FAQ
日本語English
ログイン無料ではじめる始める
機能料金FAQログイン
日本語English
ブログ一覧に戻る
ハウツー

gpt-image-2で既存画像を編集する|マスク・インペイント・バリエーション【2026】

gpt-image-2で既存画像を編集する方法。マスクの書式、インペイントのプロンプト、バリエーションのワークフローを、背景入れ替え・商品差し替えなどの実例で解説。

Adpicto Team2026年4月20日

画像編集は、AIワークフローが「魔法」から「本物のインフラ」に変わる地点です。テキストプロンプトからゼロで画像を生成するのは派手ですが、実務で本当に必要なのは「すでにある画像の1箇所だけを変えること」です。商品写真の背景を差し替える。左手のコーヒーカップを紅茶カップに置き換える。1:1キャンバスを9:16に拡張する。他はすべて同一のままに。

ここがgpt-image-2の編集エンドポイントの仕事で、DALL·E 3と比べて明確に進化しています。この記事は実務ハンドブックです: マスクの仕組み、インペイントプロンプトに書くべきこと、バリエーションを使うべき場面、コストや特定の強みのためにNano Banana 2にフォールバックすべき場面。Adpictoの編集経路と `IMAGE_EDIT_PROVIDER` 環境変数フラグについても、プロダクションツールの実配線として触れます。

TL;DR

  • インペイント(マスク領域編集): 画像、変更領域を示すマスク、その領域が何になるべきかのプロンプトを送る。gpt-image-2はマスク内のみを再生成し、他はそのまま
  • バリエーション(変更付き再生成): 画像と変更内容のプロンプトを送る。明示的なマスクなしで、モデルが保持する領域を判断。原画像に近い新画像を出力
  • アウトペイント(キャンバス拡張): 拡張すべき領域を透明にした画像を送ると、モデルが原画像と整合する形で埋める
  • マスクの書式: 白 = 編集、黒 = 保持。多くのAPIはアルファチャンネル付きPNGを受け付け、透明ピクセル = 編集、不透明 = 保持
  • AdpictoのProモード(`IMAGE_EDIT_PROVIDER` 環境変数フラグ経由)はマスクベースでgpt-image-2にルーティング可能。標準ティアのデフォルトはコスト理由でNano Banana 2。全ルーティングロジックはマルチモデル戦略記事参照

ピュア生成より画像編集のほうが重要な理由

テキスト→画像のピュア生成は派手なデモです。実際のコンテンツワークフローでは、すでにある画像の編集に最も時間を使います。

  • 商品ショットは完璧。でも背景が来月の季節パレットと合わない。背景を入れ替え、商品は保持
  • チーム写真に5人いて、1人退職した。その人を消して、構図は保持
  • ヒーロー画像が1:1だけど、LP用に16:9が欲しい。主役を保ったままキャンバスを拡張
  • AI生成画像はほぼ正解だけど、マグのロゴが違う。ロゴ領域だけ置き換え、他はすべて保持
ピュアな再生成(「ゼロから新しい画像をプロンプトで」)は遅くて高くて、細かい制御が効きません。編集は精度: 触るべき部分だけ触り、他は残す、が可能になります。

gpt-image-2の編集エンドポイントの仕組み

gpt-image-2はOpenAI Images API経由で主要3編集モードを公開しています。

1. インペイント(マスクベース編集)

最も強力なモード。送信するもの:

  • 入力画像(編集対象の元画像)
  • マスク(多くはPNG。透明または白のピクセルが編集領域を示す)
  • プロンプト(マスク領域が何になるべきか)
マスク領域のみを再生成し、非マスク領域はピクセル安定で保持します。背景入れ替え、オブジェクト置換、特定要素の修正で、他を乱さずに処理できます。

2. バリエーション(誘導付き再生成)

送信するもの:

  • 入力画像
  • 変更内容のプロンプト(任意)
モデルは、記述された変更が適用された、原画像に近い新画像を出します。マスクなしで、モデルが保持領域を判断。セットアップは速いが精度は低い。「20%暖かく」「夕方の雰囲気に」「もっとミニマルに」には向く。「左の靴だけを赤に」には向きません。

3. アウトペイント(キャンバス拡張)

送信するもの:

  • 境界が透明な入力画像(例: 1024 × 1024のオリジナルが1024 × 1920キャンバスの中央に配置され、上下が透明)
  • 拡張領域に何が入るかのプロンプト
モデルは透明領域を原画像と整合する形で埋めます。正方形の商品ショットを9:16ストーリー背景に変換するのに使えます、撮り直しなしで。

マスク書式: 全員がつまずく部分

マスクは大半の人が最初につまずくところ。gpt-image-2の規約(OpenAI Images API全般と同じ)は、知ってしまえば簡単です。

  • 透明(アルファ = 0)= 編集する領域
  • 不透明(アルファ = 255)= 保持する領域
実務的には、マスクはアルファチャンネル付きPNGです。再生成したい部分が透明、保持したい部分が完全不透明。

実務でのマスク作成:

    • 元画像をFigma・Photoshop・アルファ付きPNG書き出しができるツールで開く
    • 画像レイヤーを複製
    • 編集領域を選択(背景、オブジェクト、人物など)
    • 複製レイヤー上で、選択領域以外を消す — 同等に、編集領域だけ透明で、それ以外はすべてソリッドにマスク
    • PNGで書き出し
商品背景入れ替え: 商品を不透明、背景を透明。「この人物を消す」編集: その人物を透明、他全員を不透明。

マスク解像度は重要。マスクは入力画像と同ピクセル寸法にすること。不一致の場合、プロバイダーごとに挙動が未定義 — 拡大するもの、縮小するもの、拒否するものが混在。常に寸法を揃えてください。

インペイント型1: 商品背景の入れ替え

古典的ユースケース: ごちゃごちゃの背景の商品写真を、フィード投稿用にブランドパレットに載せ替える。

ワークフロー:

    • 入力: 商品写真(1024 × 1024)
    • マスク: PNG(1024 × 1024)、商品のシルエットが不透明で、背景が透明
    • プロンプト: "Replace the background with a soft cream linen surface, gentle natural window light from the left, editorial product magazine style, subtle diffused shadow beneath the product. The product itself must not change."
効くフレーズ:
  • "The product itself must not change."(商品自体は変更不可)。gpt-image-2はマスク領域のエッジに編集が染み出すことがあります。この1文で抑制(排除ではない)
  • "Subtle diffused shadow beneath the product."(商品下の微かな拡散影)。影を要求しないと、新背景が下手な切り抜き合成に見えます。影を要求することで被写体が接地します
  • ブランドリファレンスにライティングとパレットを合わせる。ブランドがウォームなテラコッタとクリームを使うなら、クール青背景を出してからグレーディング補正、はNG

インペイント型2: 単一要素の差し替え

例: AI生成ヒーロー画像が完璧。ただ被写体が持つマグに「COFEE」(スペルミス — AIの典型的失敗)と書かれている。マグだけマスクして再生成。

ワークフロー:

    • 入力: ヒーロー画像(1080 × 1350)
    • マスク: マグ領域だけ透明、それ以外すべて不透明のPNG
    • プロンプト: "A plain ceramic cream-colored coffee mug, held in the same position as shown, with no text or typography on it, matching the warm afternoon lighting of the scene."
効くフレーズ:
  • "Held in the same position as shown."(画像と同じ位置で保持されている)。既存の手のポーズを尊重させる
  • "No text or typography on it."(テキスト・タイポグラフィなし)。スペルミスラベルの位置に文字化けを生成させない
  • "Matching the warm afternoon lighting of the scene."(シーンの暖かい午後光に合わせる)。新要素を既存ライティングに接続
この種の単一要素置換は、まさにインペイントが輝く領域。1箇所修正、それ以外は元画像とピクセル同一、です。

バリエーション型: 季節パレットシフト

構図をやり直さずに全体ムードを変えたい場合、バリエーションのほうがマスク編集より速い。

ワークフロー:

    • 入力: 既存ヒーロー画像
    • プロンプト: "Apply a deep winter palette — cool charcoal, deep navy, and soft silver highlights. Keep subjects and composition identical; only the color grading and lighting tone should change."
バリエーションは厳密な編集というより「誘導付き再生成」。原画像に似つつ、記述された変更が適用された画像が得られます。ただし細部はずれる可能性あり。バリエーションを使うべきとき:
  • パレットかムードのシフトであって、特定のオブジェクト変更ではない
  • 変更がグローバル(カラーグレーディング、時刻、季節)
  • コンセプトを反復中で、非ターゲット領域のピクセル完全保持が不要
バリエーションを使うべきでないとき:
  • 特定要素を変更し、他はピクセル安定にしたい
  • 画像にテキストやロゴが含まれ、再生成してはいけない
  • 被写体の正確なポーズや位置が重要

アウトペイント型: ストーリー用に1:1→9:16

美しい1080 × 1080正方形の商品ショットがある。ストーリー用に1080 × 1920の9:16が必要。撮り直さないでください。

ワークフロー:

    • 1080 × 1920の透明キャンバスを作り、中央に1080 × 1080画像を配置
    • 結果: 中央3分の1が原画像、上下3分の1が透明のPNG
    • プロンプト: "Extend the scene vertically, maintaining the same warm-cream linen surface, soft natural window light from the left, and overall editorial mood. Include subtle surrounding context (a small ceramic plate partially visible in the lower third, a faint soft background shadow in the upper third) without competing with the central product. Matching palette."
効くフレーズ:
  • "Extend the scene vertically, maintaining..." 拡張を既存スタイルにアンカー
  • "Without competing with the central product." 拡張領域が第2の焦点にならないよう抑止
  • 具体的な小要素(「一部だけ見える陶器の小皿」)をモデルに与えることで、汎用・空な出力を減らす
アウトペイントは実務で最も撮り直し時間を節約する領域。クロスプラットフォームキャンペーンは必ずリサイズが発生するので、アウトペイントは「9:16必要?」を別仕事から30秒の再生成に格下げします。

gpt-image-2が編集エンジンとして適する場面

gpt-image-2の編集が光るのは:

  • マスクベースの精度が必要。OpenAI Images APIはマスクサポートが一級市民。プロンプトのみの参照アプローチより、モデルはマスク境界を厳密に尊重します
  • 入力に高精度リファレンスがある。gpt-image-2は入力画像を自動で高fidelity処理し、商品ディテール、テクスチャ、細部を編集を通じて保ちます
  • Proティア投稿の編集。キャンペーンの主役、ローンチ告知、プレス画像など、コストより質が勝つ面。そのティアで編集あたりのコストは受容可能
gpt-image-2の編集の制約も知っておくべき:
  • 編集結果の透過出力なし。編集領域が透明であるべき場合(単独商品をアルファ上に)は、後工程で背景除去が必要
  • 対応アスペクト比の範囲がNano Banana 2より狭い。変則的な入力寸法で、編集エンドポイントが時々失敗または暗黙のパディングをする
  • 生成時間は実在する。複雑な編集は30〜90秒。UX設計を合わせる(ストリーミングプレビューあり・フリーズしたスピナーは不可)

Nano Banana 2にルーティングするべき編集

Nano Banana 2(Google `gemini-3.1-flash-image` / Vertex AI)は編集ワークフローを異なる方法で扱います — 明示的マスクよりプロンプトベースの参照に依存。ワークフローによっては強み、他では制約。

編集でNano Banana 2を選ぶ場面:

  • コスト重視のバッチ編集。Nano Banana 2は高品質gpt-image-2の約1/3の1枚コスト。最高品質が不要な50枚バッチ処理ワークフローはここへ
  • 画像内テキストを保持または追加する必要。Nano Banana 2は画像内テキストが明確に優秀、特にCJKスクリプトで。詳細はCJKテキスト描画ガイド参照
  • 4K出力。Nano Banana 2は4Kネイティブティア。編集結果が有料広告やLPヒーローにもなる場合、後処理のアップスケールが不要
  • マスク準備したくないプロンプトベース編集。「もっとミニマルに」「冬の雰囲気に」「シーンに微かな雪を足して」などピクセル精度不要の編集はNano Banana 2で速くセットアップ
Adpictoのアーキテクチャはこれを明示しています: デフォルトの `IMAGE_EDIT_PROVIDER` はコスト理由でNano Banana 2、gpt-image-2はマスクベースのProワークフロー用に環境設定でオプトイン可能。ユーザーからは「編集内容の記述 + 標準 or Proの質を選ぶ」だけで、ルーティングは透過的です。

バリエーション vs インペイント: 選び方

決定木:

  • 変えたい特定領域があり、他はピクセル安定にしたい? → マスク付きインペイント
  • 全体ムード・パレット・時刻を変えていて、特定要素ではない? → バリエーション
  • キャンバス拡張? → アウトペイント(新領域をマスク領域とするインペイント)
  • 「この構図で別のことを試す」探索? → バリエーション、出力をコンセプト起点として扱い、最終ピクセルとしない
迷ったらインペイントから。不要な精度は安く、欠けた精度は再編集代です。

よくある編集の間違い

マスクを緊密にしすぎる。被写体エッジでマスクをぴったり切ると、モデルに編集のブレンド余地がなくなります。マスク周囲に5〜10pxのフェザーを残し、自然なブレンドに。

プロンプトが汎用すぎる。「背景を変えて」は曖昧すぎ。「柔らかなクリームリネン表面、左からの自然な窓光、商品下の微かな拡散影」で実効的。足りないより過剰に具体化してください。

保持するものを記述しない。「The product itself must not change」「Keep the subject's pose and expression identical」がモデルにマスク外境界を尊重させます。

インペイントが必要な場面でバリエーションを使う。バリエーションはドリフト — 「近い感じ」だがピクセル安定ではない結果が得られます。クライアント向け商品作業やブランドに決定的な画像では、常にマスク付きインペイントを優先。

原画像と編集領域のライティングが合っていない。原画像が暖かい午後光でプロンプトが「明るい冷たい朝光」なら、編集領域が衝突します。ソースと整合するライティングを記述。

出力フォーマットを軽視。編集の入力とマスクは、常にターゲット出力と同寸法で書き出し。不一致は暗黙失敗やパディングアーティファクトを生みます。

実務ワークフロー: ECチームの1週間の編集

3人体制のブティック系スキンケアのECチームのワークフロー:

月曜: 計画

  • 今週編集必要な10画像を特定 — 季節パレット用の背景差し替え6本、商品要素置換2本(昨シーズンのモイスチャライザー瓶色を今シーズンへ)、アウトペイント2本(既存1:1ショットをストーリー用9:16に)
火曜: マスク
  • Figmaで8本のマスクを45分で準備(バリエーション2本はマスク不要)。それぞれを寸法一致のアルファ付きPNGで書き出し
水曜: 生成
  • 10本の編集全てをAdpictoのPro編集パスで実行。インペイント編集は各30〜60秒で返り、アウトペイントはやや長め。バリエーションが最速
  • 出力をレビュー。プロンプトに正確に合わなかったものは再実行(10本中1〜2本が2回目で揃う想定)
木曜: タイポ配置 + 出荷
  • 確定した編集をCanvaに投入し、オーバーレイテキスト、最終ブランドタイポのパス、Instagramフィード、ストーリーズ、Facebook、商品ページの正しい寸法で書き出し
合計: 1日集中で1週間分の編集。2023年ならカメラマンによる1週間の撮り直しに相当した量です。これがコンテンツカレンダーの中でどう位置づけられるかは、AI Facebook画像ガイドとビジュアルコンテンツマーケティング戦略を合わせてご覧ください。

1箇所変えたいだけなのに毎回ゼロから再生成するのに疲れた? Adpictoを無料で試す — クレジットカード不要、無料プランで月5枚のAI画像生成。

時間節約は「編集」で起きる

ピュア生成はAI画像ツールを売るパーティートリック。編集はそのスタックに残り続けるワークフローです。マスク、インペイント、アウトペイントに慣れると、実務の時間節約の多くはこのループから来ます。

    • ベース画像を生成(または既存のものを使う)
    • 間違っている1つを編集
    • 出荷
新規生成からのチェリーピックに比べ、編集はピクセルレベルの制御、速い反復、ブランドアセットの一貫再利用を与えます。gpt-image-2はマスクベースの精度で強いデフォルト。Nano Banana 2はバッチとプロンプトベース編集で経済的デフォルト。マルチモデルツールはプランと仕事内容でこれらを自動ルーティングするので、選ぶ必要なし — 編集内容を記述し、インフラに任せる、で済みます。
gpt-image-2 画像編集AI インペイント画像マスクgpt-image-2 バリエーションAI画像ワークフロー2026

関連記事

ハウツー

日英バイリンガルSNS投稿の作り方|インバウンド対応の実務ワークフロー【2026】

日英両対応のSNS運用を現場で回す実務ガイド。キャプション設計、gpt-image-2による画像内テキスト描画、宿泊・小売・飲食の持続可能な週次ワークフローを公開。

ハウツー

ショート動画のコンテンツカレンダーテンプレート|Reels・TikTok・Shorts AI運用【2026】

Reels・TikTok・Shortsの4週間コンテンツカレンダーテンプレート。フック型、シリーズ枠、AI生成の台本とカバーフレームで、燃え尽きずに継続できる運用設計を公開。

ハウツー

中小企業のためのUGC風動画広告|AIで補助・生成はしない運用【2026】

UGC風動画広告をAIで倫理的に作る実務ガイド。AIは台本・キャプション・カバー・字幕焼き込みを補助し、『AIで生成した偽の顧客顔』は使わない。リアルUGCがAIに勝つ場面も正直に。

AdpictoでSNS運用を効率化

AIがSNS投稿を自動作成。今すぐ無料で始めましょう。

無料で始める

クレジットカード不要 · 月5枚まで無料

AdpictoAdpicto

SNS投稿をAIがサポート。サービス・お店の情報を登録したら、投稿ネタの提案から画像作成まで全部おまかせ。

ユースケース

  • 中小企業向け
  • EC向け
  • 飲食店向け
  • 美容室向け
  • 不動産向け
  • フィットネス向け
  • 歯科医院向け
  • カフェ向け
  • ファッション向け
  • ホテル・宿泊業向け
  • 教育機関向け
  • ペット関連向け
  • フリーランス向け
  • フォトグラファー向け
  • 医療機関向け

プラットフォーム

  • Instagram
  • X(Twitter)
  • TikTok
  • Facebook
  • LinkedIn

比較

  • vs Canva
  • vs Buffer
  • vs Later
  • vs Hootsuite
  • vs Adobe Express
  • vs Ocoya
  • vs Predis AI
  • すべての比較を見る →

リソース

  • ブログ
  • ヘルプ
  • お問い合わせ

法的情報

  • 利用規約
  • プライバシーポリシー
  • 特定商取引法に基づく表記

© 2026 Adpicto. All rights reserved.