AI画像生成で日本語・韓国語・中国語の文字を正しく描画する方法【gpt-image-2】
AI画像生成は日本語の文字を正しく描けるのか? gpt-image-2とNano Banana 2で仮名・漢字・ハングル・中国語を確実に描画するプロンプト型、検証チェックリスト、モデル比較を公開。
多くのAI画像生成ツールは、CJK文字(日本語・韓国語・中国語)を今も二級市民扱いしています。英語の「SALE」バッジは問題なく描けるのに、「セ一ル」のように長音記号が「一」(漢数字のいち)に化けていたり、漢字の偏旁が崩れていたりして、ネイティブ話者にだけ刺さる、しかし確実に全ネイティブに刺さるエラーを出します。日本語・韓国語・中国語市場でAIビジュアルを使おうとするブランドにとって、これは軽微な見た目の問題ではなく、信頼の失敗です。
この記事は、gpt-image-2(OpenAIの2026年画像モデル、ChatGPT Images 2.0のエンジン)とGoogleのNano Banana 2(`gemini-3.1-flash-image`)を使って、CJK文字を含む画像を実務で作る方法です。2026年時点でどのモデルがどの文字体系に強いか、効くプロンプト型、出荷前に必ず走らせる検証、そしていつ「AIに描かせる」のをやめて後工程に回すべきかを扱います。
AI画像生成は日本語の文字を正しく描けるか?
短い答え: 条件付きでYes。
- gpt-image-2は2026年4月時点で、短い日本語・韓国語・中国語(通常1〜6文字)を意味のある精度で描画できます。DALL·E 3からの進歩は大きいですが、長さと字形の複雑さが増すと精度が落ちます。画数が多い漢字は、私たちのテストでは15〜25%の出力で失敗します
- Nano Banana 2(Google `gemini-3.1-flash-image`)は、画像内に描画されるCJK文字については、2026年時点でgpt-image-2より安定しています。長い文字列、縦書き日本語、複数行キャプションで特に顕著です。Googleの訓練データが多言語ビジュアルコンテンツを広く含むことが一因です
- どちらのモデルも、視覚検証なしで出荷できるほど信頼性が高くはありません。失敗率は「検証をスキップしたくなる程度には低い」が、「実際にスキップして良い程度には低くない」のです
AI生成CJK文字を出荷する前のチェックリスト
- [ ] 全文字を声に出して(またはネイティブに)読んでもらう
- [ ] 漢字の画数と偏旁を確認 — モデルは「それっぽい」が正しくない漢字を発明します
- [ ] 長音記号(ー vs 一)、小書き仮名(ゃゅょっ)、濁点・半濁点(゛゜)が誤って置換されていないか
- [ ] その文字体系に存在しない文字が発明されていないか
- [ ] 縦書きレイアウト: 句読点と小書き仮名が正しく回転しているか
- [ ] 6文字以上の文字列: 画像はテキストなしで生成し、FigmaやCanvaで後からタイプセットすることを強く推奨
CJK文字がAI画像モデルで難しい理由
英語は26字のアルファベットと比較的単純なグリフを使います。日本語は3つの文字体系を同時に使い — ひらがな、カタカナ、漢字 — 漢字だけでも常用2,000字以上です。韓国語はハングルで、音節ブロックを2〜4要素で組み立てます。中国語は数千文字で、細かな画の差で意味が完全に変わります。
AI画像モデルにとって、これは3つの複合問題に翻訳されます。
- 訓練データの非対称性。公開インターネットには英語のビジュアル+テキストコンテンツが圧倒的に多く、CJKはずっと少ない。モデルは「SALE」を数百万回見て、「ひらがな + 漢字」の組み合わせは数千回見ています。露出量 = 描画精度です
- 画レベルの精度が決定的。英語では「0」と「O」は似ていて文脈で復元可能ですが、漢字では「大」と「太」は点1つの差で、その点が間違うと文脈で復元できません
- 混在スクリプトのレイアウトが標準。日本語キャプション1つに仮名・漢字・英数字・外来語が同時に入り、カーニングと縦位置の規範がラテン系と違います。複数の文字体系を同時にまとめる必要があり、1つだけをきれいに描くより難しいです
gpt-image-2 vs Nano Banana 2 のCJKテキスト: 正直な比較
2026年4月時点、同一プロンプトでの並列テストに基づく比較:
| シナリオ | gpt-image-2 | Nano Banana 2 |
|---|---|---|
| 短い日本語バッジ(仮名1〜3) | 良好(80%+正解) | 非常に良好(90%+正解) |
| 日本語ビジネスフレーズ(4〜8字、仮名+漢字) | 普通(60〜75%) | 良好(80%+) |
| 画像内日本語文(10字以上) | 弱い(30〜50%) | 普通(60〜70%) |
| 縦書き日本語レイアウト | 普通(整列が不安定) | 良好(縦書きをより安定的に処理) |
| 韓国語ハングル短文(1〜5字) | 良好(75〜85%) | 非常に良好(85%+) |
| 韓国語文(10字以上) | 普通 | 良好 |
| 中国語(簡体)短文 | 良好 | 非常に良好 |
| 中国語(繁体)短文 | 普通(簡体・繁体混在あり) | 良好 |
| 画数多の漢字(15画以上) | 普通 | 良好 |
| 手書き風CJK | 弱い | 普通 |
2026年の実務的結論: 画像内に読めるCJK文字が必要で、1モデルを選ぶならNano Banana 2がより信頼できるデフォルトです。gpt-image-2は短いロゴ・バッジ・1〜3字のアクセントでは問題なく、それ以外の強み(参照画像の忠実度、Proティア品質)のために使う価値は十分あります。その場合、画像内テキストは埋め込まず、ポスト処理でタイプセットしてください。
これがまさに、Adpictoのようなツールが両モデルをルーティングする理由です。画像内テキスト要求はデフォルトでNano Banana 2、プレミアムPro要求はgpt-image-2、ユーザーは選択不要です。
プロンプト型1: 短い日本語バッジ(安全ゾーン)
AIに日本語を描かせる最も安全な場所は、1〜4文字の単語バッジ、クリーンなサンセリフ、ソリッド背景の組み合わせです。
テンプレート:
A minimal circular badge on a {background color} background, soft top-left studio light, the single word "{Japanese word}" in clean modern Japanese sans-serif type centered inside the badge, {brand accent color} as a thin border, 1:1 aspect ratio. High contrast, legible typography.
「新作」バッジの記入例:
A minimal circular embossed badge on a warm cream background, soft top-left studio light, the word "新作" in clean modern Japanese sans-serif type centered inside the badge, terracotta as a thin border, 1:1 aspect ratio. High contrast, legible typography.
検証: 「新作」は標準の筆順を持つ2字の漢字。出荷前に両字の構成要素を確認してください。「新」は右に「斤」の偏、「作」は左に「亻」の偏を持ちます。偏旁の欠落や変形が最頻出の失敗モードです。
プロンプト型2: ハングル短文(1〜5字)
ハングルはどちらのモデルでも漢字よりわずかに安定します。音節ブロックの構造規則性が高いためです。それでも、短いほうが安全です。
テンプレート:
A clean graphic poster with the Korean word "{hangul word}" in bold modern sans-serif type, centered composition, {bold color block} background, {accent color} underline beneath the text, high contrast, 4:5 aspect ratio. Legible typography, no additional text.
「세일」(SALE)の記入例:
A clean graphic poster with the Korean word "세일" in bold modern sans-serif type, centered composition, bold deep-red color block background, white underline beneath the text, high contrast, 4:5 aspect ratio. Legible typography, no additional text.
検証: 「세일」は音節ブロック2つで、それぞれクリーンに成立しているべき。よくある失敗: ㅇの円が楕円になる、ㅣが斜めに傾く、存在しない字母(子音・母音)が現れる。
プロンプト型3: 中国語短フレーズ(簡体)
中国語描画は2モデルの差が最も大きい領域です。私たちのテストではNano Banana 2が簡体中国語で明確に優位で、gpt-image-2は同一文字列内で簡体と繁体のグリフを混ぜることがあります。
テンプレート:
A minimal product poster with the Chinese phrase "{simplified Chinese phrase}" in clean modern sans-serif type, centered horizontally, {background description}, soft natural light, {aspect ratio}. Legible typography, no additional text.
「限时促销」(期間限定プロモ)の記入例:
A minimal product poster with the Chinese phrase "限时促销" in clean modern sans-serif type, centered horizontally, warm cream background with a single product silhouette below the text, soft natural light, 4:5 aspect ratio. Legible typography, no additional text.
検証: 4字それぞれをリファレンスと照合。「限」は左に「阝」、「时」は左に「日」、「促」は左に「亻」、「销」は左に「钅」の偏を持ちます。偏の欠落・変形をネイティブは瞬時に見抜きます。
プロンプト型4: 縦書き日本語レイアウト(編集的スタイル)
縦書き日本語は特定の美学です — 編集的な雑誌、商品パッケージ、伝統的ブランディング。両モデルとも対応しますが、信頼性に差があります。
テンプレート:
A minimal editorial photograph with vertical Japanese text "{Japanese phrase}" running top-to-bottom on the right edge of the frame, {subject centered in the frame}, {lighting and style specification}, muted {palette}, {aspect ratio}. The vertical text should use proper Japanese vertical punctuation and small kana orientation.
日本酒ブランドの季節限定ラベル用記入例:
A minimal editorial photograph with vertical Japanese text "冬の限定酒" running top-to-bottom on the right edge of the frame, a single ceramic sake cup centered in the frame, soft natural window light from the left, muted deep-indigo and warm-cream palette, 4:5 aspect ratio. The vertical text should use proper Japanese vertical punctuation and small kana orientation.
検証: 縦書き日本語では、小書き仮名(ゃゅょっ)は行の右上に来るべきで、中央ではありません。長音記号(ー)は90°回転して縦棒になります。「」のような括弧は﹁﹂に切り替わります。AIモデルはこれらの細部で不均衡に高頻度で失敗し、ネイティブは1秒以内に向きの問題に気づきます。
縦書き日本語が重要でAIが信頼できない場合: 背景をクリーンに生成し、縦書き日本語対応のデザインツールで実テキストを組みます(日本語フォントプラグイン入りのFigma、日本語Composerを有効にしたAdobe Illustrator、Canvaの縦書きテキスト機能)。
プロンプト型5: 安全な方法 — 画像はクリーンに、テキストは後工程で
6字を超える場合、または精度が決定的な場合(商標ブランド名、固有名詞、法的表記、商品名)、AIに描かせるのをやめてください。画像はテキストなしで生成し、実テキストを上に乗せます。
テンプレート:
{your image description}, generous empty negative space at {specific location} for overlay text, {aspect ratio}. No text, no typography, no characters anywhere in the image.
飲食店のInstagram投稿で日本語メニュー告知の記入例:
A ceramic bowl of ramen with visible steam on a warm oak wood table, top-down three-quarter angle, soft natural window light from the left, shallow depth of field, muted warm amber and cream color palette, 4:5 aspect ratio. Generous empty negative space in the upper third for overlay text. No text, no typography, no characters anywhere in the image.
その上で「冬季限定ラーメン」をCanva、Figma、Illustratorでブランドの日本語フォントでタイプセット。メリット:
- 文字エラーの可能性ゼロ
- 実ブランドフォントが使える(AIは特定の書体メーカーのタイプフェイスを再現できません)
- カーニング・行間・縦位置が自分のコントロール下
- 法的に重要なテキスト(商標マーク、規制表記)が人間タイプセットで検証済み
それでもAI埋め込みテキストを使う場面
信頼性の懸念があっても、CJK文字をAIに画像内で描かせる正当な場面はあります。
- 装飾的で、文字通りの意味を問わない。テキストが装飾で正確な文字が問題にならない場合(「広いグラフィックの中でスタイリッシュに和風に見える漢字」)、精度の心配は適用外 — ただし偶然に不適切な意味にならないかは確認
- 短いバッジとスタンプ。クリーン背景に1〜4字のバッジはモデルの得意領域。検証は速く、出力は使えます
- プロトタイピングと構想。社内ムードボード、競合分析、迅速なコンセプトテストではAI描画CJKは問題なし。ただし現状出荷は不可
- ロゴ周辺の探索。ロゴやマークを設計中、構図の中で日本語がどう収まるかを探る場合、AIテキストは実デザイナーへのハンドオフ前の出発点として機能します
CJK描画でよくある間違い
長すぎる文字列を要求する。1行6字以上が信頼性が鋭く落ちる分水嶺。短く区切るか、後工程へ。
スクリプトを明示しない。「Japanese text」だけでは、モデルが不確定なときに仮名なしの漢字だけ(中国語のように)描くことがあります。「Japanese text using hiragana and kanji」「Korean text in hangul」と明示して曖昧さを除きます。
初回出力を信じる。AI描画CJKはネイティブが即座に気づく形で失敗します。CJK市場オーディエンスへの出荷前は必ずネイティブリーダーで検証してください。
手書き・筆書き体のCJKを要求する。書道(日本)/ 书法(中国)は印刷体より劇的に難しく、より頻繁に失敗します。雰囲気のみに使い、文字通りの内容には絶対使わない。
小書き仮名と句読点を忘れる。ゃゅょっ は全角版(ヤユヨツ)より小さく、意味が変わります。「」は日本語の引用符で、〝〟や汎用""ではありません。AIモデルはこれらを入れ替えます。
古い訓練データのモデルを使う。2026年以前の画像モデルのテキスト描画は劇的に悪かったです。Midjourney v5やDALL·E 2向けのガイドは歴史的資料として扱ってください。
例: 日本語ブランドのInstagram投稿を出荷する
東京のカフェが日本語の季節ドリンク告知を作るワークフロー。
- 日本語キャプションを先に書く。「秋限定・ほうじ茶ラテ」。句読点含めて10字
- テキスト戦略を決める。10字はAI埋め込みの安全ゾーン外。後工程でタイプセット予定
- 画像を生成。gpt-image-2を使って:
- Figmaで「秋限定・ほうじ茶ラテ」をタイプセット。確保したネガティブスペースに、Noto Sans JP(デジタルに相性良し)などの日本語フォントで
- 検証: ネイティブ読解で文字正確性・誤置換なし・カーニング適切を確認
- 出荷
広いプロンプト設計の文脈はSNS映えするAI画像生成プロンプトの型10選をご覧ください。フルInstagramワークフローでの位置づけは: AIからクリーンな画像、デザイナーから実タイプ、そして出荷。
これからどうなるか
CJK描画は改善を続けます — OpenAIもGoogleも、より多言語ビジュアルデータで次世代モデルを訓練中です。2026年後半には、10字以上の信頼性が現在の短文レベルに近づくと予想されます。それまでの正直なアドバイスは: 画像にはAIを使い、言葉には人間タイプセットを使い、公開前にCJKは全件検証する、です。
日本語・韓国語・中国語オーディエンスへの出荷で、文字エラーと戦うのに疲れましたか? Adpictoを無料で試す — クレジットカード不要、無料プランで月5枚のAI画像生成、スクリプトに最も強いモデルへの自動ルーティング付き。
信頼リスクなしでCJK正確なビジュアルを出荷する
ブランドがCJK市場で信頼を失うのは速いです。AIテキストエラーがすり抜ければ即そうなります。安全に出荷する道筋:
- 短い埋め込みテキスト(1〜4字): gpt-image-2・Nano Banana 2どちらも可。ネイティブ検証を併用
- 中文字数(5〜8字): Nano Banana 2を優先、全字検証
- 長文(9字以上)、縦書きレイアウト、またはブランドに決定的なコピー: 画像はクリーン生成、Canva/Figma/Illustratorで適切なCJKフォントを使ってタイプセット
- 常時: 公開前のネイティブスピーカー検証
関連記事
日英バイリンガルSNS投稿の作り方|インバウンド対応の実務ワークフロー【2026】
日英両対応のSNS運用を現場で回す実務ガイド。キャプション設計、gpt-image-2による画像内テキスト描画、宿泊・小売・飲食の持続可能な週次ワークフローを公開。
ショート動画のコンテンツカレンダーテンプレート|Reels・TikTok・Shorts AI運用【2026】
Reels・TikTok・Shortsの4週間コンテンツカレンダーテンプレート。フック型、シリーズ枠、AI生成の台本とカバーフレームで、燃え尽きずに継続できる運用設計を公開。
中小企業のためのUGC風動画広告|AIで補助・生成はしない運用【2026】
UGC風動画広告をAIで倫理的に作る実務ガイド。AIは台本・キャプション・カバー・字幕焼き込みを補助し、『AIで生成した偽の顧客顔』は使わない。リアルUGCがAIに勝つ場面も正直に。