生成AIで資料作成、なぜまだ微妙なのか【AI資料 #1】
Copilot、Gemini、Claude、Gamma…全部試して見えた「なぜAIの資料はそのまま使えないのか」。現場で実際に起きている7つの問題を、具体的なケースとともに整理します。
エンジニアのゆとです。
「生成AIで資料作成が爆速になる」って話、もう2年くらい聞いてる気がします。でも実際に使ってみると、「惜しい…あと一歩なんだけど…」 って感想になる人、多くないですか?
自分もそうでした。Copilotに$30/月払って、Gammaも試して、Claudeでスライドも作ってみた。どのツールも「生成」はできる。でも「そのまま使える」にはならない。一番AIにやってほしい「資料を整える作業」を、結局自分がちみちみとやっている始末。たまにその非効率な時間に発狂しそうになりながら、果たしてこの苦悩はいつ終止符を打たれるのだろうかと遠い目になってしまう。
この記事では、主要ツールを一通り試した上で見えてきた 「なぜ微妙なのか」の現場レベルの原因7つ を、実際に起きているケースとともに整理します。
具体的なツール比較と「じゃあどうすればいいのか」は、シリーズ#2にまとめています。

2026年3月、AI資料作成の現在地
AI資料作成ツールの市場は2025年に約20億ドル規模に達し、年25.7%で成長している(Research and Markets, 2025年レポート)。2029年には47.9億ドルに達する見込み。15枚のスライドを1分以内に生成する技術は既にある。
問題は「生成された資料がそのまま使えるか」であり、答えは今のところ「まだNo」です。
ある欧州の銀行ではCopilotを42人に導入して6週間後、利用率がわずか8%まで落ちた。スタンフォード大学の調査では、AI生成の資料を受け取った側の42%が「信頼性が低い」、37%が「送り手の能力が劣る」と評価している。
「生成は速い。でもそのまま使えない。直す時間を考えると…」これが多くのビジネスパーソンの正直な感想です。
先月、自分の身に起きたこと
先月、クライアント向けのSaaS比較資料をCopilotで作った。プロンプトは手を抜いていない。ペルソナ、訴求ポイント、スライドの構成案、トンマナ指定まで全部書いて渡した。テキスト生成は確かに速い。15分で10枚のスライドが出てきた。内容もそこそこ悪くない。
問題はその先。
比較表のカラムが1列だけ微妙に広い。直そうとプロンプトを追加したら、今度は別の列のテキストがセルからはみ出した。「ここだけ直して、他は触らないで」が通じない。CSSで言えば !important を連打しているような気持ちの悪さ。
次に、グラフの凡例位置。右に寄せたいだけなのに、指示するたびにグラフ全体のサイズが変わる。1箇所直すと別の箇所が崩れる。まるでモグラ叩き。
5往復目で悟った。「ここから先は自分でやったほうが早い」。
結果: 生成15分 → 微調整の沼2時間半。エンジニアとしてプロンプト設計にはそれなりに自信があったのに、この有様。友人(同じくエンジニア)に話したら「それ俺も」と即答された。わかってる人間がちゃんとやっても、この壁にぶつかる。それが2026年3月の現在地。
この悔しさをバネに「じゃあうまくいっている人はどうやっているのか」を徹底的に調べた結果が#2にまとまっています。

現場で実際に起きている7つの問題
そもそも「何を作りたいか」が整理できていない
AI資料作成の最大のボトルネックは、ツールの性能ではない。「自分の頭の中が整理されていないまま、AIに丸投げしてしまう」こと。
「営業資料を作って」「DX推進の提案書をお願い」。こう指示する人が非常に多い。でもAIに伝えるべきは「誰に」「何を」「なぜ」「どの順序で」見せたいか。その整理ができていない段階でAIに投げても、当然ぼんやりした出力しか返ってこない。
パワポ歴20年のサイトウケイコ氏の言葉が的確: 「自分で作りたい資料の案がガチガチにあるなら、自分で手を動かしたほうが早い。逆に漠然としているなら、AIに投げても漠然としたものが返ってくるだけ」。
さらにCopilot for PowerPointのプロンプトは2,000文字制限。Microsoft Q&Aではこの制限に対して「a joke」「AWFUL」という声が並ぶ。ビジネス資料の要件を2,000文字で伝えきれるわけがない。
つまり問題の本質は「AIツールの性能」ではなく「使う側の準備不足」。でもその「準備」を手助けしてくれるツールがほとんどないのが現状。
会社のテンプレ・トンマナから勝手にズレていく
「Copilotが作ったスライド、色もフォントも全部うちのガイドラインと違う」。これは最も多い不満の1つ。
Copilotはデフォルトでいつもの青+Calibriフォント。企業テンプレートを読み込ませても無視されることが多い。結局こうなる: 重要なプレゼン前夜に「テキストがチャートに重なってる」「ロゴ位置ズレてる」「見出しのフォントサイズ勝手に変わってる」を深夜まで手作業で直す羽目になる。 Copilotスライドの修正に2〜4時間かかるのは珍しくない。
コンサル・SI・金融のように資料フォーマットが厳格な業界では、結局「自分で作ったほうが早い」という結論に至っている始末。ブランドガイドラインの「行間はNoto Sans JP、見出しは28pt太字、アクセントカラーは#1a73e8」を100%守れるツールは、現時点でゼロ。
Gammaはもっと分かりやすくズレる。デザインが「いかにも海外」で、ビビッドなピンクや原色系の配色は日本のビジネスシーンでは明らかに浮く。room8のレビューでは「プリキュアっぽい」と表現されていた。
AIが勝手に数字を作る・間違える
ここが一番怖い。Copilotのデータ可視化精度テスト結果:
| データ複雑度 | 正確率 |
|---|---|
| 単純(4列以下) | 87% |
| 中程度(4〜8列) | 52% |
| 複雑(8列以上) | 18% |
複雑なデータになるほど使い物にならない。さらにAIが生成する統計データの41%は完全な捏造、47%は検証不能というテスト結果もある。
実際に「社内会議資料にAI出力の調査結果を引用したら、存在しない統計データが入っていた」なんてこともざらにある。ChatGPTで調べた商品名が実在しなかった、出典URLを付けてくれたと思ったらリンク切れだった、というのも珍しくない。
経営会議で「このグラフの数字、どこから?」と聞かれて「生成AIが出しました」「参照元は知りません」は無能扱い待ったなし。
「AIで作った」が見抜かれる、言えない
ダイヤモンド・オンラインで報じられた実話: 営業課のA氏(25歳)がAIで資料を作成。専務がベタ褒め。喜んだA氏が「実はAIで作りました」と種明かし。ところが、企業秘密(取引先名・契約金額・未発表新製品)を無料AIに入力していたことが発覚し、専務がブチギレ。
情報漏洩のリスクとは別に、AIの文章は一目でバレる。KDDIのコラムでも指摘されているように、AI生成テキストは「フォーマルすぎる」「回りくどい長文」「ありきたりな定型表現の繰り返し」で読む人が読めば一発でバレる。
BetterUp Labs × Stanford Social Media Labの共同調査(n=1,150、2025年9月)では、AI生成の成果物を受け取った側の42%が「信頼性が低い」、37%が「送り手の能力が劣る」と評価している。「ワークスロップ(workslop)」というAI生成の低質成果物を指す造語まで生まれた。

workslop 1件あたり平均1時間56分の対応コスト、従業員1人あたり月186ドルの生産性ロス。 1万人規模の企業では年間900万ドル以上の見えない損失。AIで「速くなった」はずが、組織全体で見るとコストが増えているケースがある。
PPTX書き出しで全部壊れる
特にGammaで深刻。「PPTX書き出しすると必ず壊れる」というレビューが複数。
具体的に起こること:
- チャートの位置ズレ
- フォント置換(日本語フォントが特に危険)
- アニメーション消失
- レイアウトの崩壊
Webプレゼンのままなら綺麗。でもビジネスの現場では「PowerPointで送ってください」が依然として標準。
2025年3月に2,000万ユーザーを抱えていたTomeがプレゼン機能を終了したのも同じ理由。PPTXエクスポートを実装しなかった。 独自フォーマットにこだわった結果、ビジネスの現場で使えなかった。ARRは$4M以下。
Gammaもこの教訓を無視すると同じ道を辿る可能性がある。
日本語にした瞬間、レイアウトが崩壊する
英語で作った資料は綺麗なのに、日本語にするとレイアウトが崩れる。Beautiful.aiの非英語サポートは5段階中2。

根本的な原因は、AI資料作成ツールのほとんどが英語圏で開発されていること。日本語は1文字あたりの幅が英語より大きい、改行ルールが違う、敬語のレベル感がある、業界用語が通じない。
ChatGPTは内部的に英語で考えてから日本語に翻訳する構造のため、微妙なニュアンスが失われる。「甚大なる感謝を申し上げます」レベルの大袈裟な敬語が出てきたり、業界用語を一般的な言い回しに「翻訳」してしまったりする。
日本語環境で使えるAI資料作成ツールは、選択肢が大幅に狭まる。 国産の「イルシル」は日本語特化で上場企業1,300社以上が利用しているが、海外ツールほどのAI性能はまだない。
「生成→がっかり→やり直し」の無限ループ
ユーザーが最も消耗するパターン。
1回目の出力に「微妙…」と感じる → プロンプトを変えて再生成 → また微妙 → 情報を足して再生成 → 情報量が増えてAIが混乱 → さらに微妙に…
Microsoft Q&Aでの声: 「45分の作業に2時間を無駄にした」。 これは個人の愚痴ではない。winningpresentations.comの検証によると、適切なセットアップなしでCopilotを使った場合の成功率はわずか23%。適切なテンプレートとプロンプトを設定した場合は91%まで上がるが、ほとんどのユーザーはそのセットアップをしていない。

Qiitaで7つの手法をテストした検証では、最高77点/100、最低47点/100。「5枚で」と指定しても9〜11枚出てくる。ルール無視も頻発。
このループの根本原因は「AIに何を求めているか」が言語化できていないこと。しかし逆に、自分の中で完璧に言語化できているなら手作業のほうが早い。このジレンマが「AI資料作成は微妙」という感覚の正体。
モデルごとの得意・不得意
ツールの裏で動いているAIモデルによって、出力の質はかなり変わる。
| 観点 | GPT-4o / GPT-5 | Claude Opus 4.6 | Gemini 2.5 Pro |
|---|---|---|---|
| テキスト品質 | マーケティング調になりがち | 最も自然で構造的 | 情報量は多いが冗長 |
| コード生成 | そこそこ | HTML/CSS/SVGが最強 | コード生成は弱め |
| コンテキスト | 128K〜400K | 200K | 1M(圧倒的) |
| 速度 | 最速 | 最も遅い(特にOpus) | GPTに近い |
| ブランド準拠 | 精度が低い | スタイルガイド準拠が最も正確 | 逸脱しやすい |
| 画像生成 | DALL-E 3内蔵で最強 | 画像生成なし | Imagen 3対応 |
実務的に言えば:
- スライドのテキスト内容の質を最重視 → Claude Opus
- 大量のソース資料からまとめたい → Gemini(1Mトークン)
- スライドに画像やイラストも同時生成したい → GPT-4o / GPT-5

各社はこの問題にどう対応しようとしているか
Microsoft — 「Agent Mode」で自律実行
Agent Modeは生成→自己評価→修正→再確認のループを自律的に回す。従来の「1回生成して終わり」から「AIが自分でチェックして直す」への転換。Office Agentは、PowerPointの「ヘッドレス版」を使って完全なフォーマット互換を実現しようとしている。
Anthropic — 「アプリ横断」で実務フロー統合
Claude Cowork(2026年1月ローンチ)で、Excelで分析→そのままPowerPointに反映、のようなアプリ間ワークフローを実現。スライドマスターを事前に読み取る仕組みで、ブランド準拠の精度を上げている。
Google — 「大量ソース統合」で差別化
Gemini Deep ResearchがGmail、Drive、Docsを横断検索。1Mトークンのコンテキストウィンドウで社内の膨大な情報から必要な部分だけ抽出して資料に落とし込む。
Gamma — 「AIネイティブフォーマット」で独自路線
Gamma Agentがリサーチ→引用→生成→リファインを1ループで実行。Generate APIで外部連携も可能に。ただしPPTX互換は依然として最大の課題。
今できること、できないこと、次に来る変革
今できること(2026年3月)
- 構成案(アウトライン)の即座生成
- テキストのドラフト作成・リライト・要約
- シンプルなチャート・図の自動生成
- 既存資料の要約・スライド化
- Webプレゼン形式での高品質デザイン(Gamma)
- ネイティブPPTXオブジェクトの生成(Claude in PPT)
- 社内データを参照した資料生成(Copilot)
まだできないこと
- ブランドガイドラインの完全自動準拠
- 複雑なデータセットの正確な可視化
- 聴衆・文脈に合わせた戦略的な構成判断
- PPTXエクスポートの完全互換(特にGamma)
- 日本語CJKレイアウトの完璧な処理
- 「AIっぽさ」のないデザイン差別化
次に来る変革(12〜18ヶ月以内)
- Agent Modeの標準化 — 「この会議メモから資料作って」で完成品が出る体験がベースラインに
- アプリ横断ワークフロー — Excel→PPT、CRM→提案書が1コマンドで繋がる
- 音声→資料パイプライン — 散歩中に口述→オフィスに着いたら資料完成
- デザインシステムの機械可読化 — ブランドガイドラインをAIが直接参照できる形式で管理する企業が増える
まとめ: 問題の本質は「生成」の先にある
AI資料作成が「微妙」な原因は、生成技術の問題だけではない。資料作成という行為の本質が「文字とグラフを並べる作業」ではなく「聴衆に伝わる構成を設計する仕事」だから。
AIが得意な「パターンから平均的な出力を生成する」は、資料作成の前半(下書き・テキスト生成)には有効。でも後半(聴衆に合わせた調整・ブランド準拠・ストーリー設計)はまだ人間の領域。
12〜18ヶ月後にはAgent Modeが標準化し、前半部分はさらに速くなる。でも「この聴衆にはこう見せたい」という判断だけは、当面は人間の仕事として残り続ける。
じゃあ現時点で、これらの問題を踏まえた上でどう資料を作るのが最適なのか? 実際にうまくいっている人たちの具体的なやり方を、次の記事で整理しました。
