気づき・雑記

【完全保存版】NotebookLM × Nano Banana Proで実現する「5分」プレゼン動画の自動化ワークフロー

2025.11.28

Googleが放った衝撃のアップデート、NotebookLMの「ソースからスライドを作成（Source-to-Slides）」機能。

その内部で稼働する最新画像生成モデル「Nano Banana Pro（Gemini 3 Pro Image）」が叩き出すスライドのクオリティは、まさに「破壊的」の一言に尽きる。

プレゼンスライドはほぼ修正するところがないような感じ。

日本語の資料であっても、人間が丸一日かけてデザイン調整したレベルの成果物を、AIはわずか数十分で出力してしまう。

しかし、ここで我々クリエイターやビジネスパーソンには一つの疑問が浮かぶ。

「この美しい『静止画』を、どうやって最短ルートで『動画』に変換するか？」

静止画のスライドは、誰かが喋らなければ意味をなさない。しかし、自分で録音するのは手間だ。AIに喋らせたい。しかも全自動で。

今回、私は海外の先行ユーザー（Early Adopters）たちが構築しつつあるワークフローを徹底調査し、自らの手で検証を行った。その過程で直面した数々の「壁」と、それを突破して「作業時間わずか5分」で動画作成までできるように。

ただし、日本語の音声出力はまだ実用的に放ってない感じ。

1. 世界のコンテンツクリエイターたちは「スライド動画化」にどう挑んでいるのか？

まず、この新しい波に乗る海外勢の動向を調査した。彼らはNotebookLMを単なる「メモ帳」とは見ていない。「コンテンツ生成の頭脳（Brain）」として扱っている。

NotebookLMは、膨大な資料を読み込み、構成を練り（脚本）、視覚化する（スライド生成）能力には長けている。しかし、それを「動画」として出力する機能（身体機能）はまだ未成熟だ。ネイティブ機能の「動画の概要（Video Overview）」もあるが、編集ができないブラックボックス仕様であり、ビジネス現場での実用性には欠ける。

そこで彼らが編み出したのが、「NotebookLMで素材を作り、外部ツール連携」というハイブリッド・パイプラインだ。具体的には、以下の2つの要素をいかにシームレスに結合させるかが競争の焦点となっていた。

ビジュアル（Visual）： Nano Banana Proが生成した、デザイン性の高いスライド画像。

スクリプト（Script）： 各スライドの内容を説明する、論理的なスピーカーノート。

「なるほど、画像とテキストさえ分離して抽出できれば、OKか」

そう確信した私は、早速自分の環境で検証を開始した。だが、そこには既存ツールの限界というハードルが待っていた。

2. 既存ツールそのまんま：PDF変換の「文字化け」と「作業の泥沼」

NotebookLMから出力される成果物はPDF形式である。これを動画編集ツール（Google VidsやPremiereなど）で扱うためには、編集可能な形式に変換するか、画像として切り出す必要がある。

失敗その1：PDF変換ツールの限界

まず試したのは、定番の「iLovePDF」やAdobe Acrobatを使い、PDFをPowerPoint形式（.pptx）に変換する王道ルートだ。

結果は惨敗だった。

Nano Banana Proが生成するリッチなデザイン、複雑なレイアウト、そして日本語フォント。これらが一部文字化け。例え5％でもあればその資料は使えない。AIが作ったデザインを維持するには、PDFのベクターデータを解析する従来の手法では通用しない。

失敗その2：画像貼り付けの苦行（マニュアル作業）

「ならば、デザインを維持するために画像化しよう」

PDFをJPG画像に変換すること自体は簡単。画質も100%維持される。しかし、その後に待っていたのは「めんどくさすぎる作業」だった。

15枚のスライド画像を、Googleスライドの各ページに一枚一枚貼り付け、サイズを調整する。1枚ならいい。だが15枚、30枚となると、これはもはやクリエイティブな作業ではない。AIで時間を短縮したはずが、コピペ作業で浪費しては本末転倒だ。意味なし。

失敗その3：頼みの綱「拡張機能」の消失

かつて、Googleドライブ内の画像を自動でスライド化してくれる「DriveSlides」という神のようなChrome拡張機能が存在した。これさえあれば解決だ、と思い検索をかけたが、結果は残酷だった。

「Chromeウェブストアから削除済み」。

利用規約の変更か、開発者の都合か、かつての王道ルートは閉ざされていた。既存の「楽な方法」は、ここで全滅したのである。どうしようかな。

3. 突破口：AI Studio (Gemini Build) で「自作ツール」を生み出す

既存の道がないなら、道を作るしかない。私はGoogleのAI Studio（Gemini Build環境）を開き、AI自身にこの問題を解決させるツール（スクリプト）の開発を指示した。要件は以下の通りだ。

入力： NotebookLMが出力したPDFをアップロード。

処理A（画質保存）： 各スライドページを「背景画像jpg」としてスライドに配置すること。テキストボックスとして解析するから崩れるのだ。画像として貼り付ければ、Nano Banana Proの画質は1ピクセルたりとも損なわれない。あたりまえ。

処理B（魂の注入）： 画像だけでは動画にならない。スライドの内容を解析し、プレゼンテーション用の「スピーカーノート（台本）」をAIに自動生成させ、所定の欄（全てのスライド）に埋め込むこと。

結果、これが大正解となった。

※シェアURLは記事下に記載

AI Studioで生成したスクリプトは、画質を完全に維持したスライドと、それに同期した完璧な台本を持つPPTXファイルを一瞬で出力してくれた。もし台本のニュアンスを変えたい場合でも、GAS（Google Apps Script）と連携させれば一括修正も容易だ。

これで「最高画質のビジュアル」と「AIによる脚本」が揃った。準備は整った。

4. 最後の落とし穴：Google Vidsの「沈黙」と言語設定の罠

これを一度Googleスライドに読み込ませてスピーカーノートまで表示させる。

完成したスライド（スピーカーノート付き）を、Googleの次世代動画作成ツール**「Google Vids」にインポートする。

Google Vidsには「スライドをインポート（Import Slides）」**という強力な機能があり、スライド上のスピーカーノートを自動的に読み込み、動画のスクリプトとして認識してくれるはずだ。

インポートは成功した。画面右側のスクリプト欄には、確かにテキストが入っている。

しかし、再生ボタンを押しても無音。

画面をくまなく探した。「Text-to-Speech」「Generate Voiceover」……あるはずのボタンが見当たらない。自分の声をマイクで録音するボタンはあるが、AIに読ませる機能だけが神隠しにあったかのように消えている。

「まさか、日本語テキストだから対応していないのか？」

ではなく、、、、

原因：Google Workspaceの「言語設定」

調査の結果、判明した原因はあまりに単純で、かつ多くの日本ユーザーが陥る盲点だった。

「Google VidsのAI音声生成機能（Help me create / AI Voiceover）は、現時点では日本語環境（UI設定）において制限、あるいは非表示になっている」

要するに表示こそされてないが

「その機能はまだ日本語ユーザーには解放されていません」

機能自体が存在しないのではなく、「あなたの言語設定ではまだ見せません」という状態だったのだ。

解決策：プランB発動（English Mode）

私はGoogleアカウントの設定（myaccount.google.com）を開き、使用言語を**「English (United States)」に変更した。

ブラウザをリロードし、再度Google Vidsを開く。するとどうだ。さっきまで空白だった場所に、「Generate Voiceover」**のボタンがみつかる！

ボタンを押す。数秒の処理の後、タイムラインに波形が現れた。

再生する。

AIが（だーいぶ、訛りのイントネーションではあるが）日本語のスピーカーノートを読み上げ始めた。ついに、静止画だったスライドに「声」という命が宿った瞬間だ。

まあ、今回はここまで

20個

twenty 個とか言い出す始末。。。

この音声はまあ、今現在なら合成音声を手動アップロードするか・自分で話すか・Googleが対応してくれるまで待つか・・・そんな感じ。

5. 結論：これが「5分」で動画を作る最短ワークフローだ

長い旅だったが、確立されたワークフローは驚くほどシンプルで、再現性が高い。

NotebookLMでスライド生成：

資料をアップロードし、Nano Banana Proの力でPDFスライドを作成する。

自作ツール（AI Studio/GAS）で変換：

PDFを画像化し、スピーカーノート付きのPPTX/Googleスライドに変換する。（※ここを自動化するのが肝だ）

Googleスライドとして保存：

Googleドライブ上でスライドを開き、内容を確認。

言語設定を「英語」に変更：

ここが最大のキモだ。Googleアカウントの言語をEnglishに切り替える。

Google Vidsで動画化：

Vidsを開き、スライドをインポート。「Generate Voiceover」ボタンを押し、AI音声を生成する。

この手順であれば、慣れれば実質5分で完結する。

音声のイントネーションにはまだ課題が残るものの、外部の音声合成ツール（ElevenLabsなど）を使えばクオリティはさらに跳ね上がるだろう。

重要なのは、「人間が1日かかるレベルのスライド作成」から「動画化」までを、AIの力を借りて個人が数分で完遂できる未来が、すでに手の中にあったということだ。

壁にぶつかり、ツールを作り、言語設定の罠を越えた先に待っていたのは、圧倒的な生産性の革命だった。

やってみるとすぐできて意外に面白い。

やってみてね。

作成したツールはこちら

https://ai.studio/apps/drive/16iixo5D1-PVz2WMYJ1r7AOWpiAqvRrlI?fullscreenApplet=true

【完全保存版】NotebookLM × Nano Banana Proで実現する「5分」プレゼン動画の自動化ワークフロー

1. 世界のコンテンツクリエイターたちは「スライド動画化」にどう挑んでいるのか？

2. 既存ツールそのまんま：PDF変換の「文字化け」と「作業の泥沼」

失敗その1：PDF変換ツールの限界

失敗その2：画像貼り付けの苦行（マニュアル作業）

失敗その3：頼みの綱「拡張機能」の消失

3. 突破口：AI Studio (Gemini Build) で「自作ツール」を生み出す

4. 最後の落とし穴：Google Vidsの「沈黙」と言語設定の罠

原因：Google Workspaceの「言語設定」

解決策：プランB発動（English Mode）

5. 結論：これが「5分」で動画を作る最短ワークフローだ

関連

コメント

【完全保存版】NotebookLM × Nano Banana Proで実現する「5分」プレゼン動画の自動化ワークフロー

1. 世界のコンテンツクリエイターたちは「スライド動画化」にどう挑んでいるのか？

2. 既存ツールそのまんま：PDF変換の「文字化け」と「作業の泥沼」

失敗その1：PDF変換ツールの限界

失敗その2：画像貼り付けの苦行（マニュアル作業）

失敗その3：頼みの綱「拡張機能」の消失

3. 突破口：AI Studio (Gemini Build) で「自作ツール」を生み出す

4. 最後の落とし穴：Google Vidsの「沈黙」と言語設定の罠

原因：Google Workspaceの「言語設定」

解決策：プランB発動（English Mode）

5. 結論：これが「5分」で動画を作る最短ワークフローだ

共有:

関連

コメント