【完全保存版】NotebookLM × Nano Banana Proで実現する「5分」プレゼン動画の自動化ワークフロー

Googleが放った衝撃のアップデート、NotebookLMの「ソースからスライドを作成(Source-to-Slides)」機能。

その内部で稼働する最新画像生成モデル「Nano Banana Pro(Gemini 3 Pro Image)」が叩き出すスライドのクオリティは、まさに「破壊的」の一言に尽きる。

プレゼンスライドはほぼ修正するところがないような感じ。

日本語の資料であっても、人間が丸一日かけてデザイン調整したレベルの成果物を、AIはわずか数十分で出力してしまう。

しかし、ここで我々クリエイターやビジネスパーソンには一つの疑問が浮かぶ。

「この美しい『静止画』を、どうやって最短ルートで『動画』に変換するか?」

静止画のスライドは、誰かが喋らなければ意味をなさない。しかし、自分で録音するのは手間だ。AIに喋らせたい。しかも全自動で。

今回、私は海外の先行ユーザー(Early Adopters)たちが構築しつつあるワークフローを徹底調査し、自らの手で検証を行った。その過程で直面した数々の「壁」と、それを突破して「作業時間わずか5分」で動画作成までできるように。

ただし、日本語の音声出力はまだ実用的に放ってない感じ。


1. 世界のコンテンツクリエイターたちは「スライド動画化」にどう挑んでいるのか?

まず、この新しい波に乗る海外勢の動向を調査した。彼らはNotebookLMを単なる「メモ帳」とは見ていない。「コンテンツ生成の頭脳(Brain)」として扱っている。

NotebookLMは、膨大な資料を読み込み、構成を練り(脚本)、視覚化する(スライド生成)能力には長けている。しかし、それを「動画」として出力する機能(身体機能)はまだ未成熟だ。ネイティブ機能の「動画の概要(Video Overview)」もあるが、編集ができないブラックボックス仕様であり、ビジネス現場での実用性には欠ける。

そこで彼らが編み出したのが、「NotebookLMで素材を作り、外部ツール連携」というハイブリッド・パイプラインだ。具体的には、以下の2つの要素をいかにシームレスに結合させるかが競争の焦点となっていた。

  1. ビジュアル(Visual): Nano Banana Proが生成した、デザイン性の高いスライド画像。

  2. スクリプト(Script): 各スライドの内容を説明する、論理的なスピーカーノート。

「なるほど、画像とテキストさえ分離して抽出できれば、OKか」

そう確信した私は、早速自分の環境で検証を開始した。だが、そこには既存ツールの限界というハードルが待っていた。


2. 既存ツールそのまんま:PDF変換の「文字化け」と「作業の泥沼」

NotebookLMから出力される成果物はPDF形式である。これを動画編集ツール(Google VidsやPremiereなど)で扱うためには、編集可能な形式に変換するか、画像として切り出す必要がある。

失敗その1:PDF変換ツールの限界

まず試したのは、定番の「iLovePDF」やAdobe Acrobatを使い、PDFをPowerPoint形式(.pptx)に変換する王道ルートだ。

結果は惨敗だった。

Nano Banana Proが生成するリッチなデザイン、複雑なレイアウト、そして日本語フォント。これらが一部文字化け。例え5%でもあればその資料は使えない。AIが作ったデザインを維持するには、PDFのベクターデータを解析する従来の手法では通用しない。

失敗その2:画像貼り付けの苦行(マニュアル作業)

「ならば、デザインを維持するために画像化しよう」

PDFをJPG画像に変換すること自体は簡単。画質も100%維持される。しかし、その後に待っていたのは「めんどくさすぎる作業」だった。

15枚のスライド画像を、Googleスライドの各ページに一枚一枚貼り付け、サイズを調整する。1枚ならいい。だが15枚、30枚となると、これはもはやクリエイティブな作業ではない。AIで時間を短縮したはずが、コピペ作業で浪費しては本末転倒だ。意味なし。

失敗その3:頼みの綱「拡張機能」の消失

かつて、Googleドライブ内の画像を自動でスライド化してくれる「DriveSlides」という神のようなChrome拡張機能が存在した。これさえあれば解決だ、と思い検索をかけたが、結果は残酷だった。

「Chromeウェブストアから削除済み」。

利用規約の変更か、開発者の都合か、かつての王道ルートは閉ざされていた。既存の「楽な方法」は、ここで全滅したのである。どうしようかな。


3. 突破口:AI Studio (Gemini Build) で「自作ツール」を生み出す

既存の道がないなら、道を作るしかない。私はGoogleのAI Studio(Gemini Build環境)を開き、AI自身にこの問題を解決させるツール(スクリプト)の開発を指示した。要件は以下の通りだ。

  1. 入力: NotebookLMが出力したPDFをアップロード。

  2. 処理A(画質保存): 各スライドページを「背景画像jpg」としてスライドに配置すること。テキストボックスとして解析するから崩れるのだ。画像として貼り付ければ、Nano Banana Proの画質は1ピクセルたりとも損なわれない。あたりまえ。

  3. 処理B(魂の注入): 画像だけでは動画にならない。スライドの内容を解析し、プレゼンテーション用の「スピーカーノート(台本)」をAIに自動生成させ、所定の欄(全てのスライド)に埋め込むこと。

結果、これが大正解となった。

※シェアURLは記事下に記載

AI Studioで生成したスクリプトは、画質を完全に維持したスライドと、それに同期した完璧な台本を持つPPTXファイルを一瞬で出力してくれた。もし台本のニュアンスを変えたい場合でも、GAS(Google Apps Script)と連携させれば一括修正も容易だ。

これで「最高画質のビジュアル」と「AIによる脚本」が揃った。準備は整った。


4. 最後の落とし穴:Google Vidsの「沈黙」と言語設定の罠

これを一度Googleスライドに読み込ませてスピーカーノートまで表示させる。

完成したスライド(スピーカーノート付き)を、Googleの次世代動画作成ツール**「Google Vids」にインポートする。

Google Vidsには「スライドをインポート(Import Slides)」**という強力な機能があり、スライド上のスピーカーノートを自動的に読み込み、動画のスクリプトとして認識してくれるはずだ。

インポートは成功した。画面右側のスクリプト欄には、確かにテキストが入っている。

しかし、再生ボタンを押しても無音。

画面をくまなく探した。「Text-to-Speech」「Generate Voiceover」……あるはずのボタンが見当たらない。自分の声をマイクで録音するボタンはあるが、AIに読ませる機能だけが神隠しにあったかのように消えている。

「まさか、日本語テキストだから対応していないのか?」

ではなく、、、、

原因:Google Workspaceの「言語設定」

調査の結果、判明した原因はあまりに単純で、かつ多くの日本ユーザーが陥る盲点だった。

「Google VidsのAI音声生成機能(Help me create / AI Voiceover)は、現時点では日本語環境(UI設定)において制限、あるいは非表示になっている」

要するに表示こそされてないが

「その機能はまだ日本語ユーザーには解放されていません」

機能自体が存在しないのではなく、「あなたの言語設定ではまだ見せません」という状態だったのだ。

解決策:プランB発動(English Mode)

私はGoogleアカウントの設定(myaccount.google.com)を開き、使用言語を**「English (United States)」に変更した。

ブラウザをリロードし、再度Google Vidsを開く。するとどうだ。さっきまで空白だった場所に、「Generate Voiceover」**のボタンがみつかる!

ボタンを押す。数秒の処理の後、タイムラインに波形が現れた。

再生する。

AIが(だーいぶ、訛りのイントネーションではあるが)日本語のスピーカーノートを読み上げ始めた。ついに、静止画だったスライドに「声」という命が宿った瞬間だ。

まあ、今回はここまで

20個

twenty 個とか言い出す始末。。。

この音声はまあ、今現在なら合成音声を手動アップロードするか・自分で話すか・Googleが対応してくれるまで待つか・・・そんな感じ。


5. 結論:これが「5分」で動画を作る最短ワークフローだ

長い旅だったが、確立されたワークフローは驚くほどシンプルで、再現性が高い。

  1. NotebookLMでスライド生成:

    資料をアップロードし、Nano Banana Proの力でPDFスライドを作成する。

  2. 自作ツール(AI Studio/GAS)で変換:

    PDFを画像化し、スピーカーノート付きのPPTX/Googleスライドに変換する。(※ここを自動化するのが肝だ)

  3. Googleスライドとして保存:

    Googleドライブ上でスライドを開き、内容を確認。

  4. 言語設定を「英語」に変更:

    ここが最大のキモだ。Googleアカウントの言語をEnglishに切り替える。

  5. Google Vidsで動画化:

    Vidsを開き、スライドをインポート。「Generate Voiceover」ボタンを押し、AI音声を生成する。

この手順であれば、慣れれば実質5分で完結する。

音声のイントネーションにはまだ課題が残るものの、外部の音声合成ツール(ElevenLabsなど)を使えばクオリティはさらに跳ね上がるだろう。

重要なのは、「人間が1日かかるレベルのスライド作成」から「動画化」までを、AIの力を借りて個人が数分で完遂できる未来が、すでに手の中にあったということだ。

壁にぶつかり、ツールを作り、言語設定の罠を越えた先に待っていたのは、圧倒的な生産性の革命だった。

やってみるとすぐできて意外に面白い。

やってみてね。

作成したツールはこちら

https://ai.studio/apps/drive/16iixo5D1-PVz2WMYJ1r7AOWpiAqvRrlI?fullscreenApplet=true

コメント

この記事へのコメントはありません。

PAGE TOP