Googleが放った衝撃のアップデート、NotebookLMの「ソースからスライドを作成(Source-to-Slides)」機能。
その内部で稼働する最新画像生成モデル「Nano Banana Pro(Gemini 3 Pro Image)」が叩き出すスライドのクオリティは、まさに「破壊的」の一言に尽きる。
プレゼンスライドはほぼ修正するところがないような感じ。
日本語の資料であっても、人間が丸一日かけてデザイン調整したレベルの成果物を、AIはわずか数十分で出力してしまう。
しかし、ここで我々クリエイターやビジネスパーソンには一つの疑問が浮かぶ。
「この美しい『静止画』を、どうやって最短ルートで『動画』に変換するか?」
静止画のスライドは、誰かが喋らなければ意味をなさない。しかし、自分で録音するのは手間だ。AIに喋らせたい。しかも全自動で。
今回、私は海外の先行ユーザー(Early Adopters)たちが構築しつつあるワークフローを徹底調査し、自らの手で検証を行った。その過程で直面した数々の「壁」と、それを突破して「作業時間わずか5分」で動画作成までできるように。
ただし、日本語の音声出力はまだ実用的に放ってない感じ。
1. 世界のコンテンツクリエイターたちは「スライド動画化」にどう挑んでいるのか?
まず、この新しい波に乗る海外勢の動向を調査した。彼らはNotebookLMを単なる「メモ帳」とは見ていない。「コンテンツ生成の頭脳(Brain)」として扱っている。
NotebookLMは、膨大な資料を読み込み、構成を練り(脚本)、視覚化する(スライド生成)能力には長けている。しかし、それを「動画」として出力する機能(身体機能)はまだ未成熟だ。ネイティブ機能の「動画の概要(Video Overview)」もあるが、編集ができないブラックボックス仕様であり、ビジネス現場での実用性には欠ける。
そこで彼らが編み出したのが、「NotebookLMで素材を作り、外部ツール連携」というハイブリッド・パイプラインだ。具体的には、以下の2つの要素をいかにシームレスに結合させるかが競争の焦点となっていた。
-
ビジュアル(Visual): Nano Banana Proが生成した、デザイン性の高いスライド画像。
-
スクリプト(Script): 各スライドの内容を説明する、論理的なスピーカーノート。
「なるほど、画像とテキストさえ分離して抽出できれば、OKか」
そう確信した私は、早速自分の環境で検証を開始した。だが、そこには既存ツールの限界というハードルが待っていた。
2. 既存ツールそのまんま:PDF変換の「文字化け」と「作業の泥沼」
NotebookLMから出力される成果物はPDF形式である。これを動画編集ツール(Google VidsやPremiereなど)で扱うためには、編集可能な形式に変換するか、画像として切り出す必要がある。
失敗その1:PDF変換ツールの限界
まず試したのは、定番の「iLovePDF」やAdobe Acrobatを使い、PDFをPowerPoint形式(.pptx)に変換する王道ルートだ。
結果は惨敗だった。
Nano Banana Proが生成するリッチなデザイン、複雑なレイアウト、そして日本語フォント。これらが一部文字化け。例え5%でもあればその資料は使えない。AIが作ったデザインを維持するには、PDFのベクターデータを解析する従来の手法では通用しない。
失敗その2:画像貼り付けの苦行(マニュアル作業)
「ならば、デザインを維持するために画像化しよう」
PDFをJPG画像に変換すること自体は簡単。画質も100%維持される。しかし、その後に待っていたのは「めんどくさすぎる作業」だった。
15枚のスライド画像を、Googleスライドの各ページに一枚一枚貼り付け、サイズを調整する。1枚ならいい。だが15枚、30枚となると、これはもはやクリエイティブな作業ではない。AIで時間を短縮したはずが、コピペ作業で浪費しては本末転倒だ。意味なし。
失敗その3:頼みの綱「拡張機能」の消失
かつて、Googleドライブ内の画像を自動でスライド化してくれる「DriveSlides」という神のようなChrome拡張機能が存在した。これさえあれば解決だ、と思い検索をかけたが、結果は残酷だった。
「Chromeウェブストアから削除済み」。
利用規約の変更か、開発者の都合か、かつての王道ルートは閉ざされていた。既存の「楽な方法」は、ここで全滅したのである。どうしようかな。
3. 突破口:AI Studio (Gemini Build) で「自作ツール」を生み出す
既存の道がないなら、道を作るしかない。私はGoogleのAI Studio(Gemini Build環境)を開き、AI自身にこの問題を解決させるツール(スクリプト)の開発を指示した。要件は以下の通りだ。
-
入力: NotebookLMが出力したPDFをアップロード。
-
処理A(画質保存): 各スライドページを「背景画像jpg」としてスライドに配置すること。テキストボックスとして解析するから崩れるのだ。画像として貼り付ければ、Nano Banana Proの画質は1ピクセルたりとも損なわれない。あたりまえ。
-
処理B(魂の注入): 画像だけでは動画にならない。スライドの内容を解析し、プレゼンテーション用の「スピーカーノート(台本)」をAIに自動生成させ、所定の欄(全てのスライド)に埋め込むこと。
結果、これが大正解となった。
※シェアURLは記事下に記載
AI Studioで生成したスクリプトは、画質を完全に維持したスライドと、それに同期した完璧な台本を持つPPTXファイルを一瞬で出力してくれた。もし台本のニュアンスを変えたい場合でも、GAS(Google Apps Script)と連携させれば一括修正も容易だ。
これで「最高画質のビジュアル」と「AIによる脚本」が揃った。準備は整った。
4. 最後の落とし穴:Google Vidsの「沈黙」と言語設定の罠
これを一度Googleスライドに読み込ませてスピーカーノートまで表示させる。
完成したスライド(スピーカーノート付き)を、Googleの次世代動画作成ツール**「Google Vids」にインポートする。
Google Vidsには「スライドをインポート(Import Slides)」**という強力な機能があり、スライド上のスピーカーノートを自動的に読み込み、動画のスクリプトとして認識してくれるはずだ。
インポートは成功した。画面右側のスクリプト欄には、確かにテキストが入っている。
しかし、再生ボタンを押しても無音。
画面をくまなく探した。「Text-to-Speech」「Generate Voiceover」……あるはずのボタンが見当たらない。自分の声をマイクで録音するボタンはあるが、AIに読ませる機能だけが神隠しにあったかのように消えている。
「まさか、日本語テキストだから対応していないのか?」
ではなく、、、、
原因:Google Workspaceの「言語設定」
調査の結果、判明した原因はあまりに単純で、かつ多くの日本ユーザーが陥る盲点だった。
「Google VidsのAI音声生成機能(Help me create / AI Voiceover)は、現時点では日本語環境(UI設定)において制限、あるいは非表示になっている」
要するに表示こそされてないが
「その機能はまだ日本語ユーザーには解放されていません」
機能自体が存在しないのではなく、「あなたの言語設定ではまだ見せません」という状態だったのだ。
解決策:プランB発動(English Mode)
私はGoogleアカウントの設定(myaccount.google.com)を開き、使用言語を**「English (United States)」に変更した。
ブラウザをリロードし、再度Google Vidsを開く。するとどうだ。さっきまで空白だった場所に、「Generate Voiceover」**のボタンがみつかる!
ボタンを押す。数秒の処理の後、タイムラインに波形が現れた。
再生する。
AIが(だーいぶ、訛りのイントネーションではあるが)日本語のスピーカーノートを読み上げ始めた。ついに、静止画だったスライドに「声」という命が宿った瞬間だ。
まあ、今回はここまで
20個
twenty 個とか言い出す始末。。。
この音声はまあ、今現在なら合成音声を手動アップロードするか・自分で話すか・Googleが対応してくれるまで待つか・・・そんな感じ。
5. 結論:これが「5分」で動画を作る最短ワークフローだ
長い旅だったが、確立されたワークフローは驚くほどシンプルで、再現性が高い。
-
NotebookLMでスライド生成:
資料をアップロードし、Nano Banana Proの力でPDFスライドを作成する。
-
自作ツール(AI Studio/GAS)で変換:
PDFを画像化し、スピーカーノート付きのPPTX/Googleスライドに変換する。(※ここを自動化するのが肝だ)
-
Googleスライドとして保存:
Googleドライブ上でスライドを開き、内容を確認。
-
言語設定を「英語」に変更:
ここが最大のキモだ。Googleアカウントの言語をEnglishに切り替える。
-
Google Vidsで動画化:
Vidsを開き、スライドをインポート。「Generate Voiceover」ボタンを押し、AI音声を生成する。
この手順であれば、慣れれば実質5分で完結する。
音声のイントネーションにはまだ課題が残るものの、外部の音声合成ツール(ElevenLabsなど)を使えばクオリティはさらに跳ね上がるだろう。
重要なのは、「人間が1日かかるレベルのスライド作成」から「動画化」までを、AIの力を借りて個人が数分で完遂できる未来が、すでに手の中にあったということだ。
壁にぶつかり、ツールを作り、言語設定の罠を越えた先に待っていたのは、圧倒的な生産性の革命だった。
やってみるとすぐできて意外に面白い。
やってみてね。
作成したツールはこちら
https://ai.studio/apps/drive/16iixo5D1-PVz2WMYJ1r7AOWpiAqvRrlI?fullscreenApplet=true
コメント