先日ご紹介したアマゾンポリーでの音声合成ですが
すぐに視聴したり、音声をダウンロードしたりできるのは、文字数制限があり3000文字までと決まっています。
3000文字以上のテキストを音声にしたいときは
ストリーミング?のようにその場でできずに
アマゾンのクラウドに保存予約をする必要があります。
このクラウドをS3というらしい・・・
Simple Storage Service で(S3)
ネーミングセンスも素晴らしい!
で、これは自分で名前を決めてあらかじめ作成しておく必要があります。
Pollyの画面から適当にS3予約をしても
作ってなければエラーが出ます。
という事でAWSのS3クラウドに新規パケットを作成して音声合成ファイルを保存する方法を解説します。
AWSにS3の新規アカウントを作成する手順
1,AWS(Amazonウェブサービス)初期画面よりすべてのサービスを展開させる
- AWSマネジメントコンソール(要はAWSの初期画面)
- すべてのサービスを展開する
### 2,ストレージ→S3をクリックして開く
・要するにデータを保存しておくところを決めるということ
3,新規にパケットを作成します
4,パケットの名前をアルファベットか数字で入力
5,既に誰かが使っている名前は使用できないです、この辺はIDと同じ
6,何やら難しいことが書いてあるので、秒速で「次へ」を押す
7,こちらの画面もアマゾンから「変更しないこと」を推奨されているので、そのまま
8,新しいパケットがS3にて、合成できたらAmazon Pollyに戻る
今回はその場でダウンロードを選ばずにS3に向けて合成をクリックします。
9,入力するのはパケットの名前だけでOK
新規作成した名前が出てくるのではなく、パケットの名前を覚えておかなければいけないので注意
10,ファイルが完成するのに、そこまで時間はかかりません
ただし、ここで存在しないパケット名などを入力してしまうと、ステータスが、後ほど失敗になります。
11,Amazonポリーの画面からではダウンロードできないのでS3に移動します
12,適当に名前を付けたりしてダウンロードする
試しに文字制限の上限の10万文字フルでやってみたら、ファイルの容量は95MBぐらいになってしまいました。汗
まとめ
本当に凄い時代になってきましたね。
アイドルみたいな特徴ある声に特化したボイスロイドよりは
ちょっと魅力に欠ける感じがありますが、無料でここまで出来るのは凄いと思います。
本格的な音声のSSMLタグを使うことで実現可能です。
何よりも10万文字もの容量まで対応してくれるのはありがたいです。
前の記事でも書きましたが1ヶ月間500万文字まで1年間無料で使えます。
ぜひ色々なシーンで使ってみてください。
個人的にはちょっといいなと思った記事などを音声にして
車やバス、自転車に乗る時など持ち歩いて聴いてます。
コメント