このような悩みを持つ方は沢山いらっしゃるのではないでしょうか。
たしかにITの知識があまりない方には少し難しいかもしれません。
しかし、Googleのドキュメントやネット上の体験談などを参考にすればどなたでも環境構築は可能です!
今回は初めてSpeech-to-Textの環境構築をする方向けとして、準備編・導入編・実践編の3回に分けて紹介し、可能な限りシンプルな方法で環境構築を行いたいと思います。
記事の内容
記事の内容
Windows環境でSpeech-To-Text導入する前の準備をご紹介
ポイント
ポイント
Google Speech-to-Textの環境を構築してみたい方におすすめ
全体作業フロー
<準備編>←今回はここ!
①Google Speech-To-Textの基本
②変換する音声ファイルを準備する
<導入編>
③Google Cloud Platformでプロジェクトを設定する
④Google Cloud SDKをインストールする
<実践編>
⑤サービスアカウント キーが含まれる JSON ファイルのパスの設定する
⑥実際に音声ファイルの文字変換を行う
<準備編> ①Google Speech-To-Textの基本
Google Speech-to-TextIは、AI・機械学習機能を使用し、音声を認識しテキストに変換してくれるサービスです。
現在、日本語を含む125以上の言語に対応し、多くの企業や個人に使用されています。
まずはSpeech-to-TextをGoogleのデモから試してみましょう。
実際にマイクで喋ったり、ファイルをアップロードしてみるとなかなかの精度に驚きます。
ただし、この方法だとアップロードできるファイルのサイズなどに限界があります。
自身のパソコンを使用し、Google Speech-to-Textの環境を構築していきましょう。
<準備編> ②変換する音声ファイルを準備する
まず、最初にSpeech-to-Textで使用する音声ファイルを準備します。
この音声ファイルの準備がちょっとめんどうです。
現在Google Speech-to-Textではメジャー音声ファイル形式であるmp3やmp4に対応しておらず、
使用する音声ファイルはFLAC や WAVにファイルなどに変換する必要があります。
オンラインでサーチしてみると多くのサイトが無料で変換サービスを行っていますので、まずはFLACまたはWAVファイルに変換してみてください。
今回とあるYoutube動画をテストとしてFLACに変換し、ファイルに落としてみました。
これでSpeech-to-Textで変換するFLACファイルの準備ができました。
これで今回の準備編は終了です。
次回の導入編ではGoogle Cloud Platformでプロジェクトを設定し、Google Cloud SDKをインストールに関して説明していきたいと思います。
それでは失礼致します。