翻訳のために文字起こしをする際には文字起こしアプリを使用しますが、使ってみたところアプリによって特徴がある事が分かりました。
今回は私のこれまでの経験を踏まえて、おすすめ音声テキストの変換アプリを紹介いたします。
自動翻訳ツールに関しては下記を参考にしてください。
-
無料自動翻訳ツールを使う時におこりがちな4つの間違い
以前他の記事で紹介いたしましたがGoogle翻訳、みらい翻訳、DeepL翻訳など現在多くの無料自動翻訳ツールがございます。 翻訳後の校閲に関してはこちら 悩む人①無料自動翻訳ツールを使っ ...
それでは本日の記事です。
ポイント
記事の結論
Watson Speech to Text/IBMとGoogleドキュメントの音声入力を用途に応じて使い分けると良い。
Watson Speech to Text:複数人の会話の文字起こし・音声ファイルが既にある場合
Googleドキュメント音声入力:一人の会話の文字起こし
記事の内容(こんな方におすすめ)
自動翻訳ツールを使う前に文字起こしを効率的に行う必要がある人。
目次
音声をテキスト変換する(文字起こし)おすすめアプリ-翻訳前のひと手間-
大きく分けて2つの文字起こしツールの使い勝手が良い様に思います。
Watson(Speech to Text)/IBMとは
文字起こしAIと言えばすぐに浮かんでくるシステムの一つがIBMのWatsonだと個人的には思います。
簡単にWatsonに関しての説明がWikipediaにありましたので念のため引用します。
ワトソンは、IBMが開発した質問応答システム・意思決定支援システムである。 「人工知能」と紹介されることもあるが、IBMはワトソンを「Augmented Intelligence、拡張知能」、自然言語を理解・学習し人間の意思決定を支援する『コグニティブ・コンピューティング・システム』と定義している。
詳しくはWikipediaを参照ください。
そのワトソンを用いた文字起こしツールになります。
Watson Speech to Textの特徴
大きく分けると主に二つの特徴がある様に思います。
特徴①.複数人の会話を区別可能
特徴②.音声ファイルをアップロード可能
それぞれについて説明していきます。
複数人の会話を区別可能
こちらは他の文字起こしアプリと比較して特徴になる部分だと思います。
Detect multiple speakersというボタンがありそれをオンにすると複数人の会話を前提に文字起こしが開始されます。
音声ファイルをアップロード可能
こちらは既に音声ファイルがある場合にとても便利です。
現在のところ.mp3, .mpeg, .wav, .flac, .opusに対応しております。
既に音声ファイルを持っている場合や静かに作業を行う必要がある場合は便利かと思います。
Watson Speech to Textの使い方
その基本的な使用方法は2種類あります。
①まずは前段として言語を選択します(青枠)。
②次に直接音声を出す場合は"Record Audio"を選択します
*音声ファイルをアップロードする場合は"Upload Audio File"を選択します。
そういたしますと自動で文字起こしが開始されます。
以上がWatson Speech to Textとなります。
Googleドキュメント音声入力
次にもう一つの便利文字起こしツールであるGoogleドキュメント音声入力に関して紹介いたします。
Googleドキュメント音声入力とは
Googleの開発したAIを使用した音声認識のツールです。
近年急速にその精度を高めていると評判です。
Googleドキュメント音声入力の特徴
こちらの特徴は下記の一点に集約されると思います。
特徴①.急速にエラー率が減ってきているそのシステムの改善の速度
使用してみると分かりますがその精度の高さには本当に驚かされます。
Googleドキュメント音声入力の使い方
①.ToolのVoice typingを選択
②.言語を選択する
③.マイクボタンをクリックする(マイクのアイコンが赤になれば話して大丈夫です)
そういたしますと文字起こしが開始されます。
以上がGoogleドキュメントの音声入力の説明となります。
まとめ
用途に応じた使い分け
どちらのツールも甲乙つけがたいですが下記の様なすみ分けは可能だと思います。
Watson Speech to Text/IBM | Googleドキュメント音声入力 | |
複数人の会話を区別 | 〇 | △ |
音声ファイルをアップロード | 〇 | X |
精度 | △ | ◎ |
用途に応じて選択が出来るのが理想だと思います。
本日の記事のまとめです。
ポイント
記事の結論
Watson Speech to Text/IBMとGoogleドキュメントの音声入力を用途に応じて使い分けると良い。
Watson Speech to Text:複数人の会話の文字起こし・音声ファイルが既にある場合
Googleドキュメント音声入力:一人の会話の文字起こし
それでは失礼いたします。