2012年6月19日火曜日

音声認識ソフトについてのその後 今さら……第27回


音声認識ソフトについてのその後 今さら……第27回

今さら聞けないネットのあれこれ。
今回は
「音声認識ソフトの実力は?」
についてお話します。

重要度:★
難易度:★★


音声認識ソフトについて
Windowsに標準で入っている※1音声認識ソフトを使ってみた感想など。

以前のブログに書いた音声認識ソフトを使ってみましたが、正直な話まだあまり使い勝手がいいとは言い切れません。

実際この文章も音声認識ソフトの入力で書いていますが、一般的な形容詞や動詞などのある程度言葉が予測されるものについては意外と入力は簡単ですが、日本語の場合、同音異語の言葉が非常に多いので文字変換に問題が生じる場合が、かなり多いです。

例えば政策制作は、どちらも発音としては同じ「せいさく」です。

マイクロソフトは文節の流れを読み、文字を予測する技術を取り入れているらしいですが、実際の音声認識ではどちらも同じ処理をされるので、「せいさく」と単体で発音するのではなく、ある程度の長さの分節として、言葉を入力する方法が最も早く確実に入力ができます。


意外かもしれないですが実際に単語毎に区切る入力より、ある程度長い分節の方が認識精度が高いです。

これは、音声認識ソフトを使用するにあたり、ある程度の量のテキストを読みあげる「トレーニング」を行い、そのデータをプロファイルとして、保存するため比較的高い確率で音声認識をしてくれます。

また、発音に関しては、それなりに高いレベルを要求されます。
アナウンサーとまではいかないですが、最初はそれなりにきちんとした発音を心がけた方がいいです。

これはキーボード入力でも同じですが、正確な打ちこみをしないと、正しい変換をしてくれない様に、発音も初期のころは、正しい発音を心がけた方がよいようです。

例えば、「文章」という単語は【ぶんしょう】(最後のに注意)と発音しないを認識してくれません。
話言葉だと、どうしても【ぶんしょ~】【ぶんしょ】【ぶんしょお】となる場合が多いですね。
これらの、発音では絶対に変換しないと言う事ではなく、変換の確立は、かなり探します。

また、ある程度同じ言葉を繰り返して、入力するとそのうちに【ぶんしょ】でも、変換するようにはなります。使えば使うほど、認識精度が高くなり、同時に個人が持っている、発音や文章構成の癖を読み取り、変換効率が上がります。

最初のころは音声入力とキーボード入力を同時に行いつつ(変換ミスの箇所をキーボードで修正)、文章制作を行うことで、キーボードからの入力はかなり減らすことができます。

ただし、現在この音声認識プログラムに対応しているのは、MSWordとInternet Explorerのみなので、使用する場面は意外と少ないかもしれません。

市販の音声認識ソフトは、他のアプリケーションとの連動が可能で、しかも変換効率は、かなり高いです。ただ、マーケットとして、まだニッチな分野なので価格も10000~20000円と機能の割には高い設定になっているように思います。

まぁ、スマートフォンでの音声入力がかなり高い精度で出来るようになっているので、この技術がPCに降りてくれば、ソフトの価格も下がるかもしれませんが。






※1.正確には、追加プログラムをインストールする必要がある場合があります。



神奈川県を中心として主に横浜・川崎・東京23区西部の中小企業・個人事業主向けホームページを制作しております。 横浜本田WEB


横浜本田WEB Facebookページ
http://www.facebook.com/hondaweb?fref=ts

  • このエントリーをはてなブックマークに追加


Facebookへ投稿