音声認識|AI・人工知能の用語

音声認識とは、人間の声などをコンピューターに認識させることであり、主に話し言葉を文字列(テキスト)に変換する技術を指すことが多いのですが、声を出している人を識別したり、音声で機械に指示を出す機能を指すこともあります。

しかし、音声からテキストを生成する機能のみを「音声認識」とし、テキストから意味を抽出したり、目的に応じた作業を行う機能については「音声認識」の定義に含めないことが多いようです。

そのため、AIスピーカーやスマホに向かって音声で指示を出したときに、その内容を識別・判断する機能は「音声アシスト」と呼ばれます。



音声認識には、「音声情報」と「言語情報」の理解が必要になります。

「音声情報」とは、音波(アナログ波)をデジタルに変化し、人間の会話の音声を細かく「音素」に分解したものです。

また、「言語情報」は、自然言語処理により取り扱われます。

音声認識では、音響分析・音響モデル・発音辞書・言語モデルの各過程を経て、コンピューターが認識してテキスト化が行われます。


音声認識&音声合成で自動応答|ホテル予約の実証実験|KCSF
http://www.kcsf.co.jp/contact/automatic-response.html


コールセンターに関する用語集

コールセンターの構築・運営に関連する用語の説明をしています。