アドバンスト・メディアは、音声認識エンジン「AmiVoice」にディープラーニングの発展技術「LSTM(Long Short-Term Memory)」を実装、自然発話の認識精度向上を図った。
LSTMと従来技術との比較
LSTMは、時系列情報を保持できることを特徴とする、リカレントニューラルネットワーク技術の1つ。過去の情報を加味しながら処理することで、より正確な認識を可能とする。同社によれば、従来のDNN技術の誤認識率を20%改善したという。さらに、発話区間検出にも技術を活用、雑音下における音声認識の精度も向上した。
自然発話による対話を中心とするコールセンターや議事録といった活用分野から実装していく方針だ。
LSTMと従来技術との比較
LSTMは、時系列情報を保持できることを特徴とする、リカレントニューラルネットワーク技術の1つ。過去の情報を加味しながら処理することで、より正確な認識を可能とする。同社によれば、従来のDNN技術の誤認識率を20%改善したという。さらに、発話区間検出にも技術を活用、雑音下における音声認識の精度も向上した。
自然発話による対話を中心とするコールセンターや議事録といった活用分野から実装していく方針だ。