言語の文法の80%を理解する“自動文字起こしシステム”実現へ 次世代自動音声認識エンジン「LumenVox ASR」への期待
音声認識ソフトウェア業界を牽引するシリコンバレーのLumenVoxが、文字起こし機能を搭載した次世代の自動音声認識エンジン「LumenVox ASR」をリリースしたと発表した。
LumenVoxは音声認識市場を支える一企業として、世界各国の様々な企業・組織の業務に対応した音声認識プラットフォームを提供している。
今回発表した「LumenVox ASR」に関して特筆すべき点のひとつがエンドツーエンドのディープニューラルネットワーク構造だ。言語モデルを拡張可能なツールを設定するだけで、新たな言語や方言をシームレスに追加し、処理を加速化する仕組みとなっている。
自然言語処理においてはとにかくデータ量が肝となる一方で、データに乏しい少数言語話者には不利益をもたらしかねず、結果的にバイアスを生む一因となっている。グーグルやアマゾンなどの大手IT企業が提供する音声認識プラットフォームでは成し得なかった機能に着目し開発を進める企業がインドやアフリカなどの新興国から登場しつつあるなかで、LumenVoxは多種多様な顧客に対応可能なシステムを考案。新たな言語や、ネイティブでない人が話す方言をシームレスに追加。言語の文法の80パーセントを移行可能であるという。
「LumenVox ASR」において特筆すべき機能は少数言語への対応だけではない。同製品は最先端の音声認識を搭載しており、ほぼレイテンシーのない状態で正確に文字を起こしながら、音声からテクストへのリアルタイムの変換が可能だ。
会話AIの顧問機関である「Opus Research」の主任アナリストを務めるダン・ミラー氏は、「今回の製品には高精度のAIが組み込まれており、人種や民族を問わずさまざまな顧客の意図を適切に認識し、反応することが可能である。その点、音声認識ソフトウェア業界に可能性を見出した一製品と言える」と海外のITメディアに対しコメントした。
LumenVoxは今年5月、米国のヘルスケアIT企業SpinSciと業務提携を締結。患者とのコミュニケーションやコールセンターが抱える問題に対し、音声認識という切り口から挑んでいる最中だ。LumenVoxのシステムと、SpinSciの主力製品であるEpicとの親和性は高く、双方のシステムを統合することで電子カルテの創造・管理がスムーズなるほか、さらにCiscoの統合型顧客音声ポータルに適用することで、カスタマーエクスペリエンスのさらなる向上を見込んでいる。