Microsoft Wordの新たな“自動文字起こし機能”から考える、音声認識マーケットのこれから

Word文字起こし新機能のこれから

 また、タイピングの際には、実際のタイプの動作の削減と正確性の向上によって、人間よりも正確な文字起こしが可能となってきている。この音声認識は、音声データを音にバラして解析し、その言葉と状況にあう単語を音に当てて文字に起こすという流れになっている。その後、データセットにAIによるディープラーニングを取り入れることによってこの認識プロセスを早め、また多様化するのが大きな目標となっている。

 しかし、これらの開発は主に英語を主とした言語での研究開発の方が進んでおり、Google Docの音声コマンドなどにも見られるような、日本語に対応しているサービスはそこまで多くない。

 また、アクセントなどデータ数の少ない音声を入力をされると、意味やコンテクストの正確性には欠けるところがある。しかし、ディープラーニングは使えば使うほどにユーザーの特徴を掴みそれに対応していく仕組みとなっているので、これらを意識して音声による操作を広めていくことで、さらに精密さと正確さの向上につながってくる可能性が大きい。

 今回のMicrosoft Wordの文字起こしにも見られるように、これらの機能がさらに私たちの生産性を高めていくとともに、音声入力サービスが身近になってくる大きなきっかけになるのかもしれない。今後Google Docsやその他の文章編集ソフトやサービスが、音声認識サービスをどのように取り入れていくのか注目していきたい。

(画像= Microsoftより)

■mugiho
ニュージーランドの大学でマオリ文化の発展・都市計画・教育について学びながら映画、テック、文化芸術について執筆するフリーライターと翻訳家。人間観察をしながらたまにそれらについて書いたり撮ったりしている。

〈Source〉
https://www.microsoft.com/en-us/microsoft-365/blog/2020/08/25/microsoft-365-transcription-voice-commands-word/
https://gadgets.ndtv.com/internet/news/microsoft-word-transcribe-feature-voice-to-text-transcription-audio-2285387
https://www.tomsguide.com/news/microsoft-word-just-got-a-killer-feature-that-puts-google-docs-to-shame
https://www.theverge.com/2020/8/25/21400623/microsoft-transcribe-in-word-transcription-audio-microsoft-365
https://support.microsoft.com/en-us/office/transcribe-your-recordings-7fc2efec-245e-45f0-b053-2a97531ecf57
https://www.techrepublic.com/article/5-transcription-apps-to-make-your-work-life-easier/
https://www.globalme.net/blog/how-does-speech-recognition-technology-work/
https://www.explainthatstuff.com/voicerecognition.html
https://www.callrail.com/blog/speech-recognition-software/
https://www.iedge.tech/article/9784/3/
https://marketingnative.jp/amazon_transcribe/

関連記事

インタビュー

もっとみる

Pick Up!

「コラム」の最新記事

もっとみる

blueprint book store

もっとみる