オトバンクとPKSHA、AI音声合成サービス「カタリテ」開発 “自然な発音”再現するアクセント推定技術を初の実用化

オトバンクとPKSHA、AI音声合成サービスを合同開発

 音声配信サービス「audiobook.jp」を運営する株式会社オトバンクは、株式会社PKSHA Technology(以下、PKSHA)の音声関連技術をもとに、独自のAI音声合成サービス「カタリテ」を開発したことを発表した。音声合成技術を活用して、収録から編集に必要な制作時間を短縮し、即時性の高いコンテンツも適時に提供できる環境の実現を目指しているようだ。

 また、本サービスでは、PKSHAが開発した自然な発音を再現する、アクセント推定技術「tdmelodic」を初めて実用化している。

 さらに「日経電子版」と連携して、活字コンテンツの音声化に関する実証実験も行い、朗読者には、アニメーション作品や報道番組のナレーションなどで活動する、声優の浅野真澄を起用した。実証実験で生成された音声コンテンツは、「audiobook.jp」の聴き放題プランにて聴くことが可能だ。

■関係者からのコメント
株式会社オトバンク代表取締役社長:久保田裕也
「私たちの制作におけるこだわりを、今回の技術でも反映させるべく、色々と調整を重ねてきました。その点に関してご理解くださり、協力くださった皆様にお礼申し上げます。今後も『聞き入る文化』の創造を目指し、「音のこだわり」をさまざまな観点から実現できる取り組みに挑戦します。」

株式会社PKSHA Technology R&D チーム:堅山耀太郎
「弊社は 2016 年頃から深層学習による音声分野の研究に取り組んでおり、継続的に音声分野でのトップ学会等に成果を発表するなど研究を進めてまいりました。今回これらの研究成果を生かした取り組みの一つとして、オトバンクとの
協業が実現したことを大変うれしく思います。引き続き最先端のアルゴリズムの社会実装に取り組んでまいります。」

日本経済新聞社 デジタル編成ユニット サービス開発グループ:長筧尚武
「日経電子版では、読者のコンテキストに合わせた情報発信を常に模索しています。今回、音声化のノウハウを持つオトバンクさんと『見出しの読み上げ』に取り組みました。ニュースの見出しは短縮表現が多く、耳で伝えるためには工夫が必要でした。この自動処理の取り組みは、今後、見出しの自動翻訳や精度の高いタグ付けにも繋がると考えています。引き続き、耳で伝えるための技術研究に取り組む所存です。カタリテの音質改善にも大いに期待しています。」

インタビュー

もっとみる

Pick Up!

「ニュース」の最新記事

もっとみる

blueprint book store

もっとみる