GAFAの牙城を崩す対抗馬は、機械翻訳AIの発展で続々登場? ナミビアで開発中の革新的アプリから考える

 アフリカ南部のナミビアで、現地語から英語へとリアルタイムに翻訳するアプリを開発するプロジェクトが進行中であると「Quartz Africa」が報じた。

 南アフリカに隣接し、大西洋に面したナミビア共和国は、日本の2.2倍の国土を有していながら、新潟県と同程度の人口規模の国だ。そんなナミビアにはオバンボ族、カバンゴ族、ダマラ族、ヘレロ族など、多様な民族が暮らしており、そこでは公用語の英語のほか、アフリカーンス語、ドイツ語、その他民族語が話されている。

 プロジェクトの発起人として関与したのが、ラグビー選手としてナミビアのナショナルリーグで戦った経歴を有するデータサイエンティストのWilhelmina Ndapewa Onyothi Nekoto氏と、定年退職をした元英語教師のElfriede Gowases氏の女性2名だ。ちなみに、プロジェクトの発起人であるNekoto氏はオバンボ語、一方のGowases氏はコエ語族のナマ語のネイティブスピーカーである。

 Google翻訳に続く形で、より精度の高い機械翻訳プラットフォームが続々登場している。最近では、ドイツの企業が開発した「DeepL翻訳」がGoogle翻訳を上回るとして話題となった。しかしながら、例えば米国の企業が開発した翻訳プラットフォームの場合、米国の文化的コンテクストに根差したものとなっているのがネックだ。

 そこでNekoto氏らは、ナミ語で書かれた物語や歌、レシピに包含される文化的知識を保持することに細心の注意を払いつつ、ナミ語から英語への翻訳を行った。今後は翻訳アプリの開発のために、言語ペアをデータベースに入力後、AIに言語ペアを学習させる予定だという。(参照URL:https://qz.com/africa/1881656/the-poetic-process-powering-machine-translation-in-namibia/

 ニューラルネットワークの登場により、機械翻訳の精度は飛躍的に改善した。しかしながら、ニューラルネットワークを利用した機械翻訳は英語やフランス語、イタリア語といった大量のデータを有するメジャーな言語に対して優位性を発揮するのであって、言語データの少ない希少言語となると不利である。2年前にはアフリカで広く話されているスワヒリ語がツイッターに未対応である現状を鑑み、「#TwitterRecognizeSwahili(ツイッターはスワヒリ語を認識する)」「#SwahiliNotIndonesian(スワヒリ語はインドネシア語ではない」といったハッシュタグ付きの皮肉ツイートで呼びかける運動がツイッター上で展開された。

関連記事