Meta、手術不要の“脳から文章”技術を発表 半数以上の文章が「単語1つ以下の誤り」で復元される
Metaは6月29日、脳活動から文章を復元するAI研究の新バージョン「Brain2Qwerty v2」を発表した。脳に電極を埋め込む侵襲型ではなく、頭の外から脳活動を測るMEG(脳磁図)のデータを使い、キーボード入力中の人が打っている文章をAIが復元する仕組みだ。
Metaは今回の成果を、非侵襲の脳記録からリアルタイムに文を復元するエンドツーエンド型パイプラインとして紹介している。研究では、9人のボランティアから集めた約2万2000文のデータで訓練され、各参加者はMEG装置を装着して10時間ずつ文章をタイプした。平均で61%の単語精度を達成し、最も成績のよい参加者では単語精度が78%に達し、半数以上の文章が「単語1つ以下の誤り」で復元されたという。
ただし、これは人の思考を自由に読み取る装置ではない。実験は、健康な参加者が文章を覚え、実際にキーボードでタイプしている最中の脳活動を読むもので、読み取っているのは漠然とした“思考”ではなく、入力行動に伴う脳信号である。
Brain2Qwerty v1は、キーが押されたタイミングを手がかりに文字を推定する仕組みだったが、v2は連続した脳活動の記録から直接文章を生成する方向へ進んだ。Metaのプロジェクトページによると、v2は文字、単語、文という3階層の情報を組み合わせ、ノイズの多い脳信号から意味の通る文章を復元する。これにより、単なる文字当てから、文全体の流れを利用した復元へと踏み込んだ。
背景には、失語症、ALS、重い麻痺、脳損傷などで話す・動かす能力を失った人々のコミュニケーション支援という課題がある。Nature Neuroscienceに掲載されたBrain2Qwerty v1の論文も、侵襲型の脳インプラントは高性能化している一方で、手術に伴うリスクや長期運用の難しさがあり、非侵襲型BCIへの期待があると説明している。v1の研究では35人の健康なボランティアを対象に、EEGとMEGを比較し、MEGの平均文字誤り率が29%、EEGが65%だったと報告された。
一方で、Meta自身も、日常利用にはまだ誤りが多すぎること、さらに現在使われたMEG装置は多くの患者にとって現実的に利用しにくい大型スキャナーであることを課題として挙げている。研究チームは、データ量を増やすほど精度が対数線形的に改善する傾向があるとして、今後の大規模データ収集に期待を寄せている。
あわせて、Metaは研究コードを公開している。GitHubの公式リポジトリでは、Brain2Qwerty v1とv2のコードが公開され、v1データセットはHugging Faceで提供される一方、v2データセットは論文採択まで公開保留とされている。v2は現時点ではMetaの研究ページでarXiv扱いのプレプリントとして示されており、製品発表というより、研究コミュニティに向けた公開研究の性格が強い。
■研究情報
Brain2Qwerty v2
発表主体:Meta
発表日:6月29日
研究内容:非侵襲の脳磁図(MEG)データから、キーボード入力中の文章をAIで復元するエンドツーエンド型パイプライン
データ規模:9人のボランティア、約2万2000文(各参加者10時間のタイプ入力)
主な結果:平均単語精度61%、最高78%
公開状況:研究コード(v1/v2)をGitHubで公開、v1データセットはHugging Faceで提供、v2データセットは論文採択まで公開保留