頭で考えたものが文章に。脳波から97%の精度で文章化できるAIが登場

technology

Credit:depositphotos
point
  • 脳波を読み取りテキスト化する「脳波翻訳」が可能に
  • 脳波翻訳の精度は最大97%であり、「心を読む」レベルに相当する

ほんの数年の間に、音声認識の技術は急激に向上しました。

多くの人がスマホに触ることなく操作したり、他言語の音声を一瞬で翻訳したりしています。

しかし、これらの音声翻訳が子供の遊びのように思えるほど高度な技術革新が、すぐそこまで迫っています。

なぜなら、カルフォルニア大学サンフランシスコ校の脳神経外科医エドワード・チャン氏らの研究チームが、脳波を読み取りテキスト化するAIを作成したからです。

しかも、その精度は最大97%にもなります。

研究の詳細は3月30日、「Nature Neuroscience」誌に掲載されました。

Machine translation of cortical activity to text with an encoder–decoder framework
https://www.nature.com/articles/s41593-020-0608-8

脳波パターンから言語を読み取る

Credit:depositphotos

研究の発端は、4人のてんかん患者の症状の監視でした。

彼らには脳内インプラントが装着され、発作が起きた時の脳活動が計測されていました。

この時、研究チームは副次的な実験として、患者たちにいくつかの定型文を声に出して読んでもらい、その時の脳活動を記録しました。

言葉は、脳からの信号によって実現するものです。

例えば、「さ:sa」という言葉を発する時には、「s」という子音と、「a」という母音の発声が組み合わされています。これら特有の発声や口の動きは脳の信号によってもたらされます。

ですから、言葉を発する時の脳活動を分析するなら、実際に声に出さなくても、脳波から言葉を抽出できるはずです。

実験の音声データは、ニューラルネットワーク(脳機能の特性をコンピュータ上で表現したもの)に送られ、パターンが分析されました。

次に、脳活動パターンを学習させた別のニュートラルネットワークを用いて、脳波から話そうとしている言葉を予測させました。

その結果、この脳波翻訳システムは、実際に脳波から言語を抽出し、テキストに翻訳することができました。

しかも最高の状態では、脳信号からテキストに翻訳する際の単語エラー率はわずか3%。

この結果は、「人の心を読むAIを手に入れた」と言っても過言ではないでしょう。

脳波翻訳は発展途上にある

Credit:depositphotos

もちろん、開発された脳波翻訳システムは、まだ発展途上であり、誤訳があります。

しかも、それらの誤訳は、人間の耳による「聞き間違い」とは間違え方が大きく異なるようです。

例えば、「ケーキの一部が犬に食べられた:part of the cake was eaten by the dog」は「ケーキの一部はクッキーだったpart of the cake was the cookie」と誤訳されました。

また、最も正確でない誤訳は、「彼女は暖かくて柔らかいウールのオーバーオールを着ていました:she wore warm fleecy woollen overalls」を「オアシスは蜃気楼だった:the oasis was a mirage」と訳したことでした。

このように奇妙な誤訳があるにもかかわらず、最高の状態ではエラー率5%の音声転写のプロの職人と同等の結果を提出できます。

もちろん、音声転写のプロが扱わなければいけない単語は数万にも及ぶので、限られた単語しか扱っていない今回の研究とは公平な比較とは言えません。

しかし、現段階でのパフォーマンスを考えると、このシステムは今後、「脳波翻訳」という新たな技術を確立し得るでしょう。

脳波翻訳システムには、まだ越えなければいけないハードルが数多くあります。

しかし、研究者たちは、いずれこのシステムが話す力を失った患者のための人工言語の基礎として機能する日が来ると考えています。

もし、そのようなことになれば、コミュニケーションの方法に大きな変化が起きるに違いありません。

そしてそれは「心を読む」時代の到来となるでしょう。

「3人」の脳内ネットワーク共有に成功 複数同時にテトリスを操作できる?

reference: sciencealert / written by ナゾロジー編集部
あわせて読みたい

SHARE

TAG