脳波から単語へ:手術不要の新たなコミュニケーション手段「Brain2Qwerty」
Meta AI は、脳波からテキストを入力する非侵襲型通信システム「Brain2Qwerty」を発表し、手術不要で脳活動を直接読み取る新たなコミュニケーション経路を確立した。
キーポイント
非侵襲型の技術革新
従来の脳機インターフェース(BMI)が手術を必要としたのに対し、本システムは外部から脳波を読み取る非侵襲的な手法を採用している。
脳波から文字への直接変換
ユーザーの脳活動パターンを検知し、それをリアルタイムでテキストデータに変換する通信経路を提供する。
医療・コミュニケーションへの応用
手術リスクを回避できるため、運動機能障害を持つ患者などにとって、より安全かつアクセスしやすい新しいコミュニケーション手段となる。
影響分析・編集コメントを表示
影響分析
この発表は、脳機インターフェース(BMI)分野において、手術を伴う侵入型から非侵襲型へとパラダイムシフトを起こす可能性を示唆しています。これにより、より多くのユーザーが安全に脳波を利用した通信を実現でき、医療や日常生活におけるアクセシビリティの向上に大きく寄与すると考えられます。
編集コメント
手術不要という点は、脳機インターフェースの実用化における最大の障壁の一つを克服する画期的な進展です。今後の精度向上と実社会への導入が期待されます。
昨年、外科的埋め込みを必要とせず、AI を用いて脳活動をテキストに変換する研究「Brain2Qwerty」v1をご紹介しました。さて、その次のステップとして、非侵襲的な脳記録からリアルタイムで文を解読可能な最高性能のエンドツーエンド・パイプラインである「Brain2Qwerty」v2を発表します。この技術は、これまで脳外科手術を要する手法にしか許容されていなかった精度レベルに近づいています。
神経科学における画期的な進展を加速させるため、「Brain2Qwerty」v1およびv2の完全なトレーニングコードを公開いたします。また、パートナーであるバスク認知・脳・言語センター(BCBL)は、v1 データセットも公開しています。私たちはこの研究が、脳損傷によりコミュニケーションが取れずに苦しむ数百万の人々にとって真に大きな変化をもたらす可能性があると信じています。定位脳波図法や皮質脳波図法といった侵襲的処置では、AI デコーダへ信号を供給する神経補綴装置がコミュニケーションの回復に寄与することが示されていますが、これらの手法はスケーラビリティ(拡張性)の面で課題があります。私たちの非侵襲的なアプローチは、このギャップを埋める手助けができるでしょう。

Brain2Qwerty v2 は、9 人のボランティア参加者から収集した約 22,000 文のデータを用いて訓練されました。各参加者は、磁気脳波計(MEG: magnetoencephalography)を装着しながら能動的にタイピングを行う間、10 時間ずつ記録を行いました。神経イベントを検出するために手作業で設計されたパイプラインに依存するのではなく、生体信号から直接デコードするためにエンドツーエンドの深層学習を採用しています。

神経データに対して大規模言語モデルをファインチューニングすることで、システムは意味的な文脈を活用し、ノイズの多い脳波記録と流暢な言語との間のギャップを埋めることができます。また、デコードパイプラインの最適化を探るために AI エージェントも導入しましたが、最終的な訓練設定はエンジニアによって手動で選択されました。

その結果、Brain2Qwerty v2 はノイズの多いニューラル入力から文を整合性を持って回復させることに成功し、単語精度 61% を達成しました。これは、他の非侵襲的手法 other non-invasive methods の単語精度 8% と比較すると大幅な改善です。また、最も優れた被験者においては単語精度が 78% に達し、すべての文の半数以上が誤り 1 語以内で復号されました。
また、解読精度はデータ量に対して対数線形的に向上することが明らかになり、手術を伴うアプローチとの残りの性能差も、データのスケーリングのみによってさらに縮小できる可能性が示唆されました。本研究は、知覚符号化のための Tribev2 モデル、大規模な脳データを処理するための NeuralSet、モデルを体系的に評価するための NeuralBench を含む、脳のオープンな基盤モデル構築に向けた取り組みに貢献するものです。これらは、Digital Brain Project におけるオープンデータセットの活性化を促すための最近の 500 万ドル基金を通じて、コミュニティと緊密に協力しながら実現されています。私たちは、このように公開で行われる研究が、サイロ(閉鎖的な組織)内での取り組みよりも迅速に神経疾患を特定・診断・治療するための神経科学の進展につながると期待しています。
原文を表示
Last year, we introduced Brain2Qwerty v1, research that uses AI to decode brain activity into text without any surgical implant. Now we're sharing the next step: Brain2Qwerty v2, the highest-performing end-to-end pipeline capable of real-time sentence decoding from non-invasive brain recordings, approaching levels of accuracy previously exclusive to techniques that require brain surgery.
To help accelerate neuroscience breakthroughs, we're releasing the full training code for Brain2Qwerty v1 and v2, and our partner, the Basque Center on Cognition, Brain, and Language (BCBL), is releasing the v1 dataset. We believe this research has the potential to make a real difference for the millions of people who suffer from brain lesions that prevent them from communicating. Invasive procedures like stereotactic electroencephalography and electrocorticography have shown that a neuroprosthesis feeding signals to an AI decoder can restore communication, but they're difficult to scale. Our noninvasive approach can help bridge that gap.

We trained Brain2Qwerty v2 on approximately 22,000 sentences from nine volunteer participants, each recorded for 10 hours wearing a magnetoencephalography (MEG) device while actively typing. Instead of relying on hand-crafted pipelines to detect neural events, we use end-to-end deep learning to decode directly from raw brain signals.

Fine-tuning large language models on neural data allows the system to leverage semantic context, bridging the gap between noisy brain recordings and coherent language. We also deployed AI agents to explore optimizations for the decoding pipeline, with final training configurations selected manually by engineers.

The result: Brain2Qwerty v2 recovers sentences coherently from noisy neural inputs, achieving a word accuracy rate of 61%, significantly improving upon the 8% word accuracy from other non-invasive methods). And for our best participant, we achieve a 78% word accuracy, where more than half of all sentences are decoded with one word error or less.
We also find that decoding accuracy improves log-linearly with data volume, suggesting that the remaining performance gap with surgical approaches could be further narrowed through data scaling alone. This work contributes to our efforts to build open foundational models of the brain, with our Tribev2 model for perception encoding, NeuralSet to process brain data at scale, and NeuralBench to systematically evaluate models. We do this in close collaboration with the community, through our recent $5 million fund to stimulate open datasets in our Digital Brain Project. Our hope is that this work, done in the open, advances neuroscience to identify, diagnose, and treat neurological disorders faster than in siloes.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み