Meta AI、非侵襲型脳からテキストへ変換する「Brain2Qwerty v2」を公開し、タイピング中の文章を61%の単語精度で復元
Meta AI は、埋め込み手術を必要としない非侵襲型 MEG 信号からタイピング内容をリアルタイムで解読する「Brain2Qwerty v2」を発表し、単語精度 61% を達成した。
キーポイント
非侵襲型脳-テキスト解読の劇的向上
埋め込み手術や外科処置を必要とせず、MEG(脳磁図)信号からタイピング内容を復元するシステムで、平均単語精度 61%(39% WER)を達成し、既存の非侵襲手法(8%)を大幅に上回った。
深層学習によるエンドツーエンド処理
従来の手作業によるイベント検出を廃止し、畳み込みエンコーダー、トランスフォーマー、文字レベル言語モデルを組み合わせたエンドツーエンドのディープラーニングパイプラインを採用した。
大規模データとオープンソース化
9 人の参加者から約 22,000 文のタイピングデータを収集して訓練され、Meta は v1 および v2 の全トレーニングコードを CC BY-NC 4.0 ライセンスで公開した。
研究段階としての位置づけ
現時点では製品化された消費者向けデバイスではなく、スペインの BCBL 研究所と共同で行われた小規模なボランティア対象の研究プロジェクトであることが明記されている。
言語モデルによる文脈補完
大規模言語モデルを神経データに微調整することでノイズの多い脳記録と一貫した言語出力をつなぎ、人間が実際にタイピングする可能性のある文章へとデコーダを誘導します。
非侵襲型技術における精度の飛躍
Brain2Qwerty v2 は平均単語精度 61% を達成し、既存の非侵襲手法(8%)を大幅に上回っており、最良の参加者では 78% に達しています。
データ量によるスケーラビリティ
精度は記録時間に対して対数線形的に向上し、このスケーリング特性により手術用インプラントとの差をデータ量の増加だけで縮小できる可能性が示唆されています。
影響分析・編集コメントを表示
影響分析
この発表は、脳機インターフェース(BMI)分野において、侵襲的な手術なしで高精度なテキスト入力を可能にする画期的な進展を示しています。特に深層学習モデルの統合により、非侵襲型技術の精度が劇的に向上したことは、将来的に運動機能障害を持つ人々のコミュニケーション支援や、新しい入力デバイスとしての可能性を大きく広げるものです。ただし、現在は研究段階であり、大規模な臨床試験を経て製品化されるまでの課題も残されています。
編集コメント
手術を伴わない脳読み取り技術が実用レベルの精度に到達した点は、医療・福祉分野における未来を切り開く重要なマイルストーンです。ただし、研究データに基づく成果であるため、一般化されるまでの時間と倫理的な検討が必要であることを理解しておくべきでしょう。
Meta AI は Brain2Qwerty v2 を発表しました。このシステムは、非侵襲的な脳記録からリアルタイムで自然な文を解読します。このシステムは、人がタイピングしている間に磁気脳図(MEG)信号を読み取り、埋め込みや手術なしに、その人が入力した内容を再構築します。これは 2025 年 2 月にリリースされた Brain2Qwerty v1 の続編です。Meta はまた、両バージョンの完全なトレーニングコードも公開しています。このパイプラインは、畳み込みエンコーダー、トランスフォーマー、文字レベルの言語モデルを組み合わせたものです。
TL;DR
Brain2Qwerty v2 は、埋め込みや手術なしで非侵襲的な MEG 信号から入力された文を解読します。
平均単語精度は 61%(単語誤り率 39%)に達し、従来の非侵襲的手法の 8% から大幅に向上しました。
最も優れた参加者は単語精度 78% を記録し、文の半数以上が誤り 1 語以内でした。
このパイプラインは、畳み込みエンコーダー、トランスフォーマー、文字レベルの言語モデルに加え、ファインチューニングされた大規模言語モデル(LLM)を組み合わせます。
精度はデータ量に対して対数線形にスケーリングし、v1 と v2 のトレーニングコードは CC BY-NC 4.0 ライセンスの下で公開されています。
Brain2Qwerty v2 とは何か?
Brain2Qwerty v2 は脳からテキストへの変換器です。これは生きた脳活動を文字に、さらに単語や文へとマッピングします。
Meta は、9 人のボランティア参加者からの約 22,000 文のデータを用いてこれを訓練しました。各参加者は、積極的にタイピングしている間に 10 時間記録されました。
記録は MEG デバイスから得られます。MEG はニューロンの活動によって生成される磁場を測定し、高い時間分解能でサンプリングします。
このモデルは、文字レベル、単語レベル、文レベルの表現を活用しています。この階層化された設計により、広範な文脈を用いて局所的な誤りを修正することが可能になります。
重要なのは、これは研究段階のものであり製品ではないということです。デコーダは消費者向けデバイスではなく、小規模なボランティアグループでテストされました。
データはスペインの BCBL(バスク認知・脳・言語センター)で収集されたもので、同研究所に帰属します。
デコーディングパイプラインの仕組み
以前の非侵襲型システムは、神経イベントを検出するために手作業で作成されたパイプラインに依存していました。Brain2Qwerty v2 はこのステップを、エンドツーエンドのディープラーニングで置き換えています。
Meta のリポジトリによると、このモデルは 3 つのコンポーネントを組み合わせています:畳み込みエンコーダ(convolutional encoder)、トランスフォーマー(transformer)、および文字レベルの言語モデルです。
畳み込みエンコーダは生 MEG(脳磁図)信号を読み取り、手作業で設計されたイベント検出器を使用するのではなく、データから直接特徴を学習します。
トランスフォーマーは信号全体にわたる長距離構造をモデル化し、文字レベルの言語モデルがその出力を妥当なテキストへと制約します。
Meta の研究チームは、AI がこの成果を実現する 3 つの方法を説明しています。それぞれは、開発チームが認識できる具体的なエンジニアリング上の決定に対応しています。
ディープラーニングが手作業によるイベント検出を置き換えました。
大規模言語モデル(LLM)は、意味表現を抽出するためにファインチューニングされています。
AI エージェントが自動コード開発を通じてデコーディングパイプラインを反復的に改良しました。最終的なトレーニング設定は、依然として開発者によって手動で選択されました。
ニューラルデータに対する大規模言語モデルのファインチューニングは、意味的な文脈を追加します。この文脈が、ノイズの多い脳記録と一貫性のある言語出力を結びつけます。
実際には、言語モデルは実在する単語を形成しない文字列を拒否します。これにより、デコーダーは人間が実際にタイプしうる文章へと誘導されます。
以下に、公開されたアーキテクチャの例示的なスケッチを示します。これは記述されたコンポーネントを反映したものであり、Meta の正確なトレーニングコードではありません。
Copy CodeCopiedUse a different Browser
import torch
import torch.nn as nn
class Brain2QwertySketch(nn.Module):
"""Illustrative: convolutional encoder -> transformer -> char-level head.
Reflects the components Meta describes, not the official implementation."""
def __init__(self, n_meg_channels=306, d_model=256, n_chars=40):
super().__init__()
# 1) Convolutional encoder over raw MEG channels x time
self.encoder = nn.Sequential(
nn.Conv1d(n_meg_channels, d_model, kernel_size=7, padding=3),
nn.GELU(),
nn.Conv1d(d_model, d_model, kernel_size=5, padding=2),
nn.GELU(),
)
# 2) Transformer models temporal structure
layer = nn.TransformerEncoderLayer(d_model, nhead=8, batch_first=True)
self.transformer = nn.TransformerEncoder(layer, num_layers=6)
# 3) Character-level head; a language model refines this downstream
self.char_head = nn.Linear(d_model, n_chars)
def forward(self, meg): # meg: (batch, channels, time)
x = self.encoder(meg) # (batch, d_model, time)
x = x.transpose(1, 2) # (batch, time, d_model)
x = self.transformer(x) # contextualized features
return self.char_head(x) # (batch, time, n_chars)
Meta の実際のコードを扱うには、リポジトリをクローンして両方のバージョンを確認してください:
git clone https://github.com/facebookresearch/brain2qwerty
brain2qwerty_v1/ と brain2qwerty_v2/ にはトレーニングコードが含まれています
精度の数値
Brain2Qwerty v2 は、平均単語精度率 61% を達成しました。これは単語誤り率(WER: Word Error Rate)が 39% に相当します。
最も優れた参加者においては、モデルは 78% の単語精度に達しています。その参加者については、文の半数以上で誤りが 1 語以下でした。
ここでの事前のベースラインが重要です。Meta によると、他の非侵襲的アプローチでは単語精度はわずか 8% に留まりました。
精度はデータ量に対して対数線形的に向上します。記録時間の増加は、報告された範囲内で予測可能に精度を高めることが示されています。
このスケーリング挙動が、開発者にとっての主要な主張です。これは、データ量のみによって外科的インプラントとの差が縮まる可能性があることを示唆しています。
指標 Brain2Qwerty v2 既存の非侵襲的手法
平均単語精度 61% 8%
平均単語誤り率 (WER) 39% —
最優秀参加者の単語精度 78% —
記録方法 MEG(非侵襲的)非侵襲的
スケーリング挙動 データ量に対して対数線形 —
これらの数値は、管理された環境下でのボランティアから得られたものです。脳損傷患者に対する臨床結果ではありません。
v1 と v2:何が変更されたか
Brain2Qwerty v1 と v2 は異なる指標を報告しているため、注意深く比較する必要があります。v1 は文字レベルで測定され、v2 は単語レベルで測定されました。
| 項目 | Brain2Qwerty v1 (2025 年 2 月) | Brain2Qwerty v2 (2026 年 6 月) |
|---|---|---|
| デバイス | MEG と EEG | MEG |
| 参加者 | 35 人の健康なボランティア | 9 人のボランティア |
| データ | タイプされた文 | ~22,000 文、各々 10 時間分 |
| 報告結果 | 文字の最大 80% (MEG) | 単語精度平均 61% |
| 表現レベル | 文字レベル | 文字・単語・文レベル |
| リアルタイムデコーディング | 強調されていない | リアルタイム文デコーディング |
v1 では、MEG デコーディングが EEG システムよりも少なくとも 2 倍優れていることも示されました。EEG 信号はノイズが多く、これが精度を制限します。
使用例と具体例
主な動機はコミュニケーションの回復です。数百万人が脳病変により、話すことや動くことができません。
定位脳波図 (stereotactic electroencephalography) や皮質脳波図 (electrocorticography) といった侵襲的方法は、すでにニューロプロステシス (neuroprosthesis) を AI デコーダに供給しています。しかし、これらは神経外科手術を必要とし、スケールアップが困難です。
非侵襲的なデコーダーはアクセスの拡大をもたらす可能性があります。患者はインプラントを使用せず、外部からの記録のみを用いて文を入力できるかもしれません。
研究者にとって、公開されたコードは再現性のある神経科学研究を支えます。研究室は独自の MEG データセット上でパイプラインを再トレーニングできます。
AI エンジニアにとって、このプロジェクトは生体信号のデコーディングのためのテンプレートとなります。畳み込みエンコーダーにトランスフォーマーを組み合わせるパターンは、他の生体信号タスクへも転用可能です。
データサイエンティストにとっては、対数線形スケーリングの結果が計画ツールとなります。これにより、新たな記録データをどの程度追加すれば精度が向上するかという枠組みが示されます。
インタラクティブな解説機能
(function(){
window.addEventListener("message",function(e){
if(e.data&&e.data.type==="b2q-resize"){
var f=document.getElementById("b2q-frame");
if(f&&e.data.height){f.style.height=e.data.height+"px";}
}
});
})();
強みと限界
強み:
非侵襲型MEG(脳磁図)から平均単語精度61%を達成し、以前の8%というベースラインから大幅に向上しました。
手作業によるイベント検出ではなく、エンドツーエンドの深層学習を採用しています。
精度はデータ量に対して対数線形にスケーリングするため、改善への明確な道筋が示されています。
v1 および v2 の完全なトレーニングコードは、CC BY-NC 4.0 ライセンスの下で一般公開されています。
アーキテクチャでは標準コンポーネントを再利用しています:畳み込みエンコーダー、トランスフォーマー、文字レベルの言語モデルです。
限界:
MEG は磁気シールド室と被験者の静止状態を必要とするため、実用性が制限されます。
結果は脳損傷患者ではなくボランティア参加者から得られたものです。
ライセンスが非商用であるため、製品への展開が制限されています。
v2 データセットは論文受理まで embargo(公開禁止)期間中にあるため、現時点では v1 のデータのみが利用可能です。
v2 の結果はプレプリントに基づくものであり、v1 の研究は『Nature Neuroscience』で査読済みです。
単語誤り率39%は依然として手術用インプラントの性能には及びません。
論文、リポジトリ、技術詳細をご覧ください。また、Twitter でフォローしていただくこともお気軽にどうぞ。15 万人以上の ML サブレッドに参加し、ニュースレターを購読することも忘れないでください。待ってください!Telegram をご利用ですか?今なら Telegram でも私たちに参加いただけます。
GitHub リポジトリや Hugging Face ページ、製品リリース、ウェビナーなどのプロモーションのためにパートナーシップをご検討の場合は、ご連絡ください。
本記事「Meta AI が非侵襲型 MEG 脳からテキストへのパイプライン Brain2Qwerty v2 を公開、タイピングされた文を単語精度 61% で解読」は、MarkTechPost にて最初に掲載されました。
原文を表示
Meta AI just introduced Brain2Qwerty v2. It decodes natural sentences from non-invasive brain recordings in real time. The system reads magnetoencephalography (MEG) signals while a person types. It reconstructs what they typed, with no implant and no surgery. This is the follow-up to Brain2Qwerty v1, released in February 2025. Meta is also releasing the full training code for both versions. The pipeline combines a convolutional encoder, a transformer, and a character-level language model.
TL;DR
Brain2Qwerty v2 decodes typed sentences from non-invasive MEG signals, with no implant or surgery.
It reaches 61% average word accuracy (39% WER), up from 8% for prior non-invasive methods.
The best participant hit 78% word accuracy, with over half of sentences at one word error or less.
The pipeline pairs a convolutional encoder, transformer, and character-level language model, plus fine-tuned LLMs.
Accuracy scales log-linearly with data; training code for v1 and v2 is released under CC BY-NC 4.0.
What is Brain2Qwerty v2?
Brain2Qwerty v2 is a brain-to-text decoder. It maps raw brain activity to characters, then to words and sentences.
Meta trained it on approximately 22,000 sentences from nine volunteer participants. Each participant was recorded for 10 hours while actively typing.
Recordings come from a MEG device. MEG measures the magnetic fields produced by neuronal activity, sampled at high temporal resolution.
The model leverages character, word and sentence-level representations. That layered design lets it correct local errors using broader context.
Importantly, this is research, not a product. The decoder is not a consumer device, and it was tested on a small group of volunteers.
The data was collected with Spain’s BCBL (Basque Center on Cognition, Brain and Language). It belongs to that research center.
How the Decoding Pipeline Works
Earlier non-invasive systems relied on hand-crafted pipelines to detect neural events. Brain2Qwerty v2 replaces that step with end-to-end deep learning.
Per Meta’s repository, the model combines three components: a convolutional encoder, a transformer, and a character-level language model.
The convolutional encoder reads raw MEG signals. It learns features directly from the data instead of using engineered event detectors.
The transformer models longer-range structure across the signal. The character-level language model then constrains the output toward plausible text.
Meta research team describes three ways AI enables the result. Each maps to a concrete engineering decision teams will recognize.
Deep learning replaces hand-crafted event detection.
Large language models are fine-tuned to extract semantic representations.
AI agents iteratively refined the decoding pipeline through automated code development. Final training configurations were still selected manually by devs
Fine-tuning large language models on neural data adds semantic context. That context bridges noisy brain recordings and coherent language output.
In practice, the language model rejects character sequences that form no real words. It pushes the decoder toward sentences a human would plausibly type.
Here is an illustrative sketch of the published architecture. It mirrors the described components and is not Meta’s exact training code.
Copy CodeCopiedUse a different Browser
import torch
import torch.nn as nn
class Brain2QwertySketch(nn.Module):
"""Illustrative: convolutional encoder -> transformer -> char-level head.
Reflects the components Meta describes, not the official implementation."""
def __init__(self, n_meg_channels=306, d_model=256, n_chars=40):
super().__init__()
# 1) Convolutional encoder over raw MEG channels x time
self.encoder = nn.Sequential(
nn.Conv1d(n_meg_channels, d_model, kernel_size=7, padding=3),
nn.GELU(),
nn.Conv1d(d_model, d_model, kernel_size=5, padding=2),
nn.GELU(),
)
# 2) Transformer models temporal structure
layer = nn.TransformerEncoderLayer(d_model, nhead=8, batch_first=True)
self.transformer = nn.TransformerEncoder(layer, num_layers=6)
# 3) Character-level head; a language model refines this downstream
self.char_head = nn.Linear(d_model, n_chars)
def forward(self, meg): # meg: (batch, channels, time)
x = self.encoder(meg) # (batch, d_model, time)
x = x.transpose(1, 2) # (batch, time, d_model)
x = self.transformer(x) # contextualized features
return self.char_head(x) # (batch, time, n_chars)
To work with Meta’s real code, clone the repository and inspect both versions:
Copy CodeCopiedUse a different Browser
git clone https://github.com/facebookresearch/brain2qwerty
brain2qwerty_v1/ and brain2qwerty_v2/ hold the training code
The Accuracy Numbers
Brain2Qwerty v2 achieves an average word accuracy rate of 61%. That corresponds to a word error rate (WER) of 39%.
For the best participant, the model reaches 78% word accuracy. For that participant, over half of sentences had one word error or less.
The prior baseline matters here. Meta reports that other non-invasive methods reached only 8% word accuracy.
Accuracy also improves log-linearly with data volume. More recording hours predictably raise accuracy in the reported range.
That scaling behavior is the key claim for builders. It suggests the gap with surgical implants could narrow through data alone.
MetricBrain2Qwerty v2Prior non-invasive methods
Average word accuracy61%8%
Average word error rate (WER)39%—
Best participant word accuracy78%—
Recording methodMEG, non-invasiveNon-invasive
Scaling behaviorLog-linear with data—
These numbers come from volunteers in a controlled setting. They are not clinical results for patients with brain injuries.
v1 vs v2: What Changed
Brain2Qwerty v1 and v2 report different metrics, so compare them carefully. v1 was measured at character level, v2 at word level.
AspectBrain2Qwerty v1 (Feb 2025)Brain2Qwerty v2 (Jun 2026)
DevicesMEG and EEGMEG
Participants35 healthy volunteers9 volunteers
DataTyped sentences~22,000 sentences, 10 hours each
Reported resultUp to 80% of characters (MEG)61% average word accuracy
Representation levelCharacter-levelCharacter, word and sentence-level
Real-time decodingNot emphasizedReal-time sentence decoding
v1 also showed MEG decoding was at least twice better than the EEG system. EEG signals are noisier, which limits accuracy.
Use Cases With Examples
The primary motivation is restoring communication. Millions of people have brain lesions that prevent them from speaking or moving.
Invasive methods like stereotactic electroencephalography and electrocorticography already feed a neuroprosthesis to an AI decoder. But they require neurosurgery and are hard to scale.
A non-invasive decoder could widen access. A patient could potentially type sentences without an implant, using only external recordings.
For researchers, the released code supports reproducible neuroscience. A lab could retrain the pipeline on its own MEG dataset.
For AI engineers, the project is a template for biosignal decoding. The convolutional-encoder-plus-transformer pattern transfers to other biosignal tasks.
For data scientists, the log-linear scaling result is a planning tool. It frames how much new recording data may lift accuracy.
Interactive Explainer
(function(){
window.addEventListener("message",function(e){
if(e.data&&e.data.type==="b2q-resize"){
var f=document.getElementById("b2q-frame");
if(f&&e.data.height){f.style.height=e.data.height+"px";}
}
});
})();
Strengths and Limitations
Strengths:
Reaches 61% average word accuracy from non-invasive MEG, up from an 8% prior baseline.
Uses end-to-end deep learning instead of hand-crafted event detection.
Accuracy scales log-linearly with data, giving a clear path to improvement.
Full training code for v1 and v2 is publicly released under CC BY-NC 4.0.
Architecture reuses standard components: convolutional encoder, transformer, character-level language model.
Limitations:
MEG requires a magnetically shielded room and a still subject, limiting practical use.
Results come from volunteer participants, not patients with brain injuries.
The license is non-commercial, restricting product deployment.
The v2 dataset is under embargo until paper acceptance, so only v1 data is available now.
The v2 results come from a preprint; the v1 study was peer-reviewed in Nature Neuroscience.
A 39% word error rate still trails surgical-implant performance.
Check out the Paper, Repo and Technical details. Also, feel free to follow us on Twitter and don’t forget to join our 150k+ML SubReddit and Subscribe to our Newsletter. Wait! are you on telegram? now you can join us on telegram as well.
Need to partner with us for promoting your GitHub Repo OR Hugging Face Page OR Product Release OR Webinar etc.? Connect with us
The post Meta AI Releases Brain2Qwerty v2: A Non-Invasive MEG Brain-to-Text Pipeline Decoding Typed Sentences at 61% Word Accuracy appeared first on MarkTechPost.
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み