学習時にニューロンは精密に調整された指導信号を受信する
MITの研究チームはマウスを用いた脳コンピュータインターフェース実験により、学習時に脳がAIの逆伝播法のように個々のニューロンに精密な誤差信号を送り、活動を変化させることを実証した。
キーポイント
精密な個別学習信号の実証
BCIを用いたマウス実験で、脳が特定のニューロンに対して学習目標に合わせて個別の誤差信号(teaching signals)を送り、活動方向を調整することを確認した。
生物学的学習とAI逆伝播の類似性
ドーパミンなどの神経調節物質による広範囲な報酬信号とは異なり、脳はAIのバックプロパゲーションに似た精密で個別的な調整メカニズムを持つ可能性を示唆した。
脳模倣AIへの応用展望
この発見は生物学的学習の理解を深めるだけでなく、計算効率と生体適合性を両立した次世代脳模倣型人工知能のアーキテクチャ設計に直接的な指針を提供する。
影響分析・編集コメントを表示
影響分析
本研究成果は、長年議論されてきた「脳がAIと同様の精密な誤差信号を用いて学習するか」という問いに実験的に答えた画期的なものである。生物学的な神経可塑性のメカニズムを解明するだけでなく、現在のディープラーニングが抱える計算コストや生物学的非対称性の課題を克服する次世代脳模倣AIの設計思想に直接的な影響を与える。
編集コメント
生物の学習メカニズムとAIの逆伝播法が共通する誤差信号を使用するという発見は、現在のディープラーニングの限界を突破する次世代アーキテクチャ開発への重要な突破口となる。学術論文の発表段階だが、脳科学とAIの融合研究が実結を実し始めていることを示している。
新しいスキルを学ぶ際、脳は細胞ごとに何を変えるかを決定する必要があります。MIT の新たな研究によると、脳は驚くほど精密な方法でこれを行っており、個々のニューロンにターゲットを絞ったフィードバックを送信することで、各ニューロンが正しい方向へ活動を変化させることができるようです。
この発見は、現代の人工知能における重要な考え方を反映しています。多くの AI システムは、自身の出力と目標値を比較して「誤差」信号を計算し、それを用いてネットワーク内の接続を微調整することで学習します。長年の疑問として、脳も同様の個別化されたフィードバックを使用しているのかという点がありましたが、2 月 25 日付の学術誌『Nature』(英語: Nature) のオープンアクセス版に掲載された研究で、MIT の研究者たちがその証拠を報告しました。
MIT の脳科学・認知科学部門准教授であり、マクゴバーン脳研究所の調査員であるマーク・ハネット氏 (Mark Harnett) が率いる研究チームは、脳コンピュータインターフェース (BCI: Brain-Computer Interface) を用いて特定のニューロンの活動を制御するよう動物を訓練することで、マウスにおいてこれらの指示信号を発見しました。研究者らによれば、このアプローチは、生物学的学習の理解を深めるとともに、より優れた脳に着想を得た人工知能の実現を可能にするという点で、人工ニューラルネットワークと実際の脳の間の関係をさらに研究するために使用できると期待されています。
変化する脳
私たちが世界と相互作用するにつれて、脳は絶えず変化し、学習や適応に伴ってその回路を修正しています。「50 年間にわたる研究から、ニューロン間の結合強度を変える方法は多数あることがわかっています」とハネット氏は述べています。「しかし、この分野が本当に欠いているのは、それらの変化がどのように調整されて効率的な学習を生み出すのかを理解する方法です」。
ある行動や、それを可能にする神経接続は、脳内でドーパミンやノルアドレナリンなどのニューロモジュレーター(神経調節物質)の放出によって強化されます。しかし、これらのシグナルは細胞が失敗または成功に個々にどのように貢献したかを区別することなく、多数のニューロン群に対してブロードキャストされます。「ニューロモジュレーターによる強化学習は機能しますが、非効率的です。なぜなら、すべてのニューロンとすべてのシナプスが基本的に一つのシグナルしか受け取らないからです」とハネット氏は言います。
機械学習は、失敗から学ぶための代替かつ極めて強力な方法を用いています。逆伝播(バックプロパゲーション)と呼ばれる手法により、人工ニューラルネットワークは誤差信号を計算し、それを使って個々の接続を調整します。これを繰り返すことで、経験を通じてネットワークを成功のために微調整する方法を学習していきます。「これは非常にうまく機能し、計算上も極めて効果的です」とハネット氏は述べています。
脳も学習のために同様の誤差信号を利用している可能性は高かった。しかし、神経科学者たちは、ソフトウェアや数式ではなく生きた細胞や回路を使用することによって課される制約のため、脳が個々のニューロンに tailored signals(個別化された信号)を送る精度を持つかどうかについては懐疑的だった。この考えを検証する際の大きな問題は、ニューロンにパーソナライズされた指示を提供する信号、すなわちベクトル化された指示信号(vectorized instructive signals)をどのように見つけるかという点であった。Valerio Francioni 氏は『Nature』誌の論文の第一著者であり、Harnett 研究室の元ポスドク研究員だが、この課題について説明するに、「科学者が個々のニューロンが特定の行動にどのように寄与しているかを知らない」ということが挑戦である。
「ピアノを演奏することを学んでいる間、あなたの脳活動を記録していたとすれば、Francioni 氏は説明するように、『あなたの脳内で起こっている変化とピアノの学習との間に相関関係があることを学ぶことになるでしょう。しかし、もし私があなたの脳活動を操作することであなたをより良いピアニストにするよう頼んだとしても、私はそれを行うことはできません。なぜなら、個々のニューロンの活動が最終的なパフォーマンスにどのようにマッピングされるかを私たちが知らないからです』と。
どのニューロンがより活発になる必要があるのか、またどのニューロンが抑制されるべきなのかを知らなければ、そのような変化を指示する信号を探すことなど不可能である。
ニューロンの機能の理解
この問題を回避するために、ハネットのチームは神経活動と報酬の結果を直接結びつける脳コンピュータインターフェース(BCI)タスクを開発しました。これはピアノの鍵盤を単一ニューロンの活動に直接リンクさせることに似ています。このタスクで成功するためには、特定のニューロンがその活動を増加させる必要があり、一方他のニューロンは活動を減少させることが求められました。
彼らは、これらのニューロンにおける活動(マウスの脳にある数百万のニューロンのうちわずか 8 から 10 のニューロン)を視覚的な読み取り値に直接リンクする BCI を設置し、マウスに対してパフォーマンスに関する感覚フィードバックを提供しました。成功すると、甘い報酬が与えられました。
「もし私が『マウスはどのようにしてより多くの報酬を得るのか?どのニューロンを活性化させ、どのニューロンを抑制すべきか?』と尋ねられたら、私はその答えを正確に知っています」とフランキーニ氏は語ります。彼の研究は、MIT のヤン・タン・コレクティブによる Y. エバ・ターンフェローシップによって支援されました。
科学者たちは、BCI にリンクさせた特定のニューロンの正確な機能については知りませんでしたが、これらの細胞は十分に活動しており、信号が偶然にも正しい時にはマウスが定期的に報酬を受け取ることができました。1 週間以内に、マウスは右側のニューロンをオンにし、他のセットのニューロンをオフにしたままにして、より多くの報酬を獲得する方法を学習しました。
フランチーニは、この学習プロセスの間、神経活動の蛍光インジケーターを可視化するために強力な顕微鏡を用いて標的となるニューロンを毎日監視しました。彼は、適切なフィードバック信号が長年到着すると疑われていたニューロンの分岐する樹状突起に焦点を当てました。同時に、彼はそのニューロンの親細胞体における活動も追跡しました。チームはこれらのデータを用いて、ニューロンの樹状突起で受信される信号とその活動との関係、およびマウスが正しいニューロンを活性化することで報酬を得た場合やタスクに失敗した場合にこれらがどのように変化するかを検証しました。
ベクトル化された神経信号
彼らは、BCI を逆方向に制御する活性を持つ2つのグループのニューロンは、マウスが学習する過程で樹状突起において相反する誤差信号も受信したと結論付けました。一部のニューロンにはタスク中に活動を増強するように指示され、他のニューロンにはそれを減衰させるように指示されました。さらに、チームがこれらの指示的な信号を阻害するために樹状突起を操作すると、マウスはタスクの学習に失敗しました。「これは、大脳皮質においてベクトル化された[ニューロン固有]信号に基づく指示的学習が行われているという最初の生物学的証拠です」とハニットは述べています。
脳内におけるベクトル化された信号の発見、およびチームによるその発見能力は、神経科学者と機械学習研究者の間にもっと双方向の交流を促すべきだと、ポスドクのヴィンセント・タンは述べています。「これは、機械学習コミュニティがこの方向に沿ってモデルを開発し続け、新たな仮説を提案し続けるためのさらなる動機付けとなります」と彼は言います。「そうすれば、私たちは戻ってきてそれらをテストできるのです」。
研究者たちは、今回の発見自体について興奮しているのと同様に、このアプローチを将来の実験に応用することについても同じほど興奮していると述べています。
「機械学習は、学習を本当に研究するための堅牢で数学的に扱いやすい方法を提供します。少なくともその一部を直接脳に翻訳できるという事実は、非常に強力です」とフランチーニは言います。
ハネット氏は、このアプローチが脳と機械学習の間の可能な類似点を調査する新たな機会を開くと述べています。「今では、大脳皮質はどのように学ぶのか?他の脳領域はどのように学ぶのか?これは特定のアルゴリズムとどの程度似ており、どの程度異なるのか?生物学的な知見から何を学び、より良く、より脳にインスパイアされたモデルを構築できるかを明らかにできるでしょうか?」と彼は言います。「これは本当に大きな新たな始まりのように感じられます」。
原文を表示
When we learn a new skill, the brain has to decide — cell by cell — what to change. New research from MIT suggests it can do that with surprising precision, sending targeted feedback to individual neurons so each one can adjust its activity in the right direction.
The finding echoes a key idea from modern artificial intelligence. Many AI systems learn by comparing their output to a target, computing an “error” signal, and using it to fine-tune connections within the network. A long-standing question has been whether the brain also uses that kind of individualized feedback. In an open-access study published in the Feb. 25 issue of the journal Nature, MIT researchers report evidence that it does.
A research team led by Mark Harnett, a McGovern Institute for Brain Research investigator and associate professor in the Department of Brain and Cognitive Sciences at MIT, discovered these instructive signals in mice by training animals to control the activity of specific neurons using a brain-computer interface (BCI). Their approach, the researchers say, can be used to further study the relationships between artificial neural networks and real brains, in ways that are expected to both improve understanding of biological learning and enable better brain-inspired artificial intelligence.
The changing brain
Our brains are constantly changing as we interact with the world, modifying their circuitry as we learn and adapt. “We know a lot from 50 years of studies that there are many ways to change the strength of connections between neurons,” Harnett says. “What the field really lacks is a way of understanding how those changes are orchestrated to actually produce efficient learning.”
Some actions — and the neural connections that enable them — are reinforced with the release of neuromodulators like dopamine or norepinephrine in the brain. But those signals are broadcast to large groups of neurons, without discriminating between cells’ individual contributions to a failure or a success. “Reinforcement learning via neuromodulators works, but it’s inefficient, because all the neurons and all the synapses basically get only one signal,” Harnett says.
Machine learning uses an alternative, and extremely powerful, way to learn from mistakes. Using a method called back propagation, artificial neural networks compute an error signal and use it to adjust their individual connections. They do this over and over, learning from experience how to fine-tune their networks for success. “It works really well and it’s computationally very effective,” Harnett says.
It seemed likely that brains might use similar error signals for learning. But neuroscientists were skeptical that brains would have the precision to send tailored signals to individual neurons, due to the constraints imposed by using living cells and circuits instead of software and equations. A major problem for testing this idea was how to find the signals that provide personalized instructions to neurons, which are called vectorized instructive signals. The challenge, explains Valerio Francioni, first author of the *Nature* paper and a former postdoc in Harnett’s lab, is that scientists don’t know how individual neurons contribute to specific behaviors.
“If I was recording your brain activity while you were learning to play piano,” Francioni explains, “I would learn that there is a correlation between the changes happening in your brain and you learning piano. But if you asked me to make you a better piano player by manipulating your brain activity, I would not be able to do that, because we don’t know how the activity of individual neurons map to that ultimate performance.”
Without knowing which neurons need to become more active and which ones should be reined in, it is impossible to look for signals directing those changes.
Understanding neuron function
To get around this problem, Harnett’s team developed a brain-computer interface task to directly link neural activity and reward outcome — akin to linking the keys of the piano directly to the activity of single neurons. To succeed at the task, certain neurons needed to increase their activity, whereas others were required to decrease their activity.
They set up a BCI to directly link activity in those neurons — just eight to 10 of the millions of neurons in a mouse’s brain — to a visual readout, providing sensory feedback to the mice about their performance. Success was accompanied by delivery of a sugary reward.
“Now if you ask me, ‘How does the mouse get more rewards? Which neuron do you have to activate and which neuron do you have to inhibit?’ I know exactly what the answer to that question is,” says Francioni, whose work was supported by a Y. Eva Tan Fellowship from the Yang Tan Collective at MIT.
The scientists didn’t know the exact function of the particular neurons they linked to the BCI, but the cells were active enough that mice received occasional rewards whenever the signals happened to be right. Within a week, mice learned to switch on the right neurons while leaving the other set of neurons inactive, earning themselves more rewards.
Francioni monitored the target neurons daily during this learning process using a powerful microscope to visualize fluorescent indicators of neural activity. He zeroed in on the neurons’ branching dendrites, where the appropriate feedback signals have long been suspected to arrive. At the same time, he tracked activity in the parent cell bodies of those neurons. The team used these data to examine the relationship between signals received at a neuron’s dendrites and its activity, as well as how these changed when mice were rewarded for activating the right neurons or when they failed at their task.
Vectorized neural signals
They concluded that the two groups of neurons whose activity controlled the BCI in opposite ways, also received opposing error signals at their dendrites as the mice learned. Some were told to ramp up their activity during the task, while others were instructed to dial it down. What’s more, when the team manipulated the dendrites to inhibit these instructive signals, mice failed to learn the task. “This is the first biological evidence that vectorized [neuron-specific] signal-based instructive learning is taking place in the cortex,” Harnett says.
The discovery of vectorized signals in the brain — and the team’s ability to find them — should promote more back-and-forth between neuroscientists and machine learning researchers, says postdoc Vincent Tang. “It provides further incentive for the machine learning community to keep developing models and proposing new hypotheses along this direction,” he says. “Then we can come back and test them.”
The researchers say they are just as excited about applying their approach to future experiments as they are about their current discovery.
“Machine learning offers a robust, mathematically tractable way to really study learning. The fact that we can now translate at least some of this directly into the brain is very powerful,” Francioni says.
Harnett says the approach opens new opportunities to investigate possible parallels between the brain and machine learning. “Now we can go after figuring out, how does cortex learn? How do other brain regions learn? How similar or how different is it to this particular algorithm? Can we figure out how to build better, more brain-inspired models from what we learn from the biology?” he says. “This feels like a really big new beginning.”
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み