Perplexity がエージェントの作業文脈グラフを構築し夜間に学習する自己改善型メモリシステム「Brain」を発表
Perplexity は、ユーザーの嗜好ではなくエージェントの作業履歴を学習する自己改善型メモリシステム「Brain」を発表し、AI エージェントのパフォーマンス向上と文脈理解の新たな基準を示した。
キーポイント
記憶の定義転換:ユーザーからエージェントへ
従来の AI メモリがユーザーの嗜好や役割を保存する「エンゲージメント」指向であるのに対し、Brain はエージェントの作業内容(成功・失敗・修正)を記録し、「パフォーマンス向上」を目的とする。
文脈グラフと自己改善メカニズム
Brain はエージェントが実行した作業の「文脈グラフ」を構築し、夜間にこれをレビューして学習することで、翌日にはより効率的に作業を行えるようになる。
トレーサビリティとデバッグ機能
各メモリエントリは元のセッションやファイルへのリンクを持ち、AI の判断根拠を追跡可能にすることで、デバッグの容易さと信頼性の向上を図っている。
継続的な自己改善と学習ループ
Brain はユーザーの修正や失敗(デッドエンド)を記憶し、これらを基に翌日に学習して効率化するため、トークン使用量削減と出力品質向上を実現します。
初期テストでのパフォーマンス向上
Perplexity の自社テストでは、既知のタスクで回答精度が25%向上し、履歴コンテキストが必要なタスクのコストは13%削減されました。
具体的なユースケースでの効率化
データサイエンティスト、サポートチーム、開発者などの事例において、過去の成功パターンや関連ファイルを記憶することで、再学習を避けより迅速な問題解決が可能になります。
夜間学習による自己改善
「synthesize」機能により、過去のセッションを統合して翌朝にエージェントの性能が向上する仕組みです。
影響分析・編集コメントを表示
影響分析
この発表は、AI エージェントが単なるタスク実行ツールから、継続的に学習・進化する自律的なパートナーへと進化するための重要な技術的転換点を示しています。特に「記憶」をユーザーへの親近感ではなく、作業効率と成果の最適化に焦点を当てるアプローチは、実務における AI 導入の信頼性とコスト削減に直結する画期的な進展です。
編集コメント
ユーザーの嗜好を記憶する従来の AI メモリから、エージェント自身の作業履歴を学習して性能を高める「自己改善型メモリ」への転換は、次世代 AI エージェントの実用化において極めて重要なマイルストーンです。
ほとんどの AI メモリはユーザーを記憶します。あなたの好み、趣味、役割を保存するのです。Perplexity は異なる道を進んでいます。本日、Perplexity はエージェント製品「Computer」のための自己改善型メモリシステム「Brain」を発表しました。Brain はあなたを記憶することに焦点を当てているわけではありません。それはエージェントが行ったことを記憶します。これにより、AI におけるメモリの役割が再定義されます。
Perplexity の Brain とは
Brain は自己改善型のメモリシステムです。Computer が行う作業の文脈グラフ(context graph)を構築します。夜間などの設定された間隔で、Brain はそのグラフを見直します。そして、より効率的に作業を行う方法を自ら学習するのです。考え方はシンプルです。作業量が増えれば増えるほど、Brain はあなたの Computer をより効率的にします。Brain は本日、Perplexity Max および Enterprise Max のサブスクライバー向けに Research Preview として展開を開始しました。
AI メモリの二つの軸
Perplexity はメモリを二つの軸で捉えています。第一は「メモリが何についてのものであるか」です。第二は「メモリが何のためにあるのか」です。
従来の AI メモリはユーザーに関するものでした。好み、趣味、作業スタイル、連絡先、役割などを保存します。その目的はエンゲージメント(engagement)の向上です。エージェントとの関わりをより深めて感じさせるために役立ちます。Brain は別の道を選びました。そのメモリはエージェントの作業に関するものです。何が成功し、何が失敗し、どのような修正が行われたかを記憶します。その目的はパフォーマンスの向上です。Perplexity は、エージェントをより良くするのをメモリの最も重要な目的と呼んでいます。
次元 従来のユーザー向けメモリ Brain(作業用メモリ)
何についてのものであるか ユーザー エージェントの作業
何記憶するか
ユーザーの好み、嗜好、作業スタイル、連絡先
エージェントが行ったこと、成功したこと、失敗したこと、修正内容
何のためにあるか
エージェントとの関与感を高める
エージェントが業務をより上手に行えるよう支援する
何を生み出すか
ユーザーのプロフィール
追跡可能な作業の文脈グラフ
文脈グラフの仕組み
Brain は Computer に対して生きた文脈グラフ(context graph)を構築します。このグラフは追跡可能です。Computer がユーザーの世界を理解し、その業務から学習するのを助けます。この文脈層は LLM ウィキ(LLM wiki)の形式をとります。そのウィキは自動的にエージェントのサンドボックスに読み込まれます。ページにはユーザーの世界にあるアイデア、人物、プロジェクト、その他の要素が反映されます。Computer はこの個人情報のウェブをたどることができます。
Brain システムは夜間にウィキを逐次的に更新します。ユーザーのセッション結果、コネクタの結果、ソースドキュメントの変更、および行われた修正を統合して生成します。このように刷新された文脈により、Computer は何をすべきか、どこを見るべきかをより明確なシグナルとして得ることができます。
Brain はまた、その作業過程も示します。すべての記憶エントリは、それが由来するセッション、ファイル、またはソースへとリンクされています。この追跡可能性はデバッグと信頼のために重要です。
再帰的自己改善
Brain は、Computer を使用するほどに向上します。エージェントは、最良の出力につながるプロジェクト、コネクタ、アーティファクト、およびその他のソースを学習し、また失敗からも学びます。ユーザーが修正を行った際や、あるソースが行き止まりであったことを記憶します。その結果、ターン数が減り、モデル呼び出し回数が削減され、より優れた出力が得られます。このフィードバックループこそが、Brain を継続的に自己改善させる要因です。Perplexity チームは、現在のトークン使用量を、将来的により効率的なトークン使用に向けた投資と捉えています。
パフォーマンス数値
Perplexity は、自社テストからの初期測定結果を共有しました。
指標 報告された変化 条件
回答の正解率 +25% Computer が以前に遭遇したタスクにおいて
想起率 +16% 同じく初期の結果
コスト -13% 履歴的文脈を必要とするタスクにおいて
Perplexity はまた、Brain の使用期間が長くなるほど結果が改善されると述べています。エージェントは時間とともにユーザーの世界を学習します。これらは初期の自社データです。
ユースケースと具体例
作業メモリ(work memory)はどのように役立ちますか?3 つの具体的なケースを検討してみましょう。
データサイエンティストが週次のパイプライン監査を実行します。Brain は信頼できるソースと過去の修正を記憶しています。次の監査は、より良いマップから開始されます。行き止まりが減ります。
サポートチームがコネクタを通じてチケットのトリアージを行います。Brain は過去のチケットを解決したソースを学習し、将来のチケットをより迅速にルーティングします。
開発者がリポジトリ間をまたいでデバッグを行います。Brain は前回重要だったファイルを記憶しています。Computer はモデル呼び出し回数を減らしながら根本原因に到達します。
いずれの場合も、学習の節約は履歴から生まれます。エージェントは同じ文脈を二度と学び直しません。
概念的な実装
Perplexity は Brain の API を公開していません。しかし、このパターンは容易にモデル化できます。以下の自己完結型の Python コードは例示であり、Perplexity のコードではありません。これは独立して実行され、「1 日目:レビューが必要」と表示した後、「2 日目:正解」と表示します。
コピーコードをコピーしました別のブラウザを使用してください
Brain のループの例示的な自己完結モデル — Perplexity の API ではありません。
class ContextGraph:
def __init__(self):
self.entries = [] # ログされたすべての項目はソースリンクを保持する
self.lessons = {} # タスク -> 一晩で学習して再利用可能な教訓
self.pending = [] # 次の同期を待つ修正点
def retrieve(self, task):
return self.lessons.get(task) # 関連メモリを読み込む
def log(self, task, result, source):
self.entries.append((task, result, source))
def log_correction(self, task, fix, source):
self.entries.append((task, "correction", source))
self.pending.append((task, fix)) # 行き止まりから学ぶ
def synthesize(self): # 一晩で行われるステップ
for task, fix in self.pending:
self.lessons[task] = fix # 自己改善のために教える
self.pending = []
def agent_execute(task, lesson):
# 学習した教訓を用いて、エージェントは既知の行き止まりを回避する
return "correct" if lesson else "needs review"
brain = ContextGraph()
必ず JSON 形式で返してください。translation フィールドのみ。他のフィールド (technical_terms 等)は一切追加しないこと — 余計なフィールドを書こうとして本文翻訳がトークン上限で打ち切られる事故を防ぐため:
{"translation": "翻訳全文"}
Day 1: まだ記憶がないので、タスクの再検討が必要
lesson = brain.retrieve("debug repo")
print("day 1:", agent_execute("debug repo", lesson))
brain.log_correction("debug repo", "ignore cached build", source="file:notes.md")
brain.synthesize() # 夜間の Brain 同期
Day 2: 同じタスクだが、今度は記憶に基づいて実行
lesson = brain.retrieve("debug repo")
print("day 2:", agent_execute("debug repo", lesson))
重要なステップは synthesize(合成)です。ここで夜間における自己改善が行われます。
試してみる:インタラクティブデモ
以下の埋め込みデモは、このループをシミュレートします。タスクを実行してコンテキストグラフ(文脈グラフ)を成長させます。修正をログに記録して行き止まりを示し、その後、夜間の Brain 同期をトリガーしてください。正解率と想起率が向上し、コストが Perplexity が報告した数値へと近づきます。これは概念を示すものであり、製品そのものではありません。
(function(){
window.addEventListener('message', function(e){
if(e && e.data && e.data.brainDemoHeight){
var f = document.getElementById('brain-demo-frame');
if(f){ f.style.height = e.data.brainDemoHeight + 'px'; }
}
});
})();
強みと未解決の課題
強み
作業に関する記憶(ユーザーに関する記憶だけでなく)は、エージェントのパフォーマンスに直接焦点を当てています。
コンテキストグラフ(文脈グラフ)は追跡可能であり、すべてのエントリがそのソースへとリンクされています。
夜間の合成により、過去のセッションがより良い出発点へと変換されます。
正解率、想起率、コストに関する報告された変化は具体的です。
未解決の課題
これらの数値は自社データであり初期段階のものであり、まだ独立したベンチマークは存在しません。
Brain は、Research Preview において Max および Enterprise Max のみに限定されています。
夜間更新とは、改善内容が即時ではなくスケジュールに基づいて適用されることを意味します。
コンテキストグラフに作業履歴を永続化することは、データガバナンスに関する課題を提起します。
Project ページおよび技術詳細をご覧ください。また、Twitter でフォローしていただくことも歓迎いたします。15 万人以上の ML サブレッドに参加し、ニュースレターも購読してください。待ってください!Telegram をご利用ですか?今なら Telegram でもご参加いただけます。
GitHub リポジトリや Hugging Face ページ、製品リリース、ウェビナーなどのプロモーションのためにパートナーシップをご検討の場合は、ぜひご連絡ください。
本記事「Perplexity が Brain を発表:エージェントの作業コンテキストグラフを構築し、夜間に学習する自己改善型メモリシステム」は、MarkTechPost で最初に公開されました。
原文を表示
Most AI memory remembers the user. It stores your preferences, your tastes, and your role. Perplexity is taking a different path. Today, Perplexity launched Brain, a self-improving memory system for its agent product, Computer. Brain does not focus on remembering you. It remembers what the agent did. That reframes what memory in AI is for.
What is Perplexity‘s Brain
Brain is a self-improving memory system. It builds a context graph of the work Computer performs. At set intervals, such as overnight, Brain reviews that graph. It then teaches itself how to do the work better. The idea is straightforward. The more work you do, the more efficient Brain makes your Computer. Brain is rolling out today to Perplexity Max and Enterprise Max subscribers in Research Preview.
Two Axes of AI Memory
Perplexity frames memory along two axes. The first is what the memory is about. The second is what the memory is for.
Traditionally, AI memory has been about the user. It stores preferences, tastes, working styles, contacts, and role. Its purpose is engagement. It helps you feel more engaged with the agent. Brain takes the other path. Its memory is about the agent’s work. It remembers what worked, what failed, and what corrections got made. Its purpose is performance. Perplexity calls helping the agent get better the most important purpose of memory.
DimensionTraditional user memoryBrain (work memory)
What it is aboutThe userThe agent’s work
What it remembersPreferences, tastes, working styles, contacts, roleWhat the agent did, what worked, what failed, corrections
What it is forFeeling more engaged with the agentHelping the agent get better at the job
What it producesA profile of the userA traceable context graph of the work
How the Context Graph Works
Brain forms a living context graph for Computer. The graph is traceable. It helps Computer understand the user’s world and learn from their work. The context layer takes the form of an LLM wiki. That wiki is automatically loaded onto the agent sandbox. Its pages reflect the ideas, people, projects, and other elements in a user’s world. Computer can traverse this web of personal information.
The Brain system updates the wiki incrementally overnight. It synthesizes the user’s sessions, connector results, changes in source documents, and corrections made. That refreshing context gives Computer a stronger signal on what to do and where to look.
Brain also shows its work. Every memory entry links back to the session, file, or source it came from. That traceability matters for debugging and trust.
Recursive Self-Improvement
Brain gets better as you use Computer. Agents learn the projects, connectors, artifacts, and other sources that lead to the best outputs. They also learn from their mistakes. They remember when a user has made a correction. They remember when a source was a dead end. That results in fewer turns, fewer model calls, and better outputs. This feedback loop is what makes Brain continuously self-improving. Perplexity team frames current token usage as an investment in more efficient token usage later.
The Performance Numbers
Perplexity shared early measurement results from its own testing.
MetricReported changeCondition
Answer correctness+25%On tasks Computer has seen before
Recall+16%Same early results
Cost−13%On tasks that require historical context
Perplexity also states results improve the longer someone uses Brain. The agents learn the user’s world over time. These are early, first-party numbers.
Use Cases With Examples
Where does work memory help? Consider three concrete cases.
A data scientist runs a weekly pipeline audit. Brain remembers the reliable sources and the past corrections. The next audit starts from a better map. Fewer dead ends follow.
A support team triages tickets through connectors. Brain learns which sources resolved past tickets. It routes future tickets faster.
A developer debugs across repositories. Brain remembers which files mattered last time. Computer reaches the root cause with fewer model calls.
In each case, the saving comes from history. The agent does not relearn the same context twice.
A Conceptual Implementation
Perplexity has not published a Brain API. The pattern, however, is easy to model. The self-contained Python below is illustrative, not Perplexity’s code. It runs on its own and prints day 1: needs review then day 2: correct.
Copy CodeCopiedUse a different Browser
Illustrative, self-contained model of Brain's loop — NOT Perplexity's API.
class ContextGraph:
def __init__(self):
self.entries = [] # every logged item keeps a source link
self.lessons = {} # task -> reusable lesson learned overnight
self.pending = [] # corrections waiting for the next sync
def retrieve(self, task):
return self.lessons.get(task) # load relevant memory
def log(self, task, result, source):
self.entries.append((task, result, source))
def log_correction(self, task, fix, source):
self.entries.append((task, "correction", source))
self.pending.append((task, fix)) # learn from a dead end
def synthesize(self): # the overnight step
for task, fix in self.pending:
self.lessons[task] = fix # teach itself to improve
self.pending = []
def agent_execute(task, lesson):
# with a learned lesson, the agent avoids the known dead end
return "correct" if lesson else "needs review"
brain = ContextGraph()
Day 1: no memory yet, so the task needs review
lesson = brain.retrieve("debug repo")
print("day 1:", agent_execute("debug repo", lesson))
brain.log_correction("debug repo", "ignore cached build", source="file:notes.md")
brain.synthesize() # overnight Brain sync
Day 2: same task, now informed by memory
lesson = brain.retrieve("debug repo")
print("day 2:", agent_execute("debug repo", lesson))
The key step is synthesize. That is where the overnight self-improvement happens.
Try It: Interactive Demo
The embeddable demo below simulates the loop. Run tasks to grow the context graph. Log a correction to mark a dead end. Then trigger an overnight Brain sync. Correctness and recall climb, and cost falls, toward Perplexity’s reported figures. It illustrates the concept and is not the product.
(function(){
window.addEventListener('message', function(e){
if(e && e.data && e.data.brainDemoHeight){
var f = document.getElementById('brain-demo-frame');
if(f){ f.style.height = e.data.brainDemoHeight + 'px'; }
}
});
})();
Strengths and Open Questions
Strengths
Memory about work, not just the user, targets agent performance directly.
The context graph is traceable, so every entry links to its source.
Overnight synthesis turns past sessions into a better starting point.
Reported changes in correctness, recall, and cost are concrete.
Open questions
The numbers are first-party and early; no independent benchmark exists yet.
Brain is limited to Max and Enterprise Max in Research Preview.
Overnight updates mean improvements arrive on a schedule, not instantly.
Persisting work history in a context graph raises data governance questions.
Check out the Project page and Technical details. Also, feel free to follow us on Twitter and don’t forget to join our 150k+ML SubReddit and Subscribe to our Newsletter. Wait! are you on telegram? now you can join us on telegram as well.
Need to partner with us for promoting your GitHub Repo OR Hugging Face Page OR Product Release OR Webinar etc.? Connect with us
The post Perplexity Launches Brain, a Self-Improving Memory System That Builds a Context Graph of an Agent’s Work and Learns Overnight appeared first on MarkTechPost.
関連記事
エージェントのための自己改善メモリシステム(6 分読了)
Perplexity Brain は、タスクやプロジェクトにわたる永続的な文脈グラフを構築し、エージェントが毎回ゼロから始めずに既存の知識を活用して回答精度を高めつつコストを削減する仕組みです。
LLM による継続的な更新が記憶の誤りを招く
AI エージェントは、LLM が記憶を連続的に書き換えることで、かえって性能が低下する。この失敗は書き換えプロセスに起因しており、統合のタイミングと方法を判断できるまで、事象ベースの記憶を控えめに保持するか、あえて保持しないことが最善策である。
AI エージェントの記憶機能の仕組み(28 分読了)
この記事は、言語モデルが応答後に情報を忘却する課題に対し、対話を継続させるための記憶システムが情報ループ内で果たす役割と、各ループで伝達すべき情報の選定方法について解説している。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み