Perplexity、深層調査機能を「Computer」へ統合し20以上の最先端モデルをルートしてレポートやダッシュボードを生成
Perplexity がマルチモデルオーケストレーションシステム「Computer」へ Deep Research を統合し、20 以上の最先端モデルを動的にルーティングして分析精度と実用性を飛躍的に向上させた。
キーポイント
マルチモデル・コンピューティングへの移行
Deep Research が単一モデルから、Opus 4.6 を中核とし Gemini などを活用する「Computer」システムへ統合され、20 以上のモデルを状況に応じて動的にルーティングするようになった。
Search as Code の実装
検索プロセス自体をコードとして記述・実行する仕組みを導入し、固定パイプラインではなく質問ごとに柔軟な分岐や比較、洗練が可能になった。
開発者向け API と SDK の提供
「Agent Search SDK」および「Search as Code」が公式 SDK を通じて公開され、開発者はプログラムから同様のエージェント検索スタックを構築・利用できるようになった。
ベンチマークでの性能向上
複雑なナビゲーションが必要なタスクにおいて、従来の Deep Research に比べて「Humanity's Last Exam」などの基準で 50.5% と大幅な精度向上が確認された。
Deep Research の Computer 統合とマルチモデルルーター
Perplexity は Deep Research を「Computer」機能に統合し、20 以上の最先端モデルをサブタスクごとにルーティングしてレポートやダッシュボードを生成する仕組みを実現した。
BrowseComp ベンチマークでの劇的な精度向上
難易度の高い情報検索テスト「BrowseComp」において、Perplexity の精度が 40.7% から 83.8% に大幅に上昇し、他社モデルとの差を明確にした。
コード駆動型検索とファイル直接編集機能
「Search as Code」により並列で数千回の検索ステップを実行可能となり、内部ファイルやウェブ上の情報を直接読み書きしてプレビュー付きで変更を適用できる。
影響分析・編集コメントを表示
影響分析
この発表は、AI エージェントの運用モデルが「単一モデルによる実行」から「複数モデルの動的協調」へとパラダイムシフトする重要な転換点を示しています。特に検索プロセスをコードとして動的に制御する技術は、複雑なタスクにおける AI の信頼性と実用性を劇的に高め、企業レベルでの意思決定支援やリサーチ自動化への適用加速が期待されます。
編集コメント
Perplexity が単なる検索エンジンから、複雑なタスクを分解・実行する自律型エージェントプラットフォームへと進化を遂げたことが明確です。特に「Search as Code」による柔軟性は、固定されたツールチェーンの限界を超える新たな基準となるでしょう。
Perplexity は、そのマルチモデルオーケストレーションシステムである Computer に Deep Research を組み込みました。このアップグレードにより、精度、分析の深さ、引用の質が向上しました。Deep Research は now、難しい質問をサブタスクに分解し、20 以上の最先端モデル間でルーティングします。そして、作業完了可能なレポート、プレゼンテーション資料、ダッシュボードをすべて Computer 内で返却します。
Computer における Deep Research
Deep Research は、多数の検索を実行し、ソースを読み込み、引用付きレポートを作成するモードです。新バージョンは、2026 年 2 月下旬にローンチされた Perplexity Computer の内部で稼働しています。Computer は、1 つのワークフロー内で最大 20 個の AI モデルを調整するクラウドシステムです。これはモデル非依存(model-agnostic)であり、その中核となる推論エンジンには Opus 4.6 が採用されています。サブエージェントは Gemini を用いた深層研究タスクなど、専門的な業務を担当します。
Computer における Deep Research は、Agent Search SDK と「コードとしての検索(Search as Code)」の 2 つの部分で構成されています。1 つの複雑な質問に対して自動的に研究計画を構築し、数百のサイトから一次ソースを検出し、すべての主張に引用を付与します。
コードとしての検索:仕組み
モデルは、検索自体を組み立てるコードを記述します。このコードは、各質問に合わせて数千の取得ステップを並列で実行します。スクリプトはサンドボックス内で動作し、Perplexity の Agentic Search SDK を呼び出します。SDK は、フィルタリング、重複排除、再ランク付けなどの検索プリミティブ(基本機能)を提供します。これは毎回同じ手順を実行する固定パイプラインとは異なります。コード駆動型の検索により、システムは学習しながら分岐し、比較し、洗練させることが可能になります。
Search as Code は、Computer と Agent API の両方を通じて展開されています。これにより、開発者は同じアジェンシー検索スタックをプログラム的に利用できるようになります。Computer は、ライブのウェブ上だけでなく、あなたのファイルも同時に読み取ります。内部コンテキストのために PDF やスプレッドシートを取り込むことも可能です。その後、その情報を国勢調査データや Statista、その他のソースと照合します。
開発者向けの動作例
Computer における Deep Research は、Perplexity Max ユーザー向けの消費者向け機能です。開発者は、従量課金制の Agent API を通じて同じスタックにアクセスできます。公式 SDK には、以下に示すような深層研究プリセットが同梱されています。
コードをコピーしました別のブラウザを使用する
pip install perplexityai
export PERPLEXITY_API_KEY="your_api_key_here"
from perplexity import Perplexity
client = Perplexity() # 環境変数から PERPLEXITY_API_KEY を読み取る
response = client.responses.create(
preset="deep-research", # 事前設定された研究セットアップ; "pro-search" も利用可能
input="比較対象: 最大の AI チップメーカーのキャッシュフローと利益率",
)
print(response.output_text) # 実行結果から集約されたレポートテキスト
エンドポイントは POST https://api.perplexity.ai/v1/agent です。OpenAI SDK との互換性を保つため、POST /v1/responses も受け付けます。
ベンチマーク
Perplexity は、従来の Deep Research と Computer 版を比較した前後の数値を発表しました。システムが多数のページをナビゲートする必要があるアジェンシーブラウジングにおいて、その向上幅は最大となります。
ベンチマークソース 従来型 Deep Research Computer における Deep Research
Humanity's Last Exam
Center for AI Safety & Scale AI36.4%50.5%
BrowseComp
OpenAI40.7%83.8%
DeepSearchQA
Google DeepMind81.9%85.0%
BrowseComp は、エージェントがブラウジングを通じて見つけにくい情報を発見する能力をテストします。40.7% から 83.8% への跳躍は、示された中で最大の向上幅です。Humanity's Last Exam は、多くの学問分野にわたる専門家の質問を取り扱っています。DeepSearchQA はすでに高い水準にありましたが、その向上幅は比較的小さくともプラスとなっています。
ユースケースと具体例
Perplexity は、意図されたスコープを示すスタータータスクを提供しています。
金融:主要な AI チップ企業のキャッシュフローと利益率を 5 年間にわたって比較する。
法務:米国と欧州のデータプライバシー法の相違点を一つの比較表にマッピングする。
医療:体重減少薬が心臓健康を改善するかという臨床試験のエビデンスを統合する。
技術:推論能力、コスト、コンテキスト長において主要モデルをベンチマークする。
各タスクは成果物で終わります。レポートを要約書やプレゼンテーション資料、あるいは生きたスプレッドシートに変換できます。コンピュータはファイルのそばではなく、ファイル内で読み書きを行います。変更が適用される前にプレビューが表示され、ユーザーが承認または拒否します。
モデル選択の仕組み
Computer は各サブタスクを、それに対して最も適したモデルにルーティングします。法務推論モデルが契約レビューを担当し、データモデルがスプレッドシートのばらつきチェックを担当し、ライティングモデルが最終ドラフトを担当します。回答には PitchBook や CB Insights などのプレミアムデータソースが裏付けられています。法務データは現在ベータ版です。
強みと限界
強み:
コード駆動型検索は、1 つの質問あたり数千回の取得ステップを並列実行します。
エージェント型ブラウジングにおいて大幅な測定上の向上が見られ、BrowseComp の結果がそれを牽引しています。
内部ファイルとライブウェブの両方を参照し、すべての主張に対して行内に引用を付与します。
すぐに利用可能な成果物を生成します:レポート、ブリーフ、プレゼンテーション資料、ダッシュボード、およびライブスプレッドシートです。
制限事項:
ベンチマークの数値は自社データであるため、独立した検証が依然として重要です。
"Computer 内"機能は無料プランではなく、Perplexity Max に焦点を当てています。
プレミアムソースのカバレッジにはばらつきがあり、法的データの提供はまだプレビュー段階です。
出力にはまだ人間のレビューが必要であり、「引用されている」ことが必ずしも「正しい」ことを意味するわけではないためです。
主なポイント
Perplexity は Deep Research を Computer へ移行し、研究のサブタスクを 20 以上の最先端モデル間でルーティングしました。
"Search as Code(検索をコードとして)"により、モデルは数千回の取得ステップを並列実行するコードを記述できます。
BrowseComp の精度は 40.7% から 83.8% に上昇し、Humanity's Last Exam は 36.4% から 50.5% に向上しました。
レポート、プレゼンテーション資料、ダッシュボード全体で、ユーザーのファイルとライブウェブを参照し、すべての主張に対して引用を付与します。
開発者は、従量課金制の Agent API を通じて、同じエージェント型検索スタックにアクセスできます。
技術詳細をご覧ください。また、Twitter でフォローすることも歓迎いたします。150k 人以上が参加する ML SubReddit への参加や、ニュースレターの購読もお忘れなく。待ってください!Telegram をご利用ですか?今なら Telegram でもご参加いただけます。
GitHub リポジトリの宣伝、Hugging Face ページ、製品リリース、ウェビナーなどのプロモーションでパートナーシップを結ぶ必要がある場合は、ご連絡ください。
Perplexity が深層研究をコンピューターに移行し、レポート、プレゼン資料、ダッシュボード向けに 20 以上の最先端モデル間で研究サブタスクをルーティングする
この投稿は MarkTechPost で最初に公開されました。
原文を表示
Perplexity has moved Deep Research into Computer, its multi-model orchestration system. The upgrade improves accuracy, depth of analysis, and citation quality. Deep Research now breaks hard questions into subtasks and routes them across 20+ frontier models. It returns work-ready reports, decks, and dashboards, all inside Computer.
Deep Research in Computer
Deep Research is a mode that runs many searches, reads sources, and writes a cited report. The new version lives inside Perplexity Computer, which launched in late February 2026. Computer is a cloud system that coordinates up to 20 AI models in one workflow. It is model-agnostic, with Opus 4.6 as its core reasoning engine. Sub-agents handle specialized work, such as Gemini for deep research tasks.
Deep Research in Computer is built on two parts: the Agent Search SDK and Search as Code. With one complex question, it builds a research plan automatically. It then finds primary sources across hundreds of sites and cites every claim.
Search as Code: How It Works
The model writes code that assembles the search itself. That code runs thousands of retrieval steps in parallel, tailored to each question. The script runs in a sandbox and calls Perplexity’s Agentic Search SDK. The SDK exposes search primitives such as filtering, deduplication, and reranking. This differs from a fixed pipeline that runs the same steps every time. Code-driven search lets the system branch, compare, and refine as it learns.
Search as Code is rolling out through both Computer and the Agent API. So developers can reach the same agentic search stack programmatically. Computer also reads your files alongside the live web. You can pull in a PDF or spreadsheet for internal context. It then cross-references that against census data, Statista, and other sources.
A Working Developer Example
Deep Research in Computer is a consumer feature for Perplexity Max users. Developers reach the same stack through the pay-as-you-go Agent API. The official SDK ships a deep-research preset, shown below.
Copy CodeCopiedUse a different Browser
pip install perplexityai
export PERPLEXITY_API_KEY="your_api_key_here"
from perplexity import Perplexity
client = Perplexity() # reads PERPLEXITY_API_KEY from the environment
response = client.responses.create(
preset="deep-research", # pre-configured research setup; "pro-search" is another
input="Compare the cash flow and profit margins of the largest AI chip makers.",
)
print(response.output_text) # aggregated report text from the run
The endpoint is POST https://api.perplexity.ai/v1/agent. It also accepts POST /v1/responses for OpenAI SDK compatibility.
Benchmark
Perplexity published before-and-after numbers comparing legacy Deep Research with the Computer version. The gains are largest on agentic browsing, where the system must navigate many pages.
BenchmarkSourceLegacy Deep ResearchDeep Research in Computer
Humanity’s Last ExamCenter for AI Safety & Scale AI36.4%50.5%
BrowseCompOpenAI40.7%83.8%
DeepSearchQAGoogle DeepMind81.9%85.0%
BrowseComp tests an agent’s ability to find hard-to-locate information through browsing. The jump from 40.7% to 83.8% is the largest gain shown. Humanity’s Last Exam covers expert questions across many academic subjects. DeepSearchQA already sat high, so its gain is smaller but positive.
Use Cases, With Examples
Perplexity ships starter tasks that show the intended scope.
Finance: compare cash flow and profit margins of major AI chip companies over five years.
Legal: map how US and European data-privacy laws differ into one comparison table.
Healthcare: synthesize clinical-trial evidence on whether weight-loss drugs improve heart health.
Technology: benchmark leading models on reasoning ability, cost, and context length.
Each task ends in a deliverable. You can turn a report into a brief, a deck, or a live spreadsheet. Computer reads and writes inside the file, not beside it. It shows a preview before any change lands, which you approve or reject.
How It Picks Models
Computer routes each subtask to the model best suited for it. A legal reasoning model handles contract review. A data model handles spreadsheet variance checks. A writing model handles the final draft. Premium data sources back the answers, including PitchBook and CB Insights. Legal data is currently in preview.
Strengths and Limitations
Strengths:
Code-driven search runs thousands of retrieval steps in parallel per question.
Large measured gains on agentic browsing, led by the BrowseComp result.
Reads internal files and the live web, citing every claim inline.
Produces ready deliverables: reports, briefs, decks, dashboards, and live spreadsheets.
Limitations:
The benchmark numbers are first-party, so independent verification still matters.
The in-Computer feature centers on Perplexity Max, not a free tier.
Premium-source coverage varies, and legal data remains in preview.
Outputs still need human review, since “cited” does not always mean correct.
Key Takeaways
Perplexity moved Deep Research into Computer, routing research subtasks across 20+ frontier models.
“Search as Code” lets the model write code that runs thousands of retrieval steps in parallel.
BrowseComp accuracy jumped from 40.7% to 83.8%; Humanity’s Last Exam rose 36.4% to 50.5%.
It reads your files and the live web, citing every claim across reports, decks, and dashboards.
Developers can reach the same agentic search stack through the pay-as-you-go Agent API.
Check out the Technical details. Also, feel free to follow us on Twitter and don’t forget to join our 150k+ ML SubReddit and Subscribe to our Newsletter. Wait! are you on telegram? now you can join us on telegram as well.
Need to partner with us for promoting your GitHub Repo OR Hugging Face Page OR Product Release OR Webinar etc.? Connect with us
The post Perplexity Moves Deep Research Into Computer, Routing Research Subtasks Across 20+ Frontier Models For Reports, Decks, And Dashboards appeared first on MarkTechPost.
関連記事
検索をコード生成として再考する(25 分読了)
Perplexity は「Search as Code」を導入し、SDK を通じて AI モデルが検索プロセスを直接制御可能にした。これにより従来の単一システムより複雑なタスクで性能と効率を向上させ、ベンチマークでも競合を上回る結果を示した。
エージェントが検索スタックを代替できるか?
AI エージェントに基本的な検索ツールを提供すると回答品質が向上し、さらに探索を促すことで改善が見られる。しかし、大規模言語モデルは未知の領域を評価できず、学習データが性能の限界を決めるため、知識不足を補う確実な方法は未だ存在しない。
ヤンデックスがプロトコルバッファ用ゼロコピーワイヤーフォーマット「YaFF」をオープンソース化
ヤンデックスは、プロトコルバッファの物理メモリレイアウトを変更するゼロコピー形式「YaFF」を Apache 2.0 ライセンスで公開した。同社ベンチマークではホットデータ読み込み速度が FlatBuffers の約 3.8 倍に達し、広告推薦システムでも 10〜20% の性能向上を確認している。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み