新たなビジネスインテリジェンスへ:Ultra Deep Researchアシスタント「Sakana Marlin」βテスト開始
Sakana AIは、戦略調査を自律的に実行する商用AIリサーチアシスタント「Sakana Marlin」のクローズドβテストを開始し、推論スケーリングとAB-MCTS技術を活用した8時間単位の自律型リサーチを提供する。
キーポイント
自律型長期推論による戦略調査自動化
8時間かけて人間介入なしで調査を完遂し、構造化されたサマリースライドと詳細レポートを自動出力する。
推論スケーリングとAB-MCTS技術の適用
計算資源を最適配分する木探索アルゴリズムにより、数百〜数千回の試行錯誤を効率的に実行し、探索コストと品質のバランスを取る。
複数モデルの協調とAIサイエンティスト知見の応用
タスクに応じたLLMを動的に選択して協調調査を行い、科学的研究プロセスの自動化技術をビジネスリサーチに転用している。
研究プロセスの完全自動化と自律型推論
アイデア生成から証拠探索、矛盾解消、構造化レポート作成までを人間介入なしで完遂し、AB-MCTSとAIサイエンティストの知見を活用して効率的な推論スケーリングを実現。
意思決定の「深さ・広さ・速さ」の同時実現
人間の認知的制約を超え、情報の収集と構造化をAIが担うことで、論点の深さ、シナリオの網羅性、変化への対応速度を同時に満たす新時代の意思決定インフラを提供。
クローズドβテストの募集とフィードバック活用
金融機関、コンサルティングファーム、シンクタンクなどリサーチ担当者を対象にβテストを無料で実施し、得られたフィードバックをもとにプロダクトを継続的に改善する。
影響分析・編集コメントを表示
影響分析
このリリースは、AIエージェントの用途が単純な対話から「自律的な戦略立案・調査」という高度なビジネスプロセスへ移行していることを示す。推論スケーリングとAB-MCTSの組み合わせは、計算資源の効率化と調査品質の両立を実現する有望なアプローチであり、競合他社の長期推論エージェントとの差別化要因となる可能性がある。
編集コメント
長期推論エージェントの実用化は進むが、βテスト段階であるため実務でのコスト対効果と精度検証が今後の鍵となる。技術的な優位性を示す一方で、ビジネス現場への定着にはユースケースの具体化と信頼性担保が不可欠である。

Sakana AI は、当社初の商用プロダクトとして、独自のエージェント技術によるビジネス向け AI リサーチアシスタント「Sakana Marlin(サカナ・マーリン)」を開発し、βテスターの募集を開始します。
👉 クローズドβテスト申し込みフォーム
背景
Sakana AI は創業以来、独自の着想に基づく研究開発と、その社会実装の両輪に取り組んできました。
研究領域では、科学的発見のプロセスを AI で自動化する「AI サイエンティスト」、複数のモデルを協調させて推論能力を高める「AB-MCTS(複数モデル協調型モンテカルロ木探索)」、アルゴリズムエンジニアリングを自動化する「ALE-Agent」などを発表してきました。これらは、単一モデルの限界を超え、AI の能力を最大限に引き出すための技術です。同時に私たちは、こうした研究成果をビジネス課題の解決に応用することにも注力してきました。具体的には、たとえば銀行業務への AI エージェント実装を通じ、高度なワークフローをエージェントが自律的に実行する仕組みの構築を推進しています。
これらの研究開発での知見と実務実装の経験を統合し、高度な調査業務の自動化に向けて開発したプロダクトが「Sakana Marlin」です。
先行してリリースした「Sakana Chat」では、高度な事後学習(post-training)の技術を背景としつつ、多くの方に最新 AI との対話の可能性を体験していただくことを目指しましたが、この Sakana Marlin はさらに一歩踏み込んだプロフェッショナルな実務、特に戦略立案や高度な意思決定を支援することを目的としています。
Sakana Marlin, Your Virtual CSO.
Sakana Marlin は、高度なビジネス調査を数時間かけて完遂する、独自の長期推論技術に基づく自律型リサーチアシスタントです。
CSO(Chief Strategy Officer:最高戦略責任者)が数人のチームとともに数週間をかけて行うような、重厚な戦略調査を担うことを目的に設計されています。調査テーマをプロンプトとして与えるだけで、AI が 8 時間近くにわたり自律的にリサーチを遂行し、構造化されたサマリースライドと数十ページの包括的な調査レポートを提供します。ユーザーは最初のテーマ設定を行うのみで、それ以降は一切の人間の介入を必要とせず、リサーチを自律的に実行します。
先行して実施した検証では、既存のチャットサービスに搭載されているリサーチ機能と比較して、情報の深掘りにおいて高い実用性を備えているとのフィードバックを得ています。今後は、このクローズドβテストを通じて様々なユースケースにおける評価と改善点の抽出を行い、プロダクトリリースに向けた開発を進めていく予定です。

Sakana Marlin が実際に生成したレポートの例。調査結果をまとめた詳細レポート(上)とスライド資料(下)が出力される。
Marlin を支える技術:効率的な推論スケーリング
従来のリサーチ系エージェントに比べて、Sakana Marlin は「時間をかけて思考する」点に特徴があります。その背景にあるのが、「推論スケーリング」という考え方です。
推論スケーリングと効率的な探索の必要性
19 世紀の経済学者ジェヴォンズは、蒸気機関の効率向上によって石炭の消費効率が上がると、かえって全体の消費量が増えることを見出しました。この逆説は「ジェヴォンズのパラドックス」と呼ばれ、現在の AI においても計算資源の利用に関して同様の現象が起きつつあります。個々のモデルの性能が向上し推論の効率が上がったことで、私たちは「より多くの計算量を投入して、より困難な課題を解かせる」という方向に舵を切れるようになりました。推論時により長く、深く思考させることでよりよいアウトプットを引き出せる。これが推論スケーリング(inference scaling)の本質です。
しかし、単に計算量を闇雲に投入し続けるだけでは、複雑なビジネスリサーチにおいて十分な成果は得られません。無計画な探索は、計算コストに対する費用対効果を悪化させるだけだからです。特に実際のビジネス現場では、正解が一意に定まらない複雑な問題に向き合うことになります。こうした不確実な環境下で、数時間にわたる思考時間をいかに効率的に「質の高い洞察」へと変換できるかが鍵となります。
Sakana Marlin のリサーチ能力は、Sakana AI が継続的に取り組んできた 2 つの研究領域の成果に基づき、この探索の最適化を実現しています。
AB-MCTS:広く深い探索
第一の技術が AB-MCTS(Adaptive Branching Monte Carlo Tree Search)です。これは、推論のプロセスを「木の探索」として捉え、どの仮説が有望かを評価しながら、計算資源を集中させるべきルートを自律的に判断する技術です(国際学会 NeurIPS 2025 にて spotlight(採択論文の上位約 10%)に選出)。Marlin は、単に長く考え続けるのではなく、AB-MCTS によって数百から数千回の試行錯誤を行い、「どの論点を深掘りすべきか」「どの仮説を棄却すべきか」をバランスよく判断します。
具体的には、AB-MCTS を用いることで Sakana Marlin では以下が可能になります。
仮説検証を効果的に繰り返す:同じ問題に対して、1 つの方法で解くのではなく、仮説生成と修正を繰り返すことで思考を洗練させます。各ステップでは評価モデルが有望なアプローチを特定し、探索の方向を最適化します。合計数百回、時には数千回に及ぶ LLM(大規模言語モデル)呼び出しの中で、有望な仮説をさらに深掘りするのか、まったく新しい角度に広げるかを、Sakana Marlin はその都度判断しながら探索します。
複数の AI が協力する:現在、各社が様々な AI モデルを提供していますが、それぞれに得意・不得意があります。Sakana Marlin は単一のモデルに頼るのではなく、複数のモデルがその強みを生かして協調して調査を行います。

AB-MCTS は、推論を改善しながら繰り返す。膨大な探索木を全て試す(左)のではなく、効果的な木探索で試行回数を大幅に削減できる。加えて、異なる種類の LLM を呼び出し、よりそのタスクに適した LLM を選び出す。
AI サイエンティストによるワークフローの自律化
Marlin を支えるもう一つの重要な要素が、科学的発見のプロセスを自動化する「AI サイエンティスト」から得られた知見です。AI サイエンティストは、アイデアの創出から実験、分析、論文執筆、そして査読に至るまでの科学的研究サイクル全体を AI が自律的に遂行する仕組みです。この仕組みの定量的評価も含めた結果を、共同研究者とともに Nature 誌の論文として公開しています。
複雑なリサーチは、単一のクエリに対する回答の集積ではなく、アイデアの生成から、裏付けとなる証拠の探索、矛盾の解消、そして最終的なレポートとしての構造化まで、一連のプロセスを完遂する必要があります。Sakana Marlin は、AI サイエンティストの開発で得たノウハウを応用し、自律的にワークフローを完遂する仕組みをビジネス向けに応用しています。これにより、最初のテーマ設定以降、一切の人間による介入なしで、サマリースライドと数十ページの調査レポートという、完結した成果物を提供することが可能になりました。
Sakana Marlin は、AB-MCTS による戦略的な探索と、AI サイエンティストによるワークフローの自動化を統合することで、長く考えただけアウトプットの質が向上する、効率的な推論スケーリングを実現しています。

【Nature 誌掲載】アイデア創出から査読までの研究サイクルを自律完遂する「AI サイエンティスト」。この最先端の知見が、Marlin の高度なリサーチ能力を支えています。(Credit: Artwork by CERTO, Inc.)
高度かつ迅速な意思決定のインフラへ
私たちは、かつてないほど複雑な世界のなかで意思決定を迫られています。ビジネスにおいて考慮すべき要素は、地政学リスク、AI をはじめとする技術革新、資本市場の動向、各国の規制動向など多岐にわたり、変化も日々激しくなっています。
こうした状況下で良質な意思決定を行うためには、論点を掘り下げる「深さ」、シナリオを網羅する「広さ」、変化に追いつく「速さ」の 3 つの要素を同時に満たさなければなりません。
しかし、人間の認知的・物理的制約のもとでは、これらを同時に実現することは困難です。たとえば、全体把握から情報収集、仮説検証、そして構造化された分析を伴う包括的なリサーチには、通常数週間から数ヶ月を要します。その間にも環境は変化し続け、意思決定を下す頃には情報の鮮度が失われてしまうのです。ここでは、リサーチプロセスにおける「速さ」の限界が意思決定の質を低下させています。
その結果、現代の意思決定においては、情報不足による不合理な判断、重大なリスクシナリオの見落とし、あるいは判断の遅れによる機会損失などが不可避的に発生しています。
Sakana Marlin はこの課題を解決し、意思決定を支える新時代のインフラを構築することを目指しています。広がり続ける情報の海から真に必要な情報を収集し、選択肢を構造化して提示する。この役割を高度な AI が担うことで、人間は「判断」そのものに集中することができ、質の高い意思決定が可能になります。
本日より、Sakana Marlin のクローズドβテスターを募集します。金融機関・事業会社の経営戦略/事業企画部門、コンサルティングファーム、シンクタンク、調査会社など、日常的にリサーチに取り組む方を幅広く対象としています。いただいたフィードバックをもとにプロダクトの改善を重ねていきます。βテスト期間中のご利用は無料です。ぜひご応募ください。
👉 クローズドβテストに応募する
<参考:Sakana Marlin の出力例>
例:地政学リスクとサプライチェーン分析
トピック:トランプ第 2 期政権の発足から約 1 年が経過した現在、就任前に想定されていたリスクと実際の展開にはすでに大きな乖離が生じている。これを踏まえ、2026 年時点で改めて注視すべきトランプ政権のリスク要因を洗い出し、それらが今後 1 年間で日本企業に与えうる影響をシナリオ別に分析する。

トランプ 2.0 政権の通商・産業政策が日本経済に与える構造的影響を、セクター横断で分析した全 61 ページのレポート(本文は 29 ページ+参考文献+付録)。汎用関税・232 条関税の適用動向を整理した上で、半導体・医薬品・EV・重要鉱物など個別セクターごとに具体的な影響経路とデータを提示。公約の実行度合いに応じた複数のシナリオ分析では、米中デカップリングの深化や中間選挙後の政策シフト可能性にまで踏み込み、日本が注視すべき 16 のリスク要因を時間軸とともに整理している。最終章では日本経済が直面する 6 つの構造的課題を抽出し、短期的な関税対応にとどまらない中長期の戦略的論点を提示している。
例:金融業界への AI の影響
トピック:生成 AI(Generative AI)の技術進展を踏まえた、日本の金融機関への影響を分析する。2026 年中に実務レベルで変化が顕在化しうる領域を特定し、経営として対応の優先度を判断できるよう、シナリオ別に具体的な示唆を導く。

2026 年 3 月時点の日本の金融業界における AI(Artificial Intelligence)技術トレンドと実務への影響を網羅的に分析した全 78 ページのレポート(本文は 29 ページ+参考文献+付録)。技術が「生成 AI」から「自律型エージェント(Autonomous Agents)」へと進化し、国内金融機関のデジタル投資が 3 兆円規模に達する中、AI を前提とした組織再設計が本格化していることを報告。業務自動化の進展を評価しつつも、投資が利益に直結しない「ROI ギャップ」や、高度化する AI 金融犯罪への懸念を鋭く指摘しているほか、規制当局によるデータ駆動型監督(Data-driven Supervision)への対応など、経営が直面する多層的な課題に対し、実務レベルでの具体的な優先順位を提示している。
Sakana AI
日本での AI の未来を、Sakana AI と一緒に切り拓いてくださる方を募集しています。当社の募集要項をご覧ください。

原文を表示

Sakana AIは、当社初の商用プロダクトとして、独自のエージェント技術によるビジネス向けAIリサーチアシスタント「Sakana Marlin(サカナ・マーリン)」を開発し、βテスターの募集を開始します。
👉 クローズドβテスト申し込みフォーム
背景
Sakana AIは創業以来、独自の着想に基づく研究開発と、その社会実装の両輪に取り組んできました。
研究領域では、科学的発見のプロセスをAIで自動化する「AIサイエンティスト」、複数のモデルを協調させて推論能力を高める「AB-MCTS」、アルゴリズムエンジニアリングを自動化する「ALE-Agent」などを発表してきました。これらは、単一モデルの限界を超え、AIの能力を最大限に引き出すための技術です。同時に私たちは、こうした研究成果をビジネス課題の解決に応用することにも注力してきました。具体的には、たとえば銀行業務へのAIエージェント実装を通じ、高度なワークフローをエージェントが自律的に実行する仕組みの構築を推進しています。
これらの研究開発での知見と実務実装の経験を統合し、高度な調査業務の自動化に向けて開発したプロダクトが「Sakana Marlin」です。
先行してリリースした「Sakana Chat」では、高度な事後学習(post-training)の技術を背景としつつ、多くの方に最新AIとの対話の可能性を体験していただくことを目指しましたが、このSakana Marlinはさらに一歩踏み込んだプロフェッショナルな実務、特に戦略立案や高度な意思決定を支援することを目的としています。
Sakana Marlin, Your Virtual CSO.
Sakana Marlinは、高度なビジネス調査を数時間かけて完遂する、独自の長期推論技術に基づく自律型リサーチアシスタントです。
CSO(Chief Strategy Officer)が数人のチームとともに数週間をかけて行うような、重厚な戦略調査を担うことを目的に設計されています。調査テーマをプロンプトとして与えるだけで、AIが8時間近くにわたり自律的にリサーチを遂行し、構造化されたサマリースライドと数十ページの包括的な調査レポートを提供します。ユーザーは最初のテーマ設定を行うのみで、それ以降は一切の人間の介入を必要とせず、リサーチを自律的に実行します。
先行して実施した検証では、既存のチャットサービスに搭載されているリサーチ機能と比較して、情報の深掘りにおいて高い実用性を備えているとのフィードバックを得ています。今後は、このクローズドβテストを通じて様々なユースケースにおける評価と改善点の抽出を行い、プロダクトリリースに向けた開発を進めていく予定です。

Sakana Marlinが実際に生成したレポートの例。調査結果をまとめた詳細レポート(上)とスライド資料(下)が出力される。
Marlinを支える技術:効率的な推論スケーリング
従来のリサーチ系エージェントに比べて、Sakana Marlinは「時間をかけて思考する」点に特徴があります。その背景にあるのが、「推論スケーリング」という考え方です。
推論スケーリングと効率的な探索の必要性
19世紀の経済学者ジェヴォンズは、蒸気機関の効率向上によって石炭の消費効率が上がると、かえって全体の消費量が増えることを見出しました。この逆説は「ジェヴォンズのパラドックス」と呼ばれ、現在のAIにおいても計算資源の利用に関して同様の現象が起きつつあります。個々のモデルの性能が向上し推論の効率が上がったことで、私たちは「より多くの計算量を投入して、より困難な課題を解かせる」という方向に舵を切れるようになりました。推論時により長く、深く思考させることでよりよいアウトプットを引き出せる。これが推論スケーリングの本質です。
しかし、単に計算量を闇雲に投入し続けるだけでは、複雑なビジネスリサーチにおいて十分な成果は得られません。無計画な探索は、計算コストに対する費用対効果を悪化させるだけだからです。特に実際のビジネス現場では、正解が一意に定まらない複雑な問題に向き合うことになります。こうした不確実な環境下で、数時間にわたる思考時間をいかに効率的に「質の高い洞察」へと変換できるかが鍵となります。
Sakana Marlinのリサーチ能力は、Sakana AIが継続的に取り組んできた2つの研究領域の成果に基づき、この探索の最適化を実現しています。
AB-MCTS:広く深い探索
第一の技術がAB-MCTS(Adaptive Branching Monte Carlo Tree Search)です。 これは、推論のプロセスを「木の探索」として捉え、どの仮説が有望かを評価しながら、計算資源を集中させるべきルートを自律的に判断する技術です(国際学会NeurIPS 2025にてspotlight(採択論文の上位約10%)に選出)。 Marlinは、単に長く考え続けるのではなく、AB-MCTSによって数百から数千回の試行錯誤を行い、「どの論点を深掘りすべきか」「どの仮説を棄却すべきか」をバランスよく判断します。
具体的には、AB-MCTSを用いることでSakana Marlinでは以下が可能になります。
仮説検証を効果的に繰り返す:同じ問題に対して、1つの方法で解くのではなく、仮説生成と修正を繰り返すことで思考を洗練させます。各ステップでは評価モデルが有望なアプローチを特定し、探索の方向を最適化します。合計数百回、時には数千回に及ぶLLM呼び出しの中で、有望な仮説をさらに深掘りするのか、まったく新しい角度に広げるかを、Sakana Marlinはその都度判断しながら探索します。
複数のAIが協力する:現在、各社が様々なAIモデルを提供していますが、それぞれに得意・不得意があります。Sakana Marlinは単一のモデルに頼るのではなく、複数のモデルがその強みを生かして協調して調査を行います。

AB-MCTSは、推論を改善しながら繰り返す。膨大な探索木を全て試す(左)のではなく、効果的な木探索で試行回数を大幅に削減できる。加えて、異なる種類のLLMを呼び出し、よりそのタスクに適したLLMを選び出す。
AIサイエンティストによるワークフローの自律化
Marlinを支えるもう一つの重要な要素が、科学的発見のプロセスを自動化する「AIサイエンティスト」から得られた知見です。AIサイエンティストは、アイデアの創出から実験、分析、論文執筆、そして査読に至るまでの科学的研究サイクル全体をAIが自律的に遂行する仕組みです。この仕組みの定量的評価も含めた結果を、共同研究者とともにNature誌の論文として公開しています。
複雑なリサーチは、単一のクエリに対する回答の集積ではなく、アイデアの生成から、裏付けとなる証拠の探索、矛盾の解消、そして最終的なレポートとしての構造化まで、一連のプロセスを完遂する必要があります。 Sakana Marlinは、AIサイエンティストの開発で得たノウハウを応用し、自律的にワークフローを完遂する仕組みをビジネス向けに応用しています。これにより、最初のテーマ設定以降、一切の人間による介入なしで、サマリースライドと数十ページの調査レポートという、完結した成果物を提供することが可能になりました。
Sakana Marlinは、AB-MCTSによる戦略的な探索と、AIサイエンティストによるワークフローの自動化を統合することで、長く考えただけアウトプットの質が向上する、効率的な推論スケーリングを実現しています。

【Nature誌掲載】アイデア創出から査読までの研究サイクルを自律完遂する「AIサイエンティスト」。この最先端の知見が、Marlinの高度なリサーチ能力を支えています。(Credit: Artwork by CERTO, Inc.)
高度かつ迅速な意思決定のインフラへ
私たちは、かつてないほど複雑な世界のなかで意思決定を迫られています。ビジネスにおいて考慮すべき要素は、地政学リスク、AIをはじめとする技術革新、資本市場の動向、各国の規制動向など多岐にわたり、変化も日々激しくなっています。
こうした状況下で良質な意思決定を行うためには、論点を掘り下げる「深さ」、シナリオを網羅する「広さ」、変化に追いつく「速さ」の3つの要素を同時に満たさなければなりません。
しかし、人間の認知的・物理的制約のもとでは、これらを同時に実現することは困難です。たとえば、全体把握から情報収集、仮説検証、そして構造化された分析を伴う包括的なリサーチには、通常数週間から数ヶ月を要します。その間にも環境は変化し続け、意思決定を下す頃には情報の鮮度が失われてしまうのです。ここでは、リサーチプロセスにおける「速さ」の限界が意思決定の質を低下させています。
その結果、現代の意思決定においては、情報不足による不合理な判断、重大なリスクシナリオの見落とし、あるいは判断の遅れによる機会損失などが不可避的に発生しています。
Sakana Marlinはこの課題を解決し、意思決定を支える新時代のインフラを構築することを目指しています。広がり続ける情報の海から真に必要な情報を収集し、選択肢を構造化して提示する。この役割を高度なAIが担うことで、人間は「判断」そのものに集中することができ、質の高い意思決定が可能になります。
本日より、Sakana Marlinのクローズドβテスターを募集します。金融機関・事業会社の経営戦略/事業企画部門、コンサルティングファーム、シンクタンク、調査会社など、日常的にリサーチに取り組む方を幅広く対象としています。いただいたフィードバックをもとにプロダクトの改善を重ねていきます。βテスト期間中のご利用は無料です。ぜひご応募ください。
👉 クローズドβテストに応募する
<参考:Sakana Marlinの出力例>
例:地政学リスクとサプライチェーン分析
トピック:トランプ第2期政権の発足から約1年が経過した現在、就任前に想定されていたリスクと実際の展開にはすでに大きな乖離が生じている。これを踏まえ、2026年時点で改めて注視すべきトランプ政権のリスク要因を洗い出し、それらが今後1年間で日本企業に与えうる影響をシナリオ別に分析する。

トランプ2.0政権の通商・産業政策が日本経済に与える構造的影響を、セクター横断で分析した全61ページのレポート(本文は29ページ+参考文献+付録)。汎用関税・232条関税の適用動向を整理した上で、半導体・医薬品・EV・重要鉱物など個別セクターごとに具体的な影響経路とデータを提示。公約の実行度合いに応じた複数のシナリオ分析では、米中デカップリングの深化や中間選挙後の政策シフト可能性にまで踏み込み、日本が注視すべき16のリスク要因を時間軸とともに整理している。最終章では日本経済が直面する6つの構造的課題を抽出し、短期的な関税対応にとどまらない中長期の戦略的論点を提示している。
例:金融業界へのAIの影響
トピック:生成AIの技術進展を踏まえた、日本の金融機関への影響を分析する。2026年中に実務レベルで変化が顕在化しうる領域を特定し、経営として対応の優先度を判断できるよう、シナリオ別に具体的な示唆を導く。

2026年3月時点の日本の金融業界におけるAI技術トレンドと実務への影響を網羅的に分析した全78ページのレポート(本文は29ページ+参考文献+付録)。技術が「生成AI」から「自律型エージェント」へと進化し、国内金融機関のデジタル投資が3兆円規模に達する中、AIを前提とした組織再設計が本格化していることを報告。業務自動化の進展を評価しつつも、投資が利益に直結しない「ROIギャップ」や、高度化するAI金融犯罪への懸念を鋭く指摘しているほか、規制当局によるデータ駆動型監督への対応など、経営が直面する多層的な課題に対し、実務レベルでの具体的な優先順位を提示している。
Sakana AI
日本でのAIの未来を、Sakana AIと一緒に切り拓いてくださる方を募集しています。当社の募集要項をご覧ください。

関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み