#reasoning models のAIニュース

12件の記事

Sakana Fugu Ultra が AI Gateway で利用可能に

Sakana AI の「Fugu Ultra」が AI Gateway で利用可能になった。これは単一モデルではなく、複数の最先端モデルを協調させて回答を生成する仕組みで、推論能力は Claude や Fable 5 に匹敵する。

中国の新浪微博研究所が開発した「VibeThinker-3B」は、大規模なパラメータ数に依存しない効率的なアプローチを採用し、検証可能なタスクにおいて数百倍サイズのモデルと同等の性能を発揮する 30 億パラメータの推論モデルとして公開された。

Sebastian Raschka が、2026 年上半期（1 月〜5 月）に注目すべき大規模言語モデル関連の研究論文を選定し、一覧として公開した。

マイクロソフトは年次カンファレンスで、自社開発の推論モデルやセキュリティツールなど新たな AI 施策を発表し、OpenAI との決裂後に業界を主導する姿勢を示した。

Microsoft の Satya Nadella 氏と Mustafa Suleyman 氏が、Microsoft Build で 7 つの新しい MAI モデル（MAI-Thinking-1 など）を発表した。これにより GitHub とエージェントの関係性についても議論された。

マイクロソフトは開発者向けカンファレンス「Build」で、思考能力を強化した AI モデル「MAI-Thinking-1」を含む新シリーズ、専用開発機「Surface RTX Spark Dev Box」、および Windows 向けの「OpenClaw」を発表しました。

AWSとパートナーのランチェーンが共同で、非確定的なAIエージェントの動作を検証する手法を公開した。これは本番環境への展開前にエラーを早期に発見し、ワークフロー全体への悪影響を防ぐための評価フレームワークである。

DeepSeek R1やRLVRから推論時のスケーリング、ベンチマーク、アーキテクチャまで、2025年のLLMの進展と2026年予測を概観。

有料購読者向けに、2025年後半の注目すべきLLM研究論文リストを紹介する記事。著者が厳選した論文をまとめている。

多肢選択ベンチマーク、検証器、リーダーボード、LLMジャッジの4つの評価手法を、コード例を交えて解説。

著者は、ChatGPTやGemineなどAIチャットボットのユーザーが10億人以上に達し、数学オリンピックで金メダルを獲得するなどの進歩が目立つ中、強力なAIがGoogle検索のように身近になる「マス・インテリジェンス」の時代へ移行していると指摘する。

Sebastian Raschka博士は、2025年1月から6月にかけて発表された200本以上のLLM研究論文をテーマ別に整理したリストを公開している。