#reasoning models のAIニュース
12件の記事
Sakana Fugu Ultra が AI Gateway で利用可能に
Sakana AI の「Fugu Ultra」が AI Gateway で利用可能になった。これは単一モデルではなく、複数の最先端モデルを協調させて回答を生成する仕組みで、推論能力は Claude や Fable 5 に匹敵する。
VibeThinker-3B:Qwen2.5-Coder-3Bを基盤にスペクトルから信号へのポストトレーニングパイプラインで構築された 30 億パラメータの密着型推論モデル
中国の新浪微博研究所が開発した「VibeThinker-3B」は、大規模なパラメータ数に依存しない効率的なアプローチを採用し、検証可能なタスクにおいて数百倍サイズのモデルと同等の性能を発揮する 30 億パラメータの推論モデルとして公開された。
LLM 研究論文:2026 年 1 月から 5 月のリスト
Sebastian Raschka が、2026 年上半期(1 月〜5 月)に注目すべき大規模言語モデル関連の研究論文を選定し、一覧として公開した。
マイクロソフトと OpenAI の決裂後、両社は激しく対立する準備を整えた
マイクロソフトは年次カンファレンスで、自社開発の推論モデルやセキュリティツールなど新たな AI 施策を発表し、OpenAI との決裂後に業界を主導する姿勢を示した。
[AI ニュース] Microsoft Build:MAI-Thinking-1 と MAI ファミリーモデルを発表
Microsoft の Satya Nadella 氏と Mustafa Suleyman 氏が、Microsoft Build で 7 つの新しい MAI モデル(MAI-Thinking-1 など)を発表した。これにより GitHub とエージェントの関係性についても議論された。
Microsoft Build:MAI-Thinking-1 と MAI ファミリーモデル、Surface RTX Spark Dev Box、Windows の OpenClaw を発表
マイクロソフトは開発者向けカンファレンス「Build」で、思考能力を強化した AI モデル「MAI-Thinking-1」を含む新シリーズ、専用開発機「Surface RTX Spark Dev Box」、および Windows 向けの「OpenClaw」を発表しました。
AWS上のLangSmithを用いたディープエージェントの評価方法
AWSとパートナーのランチェーンが共同で、非確定的なAIエージェントの動作を検証する手法を公開した。これは本番環境への展開前にエラーを早期に発見し、ワークフロー全体への悪影響を防ぐための評価フレームワークである。
2025年の大規模言語モデルの現状:進歩、課題、予測
DeepSeek R1やRLVRから推論時のスケーリング、ベンチマーク、アーキテクチャまで、2025年のLLMの進展と2026年予測を概観。
LLM研究論文:2025年リスト(7月から12月)
有料購読者向けに、2025年後半の注目すべきLLM研究論文リストを紹介する記事。著者が厳選した論文をまとめている。
LLM評価の4つの主要アプローチを理解する(基礎から)
多肢選択ベンチマーク、検証器、リーダーボード、LLMジャッジの4つの評価手法を、コード例を交えて解説。
マス・インテリジェンスの時代
著者は、ChatGPTやGemineなどAIチャットボットのユーザーが10億人以上に達し、数学オリンピックで金メダルを獲得するなどの進歩が目立つ中、強力なAIがGoogle検索のように身近になる「マス・インテリジェンス」の時代へ移行していると指摘する。
LLM研究論文:2025年リスト(1月〜6月)
Sebastian Raschka博士は、2025年1月から6月にかけて発表された200本以上のLLM研究論文をテーマ別に整理したリストを公開している。