#推論モデル のAIニュース

21件の記事

OpenAIが生命科学研究向け推論モデル「GPT-Rosalind」を発表

OpenAIは、生命科学研究向けにカスタマイズされた推論モデル「GPT-Rosalind」を発表した。研究者が仮説から実験への移行を加速することを目的としており、現在は厳格にアクセスが制限されている。

The Decoder·4月17日·★★★★

生命科学研究向けGPT-Rosalindの紹介

OpenAIが、創薬、ゲノム解析、タンパク質推論、科学研究ワークフローを加速するためのフロンティア推論モデル「GPT-Rosalind」を発表した。

OpenAI News·4月16日·★★★★

Arcee AI、ベンチャー資本の半分を投じてClaude Opusに匹敵するオープン推論モデルを構築

米国スタートアップのArcee AIは、4000億パラメータのオープン推論モデル「Trinity-Large-Thinking」を開発し、エージェントタスクでClaude Opusに対抗する。

The Decoder·4月12日·★★★★

GitHub Copilot in Visual Studio Code、3月リリース

GitHub CopilotがVS Codeで完全自律型エージェントセッション「Autopilot」のパブリックプレビュー、ブラウザデバッグ統合、画像・動画チャット対応、カスタマイズ管理用統合エディターをリリースした。

GitHub Changelog·4月8日·★★★★

メタ、マルチモーダル推論モデル「Muse Spark」を公開

メタはマルチモーダル推論モデル「Muse Spark」を公開した。ツール使用やビジュアル思考、マルチエージェント調整機能を備え、Llama 4 より計算資源を10倍以上節約。meta.aiで利用可能で、将来的なオープンソース化も計画している。

Smol AI News·4月8日·★★★★

アリババのQwenチーム、新アルゴリズムでAIモデルの思考を深化

アリババのQwenチームは、各ステップの重要度に応じて報酬を重み付けする新アルゴリズムを開発し、AIモデルの思考プロセスを倍増させた。

The Decoder·4月5日·★★★★

コーディングエージェントの構成要素

著者がコーディングエージェントとエージェントハーネスの全体設計を解説する。エージェントの仕組みと実践的な構成要素について、読者からの質問を踏まえて参照資料として提供する。

Sebastian Raschka·4月4日

OpenAIのグレッグ・ブロックマン氏、GPT推論モデルはAGIへの「視界」があると発言

OpenAI共同創業者のグレッグ・ブロックマン氏が、テキストベースモデルが汎用人工知能を達成できるかという議論は決着したと述べ、GPTアーキテクチャがAGIにつながると主張した。

The Decoder·4月2日·★★★★

AIモデルは自身の推論をほとんど制御できないが、OpenAIはそれが良い兆候だと主張

OpenAIがGPT-5.4の「CoT制御性」を初めて報告し、AIモデルが自身の推論を意図的に操作できるかを測定した。研究では推論モデルがほぼ普遍的にこの課題に失敗しており、OpenAIはAI安全性にとって励みになると述べている。

The Decoder·3月6日

推論モデルは思考連鎖の制御に苦戦、それは良いことだとOpenAIが報告

OpenAIがCoT-Controlを導入し、推論モデルが思考連鎖を制御するのに苦戦していることを発見。これは監視可能性をAI安全対策として強化するものだ。

OpenAI News·3月5日·★★★★

GPT-5.4 思考システムカード

OpenAIがGPT-5.4の思考システムカードを公開し、AIモデルの内部推論プロセスを透明化する新たな説明可能性フレームワークを導入した。

OpenAI News·3月5日·★★★★

新手法によりLLM学習効率が向上

アイドル時間を活用して学習速度を2倍に向上させつつ精度を維持する手法が開発された。

MIT ML News·2月26日·★★★★

研究が示す、推論モデルが解決策を超えて考えがちな理由

AI推論モデルは、最適な停止点を過ぎても推論を続ける傾向があり、効率性と過剰思考のバランスが課題となっています。

The Decoder·2月26日·★★★★

推論におけるCoTの可能性:トレースダイナミクスを詳しく見る

Chain-of-thought(CoT)プロンプトは、大規模言語モデルに人間のような推論を促す標準技術で、最終回答前に個々のステップを明示させる。

Apple Machine Learning·2月24日·★★★★

ジェミニ3 ディープシンク:科学、研究、工学の進歩

最新の科学・研究・工学の課題解決のために、高度な推論モードが更新されました。

Google DeepMind·2月13日·★★★★

Tinker: 一般提供開始と視覚入力機能

Thinking Machines LabがTinkerの一般提供を開始し、視覚入力機能を追加しました。

Thinking Machines Lab·12月12日·★★★★

先週のAI #328 - DeepSeek 3.2、Mistral 3、Trainium3、Runway Gen-4.5

DeepSeekはGPT-5やGemini 3 Proと対抗する新推論モデル「DeepSeek 3.2」を公開した。高速・低コストで高性能なオープンソースモデルであり、業界の競争を激化させる重要なリリースである。

Last Week in AI·12月8日·★★★★

AIにおける過剰思考問題

Amazonは、推論モデルが単純なタスクで必要量の7〜10倍のトークンを生成し、大規模運用で持続不可能なコストが発生する「過剰思考問題」を指摘。メタ認知AIの構想により、計算リソースの配分方法を根本的に変革する可能性を示した。

Amazon Science·11月26日·★★★★

Grok Code Fast 1 の発表:エージェント型コーディングに特化した高速・低コスト推論モデル

xAI が、エージェント型コーディングで優れた性能を発揮する高速かつ経済的な推論モデル「grok-code-fast-1」を発表しました。

xAI News·8月28日

LLM推論モデル推論の現状

研究者らが、大規模言語モデル(LLM)の推論能力を向上させるため、推論時の計算スケーリング、強化学習、教師ありファインチューニング、蒸留などの新戦略を多数発表した。

Sebastian Raschka·3月8日·★★★★

推論LLMの理解

この記事は、推論モデルを構築する4つの主要なアプローチを説明し、LLMに推論能力を付与する方法を解説している。著者は2024年にLLM分野の専門化が進み、RAGからコードアシスタントまで多様な応用が登場したと指摘し、2025年にはこの傾向がさらに加速すると予測している。

Sebastian Raschka·2月5日