#llm reasoning のAIニュース

7件の記事

アジェンティック AI に関する一般的な誤解とは何か

KDnuggets は、アジェンティック AI の本質や運用における多くの人が抱いている誤った認識について解説している。

Perplexity、深層調査機能を「Computer」へ統合し20以上の最先端モデルをルートしてレポートやダッシュボードを生成

Perplexity は深層調査機能を自社の多モデル調整システム「Computer」へ移動させました。これにより、複雑な質問をサブタスクに分割し、20 以上の最先端モデル間で処理を振り分けることで、分析の精度と引用品質が向上しました。その結果、作業用のレポートやプレゼン資料、ダッシュボードを同システム内で直接生成できるようになりました。

MarkTechPost·6月12日·★★★★

AI エージェントに専用コンピューターを提供（7 分読了）

LangSmith は、信頼できないコードの実行リスクに対処するため、ハードウェア仮想化されたマイクロ VM を提供する「サンドボックス」を導入しました。これにより AI エージェントは、生産インフラを損なうことなく動的タスクを実行し、永続状態を管理できます。

TLDR AI·6月8日·★★★★

GEPA を用いた反射的プロンプト最適化：多要素プロンプト、構造化フィードバック、検証手法の構築

MarkTechPost は、言語モデルが算数文章題を解く能力を向上させるため、GEPA という反射的プロンプト進化フレームワークの使用法を紹介している。同記事では、弱いシードプロンプトから始め、決定論的なベンチマークと構造化評価器を定義し、候補プロンプトの失敗理由を理解できる実行可能なフィードバックを提供する手法を解説している。また、指示フィールドと出力フォーマット規則が同時に進化するように設計された多要素プロンプト構成も採用されている。

MarkTechPost·6月8日·★★★★

OpenAI が新 SOTA リアルタイム音声 API「GPT-Realtime-2」などを発表

OpenAI は、音声認識・翻訳・リアルタイム通話性能を大幅に向上させた新モデル「GPT-Realtime-2」および関連 API を公開し、ベンチマークで前作より 15.2% 改善したと発表した。

Latent Space·5月8日·★★★★★

GPT-Realtime-2、-Translate、-Whisper：新SOTAリアルタイム音声APIの登場

AIニュース発信元が、OpenAI が発表した新しい SOTA（最新技術）リアルタイム音声 API「GPT-Realtime-2」「-Translate」「-Whisper」について報じた。これらは音声処理の速度と精度を大幅に向上させる新機能である。

Smol AI News·5月7日·★★★★★

LLM推論向上のための推論時スケーリング手法の分類

大規模言語モデルの推論精度向上を目的とした、推論時に適用可能な各種スケーリング手法の分類と、最近の関連研究の概要について解説しています。

Sebastian Raschka·1月24日·★★★★