#モデルトレーニングのAIニュース

10件の記事

低品質な強化学習環境の提供を止める方法（事例付き）

ジェミニで強化学習を担当したオーリエル・W氏が、大手ラボが抱える課題としてデータ品質の重要性やドメイン専門家の欠如などを指摘し、高品質な学習環境の構築方法を解説している。

プラットフォーム事業者は、選挙における不正情報対策としてAI生成コンテンツの検出・表示規制などの安全策を更新した。

AdobeはAIクリエイティブプラットフォーム「Firefly」を拡張し、ユーザーが自身の画像で学習可能なユーザー定義モデルを導入した。同社はまた、異なるプロバイダーからの30以上のAIモデルを単一環境に統合した。

Vercelは、開発者が使用するツールや構築するアプリケーションを再構築するエージェント機能を反映させるため、利用規約とプライバシーポリシーを更新した。同社は、AIエコシステムへの貢献とプラットフォーム改善のためにデータを使用する方法を明記した。

グーグルリサーチは、最適なベイズシステムの予測から学習することで大規模言語モデルがベイズ推論を近似する訓練方法を提案した。この手法は、多段階インタラクション中に新しい情報を受け取った際のモデルの信念更新方法の改善に焦点を当てている。

NVIDIAが、大規模言語モデル開発の基盤フレームワーク「Megatron Core」に、新しいハイブリッドアーキテクチャ「Falcon-H1」を実装した。この技術は、LLMトレーニングの効率性と拡張性を向上させることを目的としている。

NVIDIAが、大規模言語モデルの長文脈学習をJAXとXLAで高速化する技術を発表した。128Kトークン以上の長文脈処理を効率化する手法を開発した。

AnthropicがClaude AIに新たな憲章を導入し、AIの安全性と倫理的ガイドラインを強化した。

DagsterがRunPod上でLLMトレーニングの各段階を調整し、再現性・拡張性・GPU効率性を確保する方法を示している。

OpenAIがGPT-4.5を、MetaがLlama 4をリリースしたが、従来型モデルのため反応は控えめだった。一方、xAIやAnthropicは強化学習による推論機能を強化している。