#モデルトレーニング のAIニュース
10件の記事
低品質な強化学習環境の提供を止める方法(事例付き)
ジェミニで強化学習を担当したオーリエル・W氏が、大手ラボが抱える課題としてデータ品質の重要性やドメイン専門家の欠如などを指摘し、高品質な学習環境の構築方法を解説している。
選挙対策に関する最新情報
プラットフォーム事業者は、選挙における不正情報対策としてAI生成コンテンツの検出・表示規制などの安全策を更新した。
Adobe Fireflyが30以上のAIモデルを統合し、ユーザーが独自画像でカスタムスタイルを学習可能に
AdobeはAIクリエイティブプラットフォーム「Firefly」を拡張し、ユーザーが自身の画像で学習可能なユーザー定義モデルを導入した。同社はまた、異なるプロバイダーからの30以上のAIモデルを単一環境に統合した。
利用規約の更新
Vercelは、開発者が使用するツールや構築するアプリケーションを再構築するエージェント機能を反映させるため、利用規約とプライバシーポリシーを更新した。同社は、AIエコシステムへの貢献とプラットフォーム改善のためにデータを使用する方法を明記した。
グーグル研究者、大規模言語モデル向けベイズ的教授法を提案
グーグルリサーチは、最適なベイズシステムの予測から学習することで大規模言語モデルがベイズ推論を近似する訓練方法を提案した。この手法は、多段階インタラクション中に新しい情報を受け取った際のモデルの信念更新方法の改善に焦点を当てている。
NVIDIA Megatron CoreにおけるFalcon-H1ハイブリッドアーキテクチャの実装
NVIDIAが、大規模言語モデル開発の基盤フレームワーク「Megatron Core」に、新しいハイブリッドアーキテクチャ「Falcon-H1」を実装した。この技術は、LLMトレーニングの効率性と拡張性を向上させることを目的としている。
JAXとXLAにおける長文脈モデル学習の高速化
NVIDIAが、大規模言語モデルの長文脈学習をJAXとXLAで高速化する技術を発表した。128Kトークン以上の長文脈処理を効率化する手法を開発した。
Claudeの新たな憲章
AnthropicがClaude AIに新たな憲章を導入し、AIの安全性と倫理的ガイドラインを強化した。
ナノチャットのオーケストレーション:モデルのトレーニング
DagsterがRunPod上でLLMトレーニングの各段階を調整し、再現性・拡張性・GPU効率性を確保する方法を示している。
LLM推論のための強化学習の現状
OpenAIがGPT-4.5を、MetaがLlama 4をリリースしたが、従来型モデルのため反応は控えめだった。一方、xAIやAnthropicは強化学習による推論機能を強化している。