メインコンテンツへスキップ

#モデルトレーニング のAIニュース

10件の記事

低品質な強化学習環境の提供を止める方法(事例付き)

ジェミニで強化学習を担当したオーリエル・W氏が、大手ラボが抱える課題としてデータ品質の重要性やドメイン専門家の欠如などを指摘し、高品質な学習環境の構築方法を解説している。

Latent Space·6月6日·★★★★

選挙対策に関する最新情報

プラットフォーム事業者は、選挙における不正情報対策としてAI生成コンテンツの検出・表示規制などの安全策を更新した。

Anthropic News·4月24日·★★★★

Adobe Fireflyが30以上のAIモデルを統合し、ユーザーが独自画像でカスタムスタイルを学習可能に

AdobeはAIクリエイティブプラットフォーム「Firefly」を拡張し、ユーザーが自身の画像で学習可能なユーザー定義モデルを導入した。同社はまた、異なるプロバイダーからの30以上のAIモデルを単一環境に統合した。

The Decoder·3月21日·★★★★

利用規約の更新

Vercelは、開発者が使用するツールや構築するアプリケーションを再構築するエージェント機能を反映させるため、利用規約とプライバシーポリシーを更新した。同社は、AIエコシステムへの貢献とプラットフォーム改善のためにデータを使用する方法を明記した。

Vercel Blog·3月17日

グーグル研究者、大規模言語モデル向けベイズ的教授法を提案

グーグルリサーチは、最適なベイズシステムの予測から学習することで大規模言語モデルがベイズ推論を近似する訓練方法を提案した。この手法は、多段階インタラクション中に新しい情報を受け取った際のモデルの信念更新方法の改善に焦点を当てている。

InfoQ·3月14日·★★★★

NVIDIA Megatron CoreにおけるFalcon-H1ハイブリッドアーキテクチャの実装

NVIDIAが、大規模言語モデル開発の基盤フレームワーク「Megatron Core」に、新しいハイブリッドアーキテクチャ「Falcon-H1」を実装した。この技術は、LLMトレーニングの効率性と拡張性を向上させることを目的としている。

NVIDIA Developer Blog·3月10日·★★★★

JAXとXLAにおける長文脈モデル学習の高速化

NVIDIAが、大規模言語モデルの長文脈学習をJAXとXLAで高速化する技術を発表した。128Kトークン以上の長文脈処理を効率化する手法を開発した。

NVIDIA Developer Blog·2月4日·★★★★

Claudeの新たな憲章

AnthropicがClaude AIに新たな憲章を導入し、AIの安全性と倫理的ガイドラインを強化した。

Anthropic News·1月22日·★★★★

ナノチャットのオーケストレーション:モデルのトレーニング

DagsterがRunPod上でLLMトレーニングの各段階を調整し、再現性・拡張性・GPU効率性を確保する方法を示している。

Dagster Blog·12月9日

LLM推論のための強化学習の現状

OpenAIがGPT-4.5を、MetaがLlama 4をリリースしたが、従来型モデルのため反応は控えめだった。一方、xAIやAnthropicは強化学習による推論機能を強化している。

Sebastian Raschka·4月19日·★★★★