#jax のAIニュース

9件の記事

NVIDIA Blackwell で NVFP4 を使用し、JAX と MaxText でモデルの学習を高速化

NVIDIA は、Blackwell アーキテクチャ上で NVFP4 技術を活用することで、JAX および MaxText を用いた大規模言語モデルの前学習処理におけるスループットが向上し、学習速度が大幅に改善されることを発表した。

Vlad Feinberg氏が、GoogleやTPUを重視した視点から、フロンティアAI研究所で職を得るための準備方法を解説している。

MaxTextが、単一ホストTPU構成で教師ありファインチューニング（SFT）と強化学習（RL）の新サポートを導入し、JAXとTunixライブラリを活用して高性能なモデル改良を可能にした。

Anthropic社が、長時間実行可能なAIモデル「Claude」を科学計算用途向けに開発した。同モデルは複雑な科学シミュレーションやデータ分析を継続的に処理できるように設計されている。

Google DeepMindが開発した研究志向ライブラリRLaxとJAX、Haiku、Optaxを組み合わせ、Deep Q-Learning（DQN）エージェントを構築し、CartPole環境を解決する強化学習エージェントを実装するチュートリアルである。

Diffraxライブラリを使用して微分方程式を解き、ニューラル微分方程式モデルを構築する方法を解説する。JAX、Diffrax、Equinox、Optaxなどのライブラリを導入し、適応型ソルバーによる常微分方程式の解法や任意の時間点での解の取得方法を実演する。

NVIDIAが、大規模言語モデルの長文脈学習をJAXとXLAで高速化する技術を発表した。128Kトークン以上の長文脈処理を効率化する手法を開発した。

軽量なJAXベースのTunixライブラリをGoogle TPUで使用することで、FunctionGemmaモデルのファインチューニングが高速かつ簡単に行える。

Google Researchが開発したAutoBNNは、ベイジアンニューラルネットワークを用いて時系列データの確率的予測を可能にする技術で、不確実性の定量化とモデルの解釈性を向上させます。