#jax のAIニュース
9件の記事
NVIDIA Blackwell で NVFP4 を使用し、JAX と MaxText でモデルの学習を高速化
NVIDIA は、Blackwell アーキテクチャ上で NVFP4 技術を活用することで、JAX および MaxText を用いた大規模言語モデルの前学習処理におけるスループットが向上し、学習速度が大幅に改善されることを発表した。
[AINews] フロンティアラボでの就職に成功する方法(事前学習編)
Vlad Feinberg氏が、GoogleやTPUを重視した視点から、フロンティアAI研究所で職を得るための準備方法を解説している。
MaxText、単一ホストTPUでのSFTとRLのポストトレーニング機能を拡張
MaxTextが、単一ホストTPU構成で教師ありファインチューニング(SFT)と強化学習(RL)の新サポートを導入し、JAXとTunixライブラリを活用して高性能なモデル改良を可能にした。
2026年3月23日 科学:科学計算のための長時間実行Claude
Anthropic社が、長時間実行可能なAIモデル「Claude」を科学計算用途向けに開発した。同モデルは複雑な科学シミュレーションやデータ分析を継続的に処理できるように設計されている。
RLax、JAX、Haiku、Optaxを使用してスクラッチからDeep Q-Learning(DQN)を実装し、CartPole強化学習エージェントを訓練する
Google DeepMindが開発した研究志向ライブラリRLaxとJAX、Haiku、Optaxを組み合わせ、Deep Q-Learning(DQN)エージェントを構築し、CartPole環境を解決する強化学習エージェントを実装するチュートリアルである。
DiffraxとJAXを使用した高度な微分方程式ソルバー、確率的シミュレーション、ニューラル常微分方程式の実装コーディングガイド
Diffraxライブラリを使用して微分方程式を解き、ニューラル微分方程式モデルを構築する方法を解説する。JAX、Diffrax、Equinox、Optaxなどのライブラリを導入し、適応型ソルバーによる常微分方程式の解法や任意の時間点での解の取得方法を実演する。
JAXとXLAにおける長文脈モデル学習の高速化
NVIDIAが、大規模言語モデルの長文脈学習をJAXとXLAで高速化する技術を発表した。128Kトークン以上の長文脈処理を効率化する手法を開発した。
Google TPU上でのTunixを使用した簡単なFunctionGemmaモデルのファインチューニング
軽量なJAXベースのTunixライブラリをGoogle TPUで使用することで、FunctionGemmaモデルのファインチューニングが高速かつ簡単に行える。
AutoBNN:構成可能なベイジアンニューラルネットワークを用いた確率的時系列予測
Google Researchが開発したAutoBNNは、ベイジアンニューラルネットワークを用いて時系列データの確率的予測を可能にする技術で、不確実性の定量化とモデルの解釈性を向上させます。