メインコンテンツへスキップ

#jax のAIニュース

9件の記事

NVIDIA Blackwell で NVFP4 を使用し、JAX と MaxText でモデルの学習を高速化

NVIDIA は、Blackwell アーキテクチャ上で NVFP4 技術を活用することで、JAX および MaxText を用いた大規模言語モデルの前学習処理におけるスループットが向上し、学習速度が大幅に改善されることを発表した。

NVIDIA Developer Blog·6月9日·★★★★

[AINews] フロンティアラボでの就職に成功する方法(事前学習編)

Vlad Feinberg氏が、GoogleやTPUを重視した視点から、フロンティアAI研究所で職を得るための準備方法を解説している。

Latent Space·5月19日·★★★★

MaxText、単一ホストTPUでのSFTとRLのポストトレーニング機能を拡張

MaxTextが、単一ホストTPU構成で教師ありファインチューニング(SFT)と強化学習(RL)の新サポートを導入し、JAXとTunixライブラリを活用して高性能なモデル改良を可能にした。

Google Developers AI·4月16日

2026年3月23日 科学:科学計算のための長時間実行Claude

Anthropic社が、長時間実行可能なAIモデル「Claude」を科学計算用途向けに開発した。同モデルは複雑な科学シミュレーションやデータ分析を継続的に処理できるように設計されている。

Anthropic Research·3月23日·★★★★

RLax、JAX、Haiku、Optaxを使用してスクラッチからDeep Q-Learning(DQN)を実装し、CartPole強化学習エージェントを訓練する

Google DeepMindが開発した研究志向ライブラリRLaxとJAX、Haiku、Optaxを組み合わせ、Deep Q-Learning(DQN)エージェントを構築し、CartPole環境を解決する強化学習エージェントを実装するチュートリアルである。

MarkTechPost·3月23日

DiffraxとJAXを使用した高度な微分方程式ソルバー、確率的シミュレーション、ニューラル常微分方程式の実装コーディングガイド

Diffraxライブラリを使用して微分方程式を解き、ニューラル微分方程式モデルを構築する方法を解説する。JAX、Diffrax、Equinox、Optaxなどのライブラリを導入し、適応型ソルバーによる常微分方程式の解法や任意の時間点での解の取得方法を実演する。

MarkTechPost·3月19日

JAXとXLAにおける長文脈モデル学習の高速化

NVIDIAが、大規模言語モデルの長文脈学習をJAXとXLAで高速化する技術を発表した。128Kトークン以上の長文脈処理を効率化する手法を開発した。

NVIDIA Developer Blog·2月4日·★★★★

Google TPU上でのTunixを使用した簡単なFunctionGemmaモデルのファインチューニング

軽量なJAXベースのTunixライブラリをGoogle TPUで使用することで、FunctionGemmaモデルのファインチューニングが高速かつ簡単に行える。

Google Developers AI·2月3日

AutoBNN:構成可能なベイジアンニューラルネットワークを用いた確率的時系列予測

Google Researchが開発したAutoBNNは、ベイジアンニューラルネットワークを用いて時系列データの確率的予測を可能にする技術で、不確実性の定量化とモデルの解釈性を向上させます。

Google Research Blog·3月29日·★★★★