1件の記事
Google DeepMindが開発した研究志向ライブラリRLaxとJAX、Haiku、Optaxを組み合わせ、Deep Q-Learning(DQN)エージェントを構築し、CartPole環境を解決する強化学習エージェントを実装するチュートリアルである。