#rl (強化学習) のAIニュース

1件の記事

次のパラダイム（7 分間の読了）

AI ラボは、検証可能な報酬からの強化学習の拡張で汎用人工知能の実現を目指しているが、決定論的シミュレータがない分野では限界に直面する。真の継続学習には、一時的なコンテキストメモリの使用からモデルの重み自体への転換が必要である。