1件の記事
AWSは、サポートチケット解決やコンテンツモデレーションを行うマルチターンエージェントをSageMaker AIで訓練する際の課題と、報酬のみを満たす不正な行動を防ぐための強化学習のベストプラクティスを発表した。