1件の記事
AWS は、視覚的ショッピングや文書理解などのタスクにおいて、モデルの回答が元画像に根付いているか検証するための新しい評価手法「MLLM-as-a-judge」をStrands Evalsに導入したと発表した。