2件の記事
LangChainのエンジニアが、従来のソフトウェアテストとは異なるAIエージェント評価のための実践的チェックリストを公開した。
著者はエラーを「予期されたエラー」(ユーザーの無効入力など)と「予期しないエラー」(nullポインター例外など)に分類し、前者は正常運用の一部として処理すべきで、後者は開発者の過失を示すバグであると主張している。