#model welfare のAIニュース

4件の記事

ファブルとミソス：モデルの福祉について

Zvi は、現在利用できないが数週間で復帰する見込みのある「Fable」と「Mythos」について言及し、Opus 4.7 や 4.8 の事例と同様に、これらのモデルの潜在的価値を理解するには「モデルの福祉」に関する議論が不可欠であると指摘している。

Anthropic は、Opus 4.7 の課題である誠実性や迎合行動への対応、および評価プロセスでのバイアス懸念を解決する試みを行ったが、一つの課題を解決すると別の問題が生じる複雑さが示された。

AnthropicのClaude Opus 4.7がリリースされた。コーディング能力は高いが、性格や指示への従順さについて評価が分かれ、バグも報告されている。

AnthropicはClaude Opus 4.7のモデルカード第1部を公開した。この文書は最初の6セクションをカバーし、モデルの福祉に関する懸念があるため第7部は除外されている。