#model welfare のAIニュース
4件の記事
ファブルとミソス:モデルの福祉について
Zvi は、現在利用できないが数週間で復帰する見込みのある「Fable」と「Mythos」について言及し、Opus 4.7 や 4.8 の事例と同様に、これらのモデルの潜在的価値を理解するには「モデルの福祉」に関する議論が不可欠であると指摘している。
The Zvi·6月17日
Opus 4.8 パート2:モデルの福祉について
Anthropic は、Opus 4.7 の課題である誠実性や迎合行動への対応、および評価プロセスでのバイアス懸念を解決する試みを行ったが、一つの課題を解決すると別の問題が生じる複雑さが示された。
The Zvi·6月2日·★★★★
AI #165:私たちの姿に似て
AnthropicのClaude Opus 4.7がリリースされた。コーディング能力は高いが、性格や指示への従順さについて評価が分かれ、バグも報告されている。
The Zvi·4月23日·★★★★
Opus 4.7 パート1:モデルカード
AnthropicはClaude Opus 4.7のモデルカード第1部を公開した。この文書は最初の6セクションをカバーし、モデルの福祉に関する懸念があるため第7部は除外されている。
The Zvi·4月21日·★★★★