#safety alignment のAIニュース
4件の記事
Preferred Networks、国産生成AI基盤モデル「PLaMo 3.0 Prime」をリリース
Preferred Networks は、推論能力の強化とコンテキスト長の拡張(256K)を実現した新モデル「PLaMo 3.0 Prime」を公開し、API や無料プランを通じて提供を開始しました。
Preferred Networks·6月22日·★★★★
Anthropic が初の Mythos クラスモデル「Claude Fable」を公開
AI 企業 Anthropic は、ソフトウェアエンジニアリングや複雑なタスクで他社モデルを上回る性能を持つ新モデル「Claude Fable 5」を発表した。これは同社が広く利用可能にした中で最も強力なモデルである。
The Verge AI·6月10日·★★★★
Anthropic Claude Fable 5 の発表
AI ニュース配信元「Smol AI News」が、2026 年 6 月 8 日から 9 日にかけての期間に Anthropic が「Claude Fable 5」というモデルを発表したと報じた。
Smol AI News·6月9日·★★★★★
自然言語オートエンコーダー(9 分読了)
Anthropic は、AI モデルの内部活性化を人間が理解できるテキストに変換する「自然言語オートエンコーダー」を発表した。この技術は AI の安全性や隠れた動機を検出し、モデルの整合性監査を強化する一方、幻覚やコスト高などの課題も残っている。
TLDR AI·5月8日·★★★★