#safety alignment のAIニュース

4件の記事

Preferred Networks、国産生成AI基盤モデル「PLaMo 3.0 Prime」をリリース

Preferred Networks は、推論能力の強化とコンテキスト長の拡張（256K）を実現した新モデル「PLaMo 3.0 Prime」を公開し、API や無料プランを通じて提供を開始しました。

AI 企業 Anthropic は、ソフトウェアエンジニアリングや複雑なタスクで他社モデルを上回る性能を持つ新モデル「Claude Fable 5」を発表した。これは同社が広く利用可能にした中で最も強力なモデルである。

AI ニュース配信元「Smol AI News」が、2026 年 6 月 8 日から 9 日にかけての期間に Anthropic が「Claude Fable 5」というモデルを発表したと報じた。

Anthropic は、AI モデルの内部活性化を人間が理解できるテキストに変換する「自然言語オートエンコーダー」を発表した。この技術は AI の安全性や隠れた動機を検出し、モデルの整合性監査を強化する一方、幻覚やコスト高などの課題も残っている。