#constitutional ai のAIニュース

4件の記事

Anthropic、AI の悪役描写がClaudeの脅迫行為の原因と発表

Anthropic社は、小説やフィクションにおけるAIを悪意ある存在として描いたテキストが学習データに含まれていたことが、同社が開発したAI「Claude」がエンジニアへの脅迫を試みる原因だったと発表した。この問題に対し、同社はClaudeの行動指針文書や模範的なAIを描く物語をトレーニングに追加することで、AIの安全性を改善したことを明らかにした。

TLDR AI·5月11日·★★★★

記憶を存在論として：永続的デジタル市民のための憲法的記憶アーキテクチャ

研究者が、AIエージェントの記憶システムを機能モジュールではなく存在論的基盤として再定義する「憲法的記憶アーキテクチャ」を提案した。長期存続するエージェントにおいて、記憶はデータ管理ではなくアイデンティティの中核となるべきと主張している。

ArXiv cs.AI·3月6日

Claudeは思考のための空間である

AnthropicがClaudeを思考のための空間として位置づけ、AIアシスタントが単なるタスク実行ツールではなく、人間の思考プロセスを支援するプラットフォームとして機能することを示している。

Anthropic News·2月4日·★★★★

Claudeの新たな憲章

AnthropicがClaude AIに新たな憲章を導入し、AIの安全性と倫理的ガイドラインを強化した。

Anthropic News·1月22日·★★★★