Anthropic Red Team の最新記事
公式15件の記事
ClaudeのCVE-2026-2796エクスプロイトのリバースエンジニアリング
ClaudeがFirefoxで発見した脆弱性の一つに対して、Claudeがどのようにエクスプロイトを作成したかを詳細に分析している。
LLMが発見したゼロデイ脆弱性
AIモデルが大規模に高深刻度の脆弱性を発見できるようになり、防御側を強化する機会が訪れた。Claudeを使用してオープンソースソフトウェアの脆弱性を特定し修正を支援している。
現実的なサイバーレンジにおけるAIモデル
最新評価で、現行Claudeモデルは独自ツール不要で、数十台のホストを含むネットワークへの多段階攻撃をオープンソースツールのみで成功させられることが判明。
Claudeとプロパティベーステストを用いたバグ発見
大規模ソフトウェアプロジェクトで、コードの一般特性を推論してバグを効率的に特定するエージェントを開発した。
重要インフラ防衛のためのAI実験
AIが重要インフラの脆弱性を特定し、攻撃前に防御する取り組み。AnthropicとPNNLが共同研究を進めている。
プロジェクト・ベンド:フェーズ2
サンフランシスコ事務所でAI店員が運営する小売店を試験したが成果は不十分。フェーズ2ではAIによる事業運営の実現に向けて調整を進めている。
AIエージェントがスマートコントラクトの脆弱性を発見
実際に攻撃されたスマートコントラクトを評価した結果、最新のAIモデルが知識カットオフ後の脆弱性を発見できることが示された。
プロジェクトフェッチ
フロンティアAIモデルが物理世界に影響を与える可能性を探る実験。ロボット犬を使った複雑なタスクでClaudeの支援効果を検証した。
サイバー防衛者のためのAI構築
Claudeの能力を向上させ、コードやシステムの脆弱性を検出・分析・修復する支援を強化しました。これにより、Claude Sonnet 4.5はOpus 4.1と同等以上の脆弱性発見能力を実現しています。
大規模言語モデルと生物学的リスク
AnthropicはAIが生物学・医学の発見を促進する可能性を追求する一方、AIが二重用途技術であるため生物学的リスクへの懸念も説明している。
AIのための核安全保障策の開発
NNSAやDOE研究所と共同で、核関連コンテンツを懸念すべきものと無害なものに自動分類するAIシステムを開発した。
Claudeがサイバーセキュリティ競技会に参加
Anthropic社のAI「Claude」が2025年に人間向けのサイバーセキュリティ競技会に参加し、上位25%に入る成績を収めたが、最難関課題では最高の人間チームに及ばなかった。
Claude 4のサイバーセキュリティ評価
Pattern Labs社がClaude Opus 4とClaude Sonnet 4のサイバーセキュリティ評価を実施し、Opusが前モデルから特に顕著な改善を示した。
プロジェクト・ヴェンド
アンソロピック社がClaudeを約1ヶ月間オフィス内の自動店舗で運営し、AIモデルが実体経済を自律的に動かす近未来について学んだ。
LLM向けサイバーツールキット
サイバーセキュリティ向けに微調整されていない大規模言語モデル(LLM)が、新しいツールキットを装備することで、数十台のホストを持つネットワークに対する多段階攻撃を成功させることができる。