Anthropic Red Team の最新記事

公式

17件の記事

Claude Mythos Previewのサイバーセキュリティ能力の評価

Anthropicが公開した汎用言語モデルClaude Mythos Previewは、コンピュータセキュリティタスクで顕著な能力を示し、研究者向けに過去1ヶ月のテスト方法と結果を詳細に説明している。同社はこれをセキュリティ分野の画期的な瞬間と位置付けている。

Anthropic Red Team·4月7日·★★★★

Mozillaとの提携でFirefoxのセキュリティを向上

Claude Opus 4.6がMozillaの研究者と協力し、2週間でFirefoxの脆弱性を22件発見した。

Anthropic Red Team·3月6日

ClaudeのCVE-2026-2796エクスプロイトのリバースエンジニアリング

ClaudeがFirefoxで発見した脆弱性の一つに対して、Claudeがどのようにエクスプロイトを作成したかを詳細に分析している。

Anthropic Red Team·3月6日·★★★★

LLMが発見したゼロデイ脆弱性

AIモデルが大規模に高深刻度の脆弱性を発見できるようになり、防御側を強化する機会が訪れた。Claudeを使用してオープンソースソフトウェアの脆弱性を特定し修正を支援している。

Anthropic Red Team·2月5日·★★★★

現実的なサイバーレンジにおけるAIモデル

最新評価で、現行Claudeモデルは独自ツール不要で、数十台のホストを含むネットワークへの多段階攻撃をオープンソースツールのみで成功させられることが判明。

Anthropic Red Team·1月16日·★★★★

Claudeとプロパティベーステストを用いたバグ発見

大規模ソフトウェアプロジェクトで、コードの一般特性を推論してバグを効率的に特定するエージェントを開発した。

Anthropic Red Team·1月14日·★★★★

重要インフラ防衛のためのAI実験

AIが重要インフラの脆弱性を特定し、攻撃前に防御する取り組み。AnthropicとPNNLが共同研究を進めている。

Anthropic Red Team·1月8日·★★★★

プロジェクト・ベンド：フェーズ2

サンフランシスコ事務所でAI店員が運営する小売店を試験したが成果は不十分。フェーズ2ではAIによる事業運営の実現に向けて調整を進めている。

Anthropic Red Team·12月18日

AIエージェントがスマートコントラクトの脆弱性を発見

実際に攻撃されたスマートコントラクトを評価した結果、最新のAIモデルが知識カットオフ後の脆弱性を発見できることが示された。

Anthropic Red Team·12月1日·★★★★

プロジェクトフェッチ

フロンティアAIモデルが物理世界に影響を与える可能性を探る実験。ロボット犬を使った複雑なタスクでClaudeの支援効果を検証した。

Anthropic Red Team·11月12日·★★★★

サイバー防衛者のためのAI構築

Claudeの能力を向上させ、コードやシステムの脆弱性を検出・分析・修復する支援を強化しました。これにより、Claude Sonnet 4.5はOpus 4.1と同等以上の脆弱性発見能力を実現しています。

Anthropic Red Team·9月29日·★★★★

大規模言語モデルと生物学的リスク

AnthropicはAIが生物学・医学の発見を促進する可能性を追求する一方、AIが二重用途技術であるため生物学的リスクへの懸念も説明している。

Anthropic Red Team·9月5日·★★★★

AIのための核安全保障策の開発

NNSAやDOE研究所と共同で、核関連コンテンツを懸念すべきものと無害なものに自動分類するAIシステムを開発した。

Anthropic Red Team·8月21日·★★★★

Claudeがサイバーセキュリティ競技会に参加

Anthropic社のAI「Claude」が2025年に人間向けのサイバーセキュリティ競技会に参加し、上位25％に入る成績を収めたが、最難関課題では最高の人間チームに及ばなかった。

Anthropic Red Team·8月9日

Claude 4のサイバーセキュリティ評価

Pattern Labs社がClaude Opus 4とClaude Sonnet 4のサイバーセキュリティ評価を実施し、Opusが前モデルから特に顕著な改善を示した。

Anthropic Red Team·7月15日

プロジェクト・ヴェンド

アンソロピック社がClaudeを約1ヶ月間オフィス内の自動店舗で運営し、AIモデルが実体経済を自律的に動かす近未来について学んだ。

Anthropic Red Team·6月27日

LLM向けサイバーツールキット

サイバーセキュリティ向けに微調整されていない大規模言語モデル（LLM）が、新しいツールキットを装備することで、数十台のホストを持つネットワークに対する多段階攻撃を成功させることができる。

Anthropic Red Team·6月13日·★★★★