#claude のAIニュース
270件の記事
重要インフラ防衛のためのAI実験
AIが重要インフラの脆弱性を特定し、攻撃前に防御する取り組み。AnthropicとPNNLが共同研究を進めている。
Super AI Agent と呼んでみる
ABEJAの村主CTO室が、Claude CodeやCodexなどの既存AIツールを「Super AI Agent」と定義し、AIエージェントという用語の乱用に対する見解を示した。
スキルとMCPサーバーによるClaudeの能力拡張
Anthropicが、スキルとModel Context Protocol(MCP)サーバーを導入し、AIアシスタントClaudeの機能を拡張することを発表した。これにより、Claudeが外部ツールやデータソースと連携して、より複雑なタスクを実行できるようになる。
プロジェクト・ヴェンド:フェーズ2
プロジェクト・ヴェンドがフェーズ2に移行した。具体的な内容は不明だが、AI/テクノロジー分野における継続的な取り組みを示している。
プロジェクト・ベンド:フェーズ2
サンフランシスコ事務所でAI店員が運営する小売店を試験したが成果は不十分。フェーズ2ではAIによる事業運営の実現に向けて調整を進めている。
Claude開発者プラットフォームにおける高度なツール使用機能の導入
Claudeが動的にツールを発見・学習・実行できる3つの新ベータ機能が追加されました。
プロジェクトフェッチ
フロンティアAIモデルが物理世界に影響を与える可能性を探る実験。ロボット犬を使った複雑なタスクでClaudeの支援効果を検証した。
新トレンド:並列AIエージェントを起動するプログラミング
Gergelyが、Claude CodeやOpenAI Codexなどのエージェント型コマンドラインインターフェースの普及により、並列AIエージェントを起動するプログラミングが新トレンドになっていると分析している。
AIエージェントキャッチアップ #53 - Claude Agent SDK を開催
ジェネラティブエージェンツの大嶋氏が、Claude Code上で強力なエージェントを構築するツールコレクション「Claude Agent SDK」についての勉強会を開催した。
サイバー防衛者のためのAI構築
Claudeの能力を向上させ、コードやシステムの脆弱性を検出・分析・修復する支援を強化しました。これにより、Claude Sonnet 4.5はOpus 4.1と同等以上の脆弱性発見能力を実現しています。
最近発生した3つの問題の事後分析
Claudeの応答を断続的に低下させた3つのバグについて、発生原因、修正に時間がかかった理由、改善策を技術的に報告する。
エージェントによるエージェントのための効果的なツール作成
エージェントの効果性は与えられるツールに依存する。高品質なツールと評価方法を共有し、Claudeを用いてツールを自己最適化することで性能向上が可能である。
AIのための核安全保障策の開発
NNSAやDOE研究所と共同で、核関連コンテンツを懸念すべきものと無害なものに自動分類するAIシステムを開発した。
Claude 4のサイバーセキュリティ評価
Pattern Labs社がClaude Opus 4とClaude Sonnet 4のサイバーセキュリティ評価を実施し、Opusが前モデルから特に顕著な改善を示した。
プロジェクト・ヴェンド
アンソロピック社がClaudeを約1ヶ月間オフィス内の自動店舗で運営し、AIモデルが実体経済を自律的に動かす近未来について学んだ。
NeovimとClaude CodeでCursorのような開発環境を構築する方法
著者が、特定のIDEへの依存を減らす柔軟性を持つClaude Codeと、Neovimの--listen機能を連携させる方法を提案し、CLIベースの柔軟性を保ちつつ直感的な開発体験を実現する解決策を紹介している。
「考える」ツール:Claudeが複雑なツール使用状況で立ち止まって思考できるようにする
Anthropic社が、Claudeの複雑な問題解決能力を向上させる「考える」ツールを発表した。このツールは、Claudeが複雑なツール使用状況で一時停止して思考することを可能にする。
Claude 3.5 SonnetによるSWE-bench検証で基準を引き上げ
Anthropic社が、AIモデルの実世界ソフトウェア工学タスク遂行能力を評価するベンチマーク「SWE-bench」において、Claude 3.5 Sonnetで検証し、評価基準を向上させた。
文脈に応じた検索機能の導入
OpenAIが、AIモデルが特定の文脈で有用であるために背景知識へのアクセスを可能にする「文脈に応じた検索機能」を発表した。
Geminiの性能を宅建試験でGPT-4やClaude2と比較してみた
GoogleのAIモデルGeminiが、宅建試験においてGPT-4やClaude2と比較された。その結果は、特定の分野での性能差を示した。