#claude のAIニュース
111件の記事
AIエージェントキャッチアップ #53 - Claude Agent SDK を開催
ジェネラティブエージェンツの大嶋氏が、Claude Code上で強力なエージェントを構築するツールコレクション「Claude Agent SDK」についての勉強会を開催した。
サイバー防衛者のためのAI構築
Claudeの能力を向上させ、コードやシステムの脆弱性を検出・分析・修復する支援を強化しました。これにより、Claude Sonnet 4.5はOpus 4.1と同等以上の脆弱性発見能力を実現しています。
最近発生した3つの問題の事後分析
Claudeの応答を断続的に低下させた3つのバグについて、発生原因、修正に時間がかかった理由、改善策を技術的に報告する。
エージェントによるエージェントのための効果的なツール作成
エージェントの効果性は与えられるツールに依存する。高品質なツールと評価方法を共有し、Claudeを用いてツールを自己最適化することで性能向上が可能である。
AIのための核安全保障策の開発
NNSAやDOE研究所と共同で、核関連コンテンツを懸念すべきものと無害なものに自動分類するAIシステムを開発した。
Claude 4のサイバーセキュリティ評価
Pattern Labs社がClaude Opus 4とClaude Sonnet 4のサイバーセキュリティ評価を実施し、Opusが前モデルから特に顕著な改善を示した。
プロジェクト・ヴェンド
アンソロピック社がClaudeを約1ヶ月間オフィス内の自動店舗で運営し、AIモデルが実体経済を自律的に動かす近未来について学んだ。
NeovimとClaude CodeでCursorのような開発環境を構築する方法
著者が、特定のIDEへの依存を減らす柔軟性を持つClaude Codeと、Neovimの--listen機能を連携させる方法を提案し、CLIベースの柔軟性を保ちつつ直感的な開発体験を実現する解決策を紹介している。
「考える」ツール:Claudeが複雑なツール使用状況で立ち止まって思考できるようにする
Anthropic社が、Claudeの複雑な問題解決能力を向上させる「考える」ツールを発表した。このツールは、Claudeが複雑なツール使用状況で一時停止して思考することを可能にする。
Claude 3.5 SonnetによるSWE-bench検証で基準を引き上げ
Anthropic社が、AIモデルの実世界ソフトウェア工学タスク遂行能力を評価するベンチマーク「SWE-bench」において、Claude 3.5 Sonnetで検証し、評価基準を向上させた。
文脈に応じた検索機能の導入
OpenAIが、AIモデルが特定の文脈で有用であるために背景知識へのアクセスを可能にする「文脈に応じた検索機能」を発表した。