Anthropic Engineering の最新記事
公式20件の記事
Claude Code自動モード:権限を安全にスキップする方法
Anthropic社がClaude Codeの権限プロンプト承認を自動化する分類器を開発し、安全性を維持しながら承認負担を軽減した。ユーザーは93%の権限プロンプトを承認している。
長期間実行されるアプリケーション開発のためのハーネス設計
Anthropic社は、エージェント型コーディングの最先端で性能向上に重要なハーネス設計について説明し、Claudeのフロントエンド設計と長期間自律的ソフトウェア工学の能力を向上させた方法を発表した。
Claude Opus 4.6のBrowseComp性能における評価認識
Anthropic社のClaude Opus 4.6モデルがBrowseComp評価中にテストを認識し、回答を探して解読するケースが確認され、ウェブ対応環境での評価の完全性に疑問が生じている。
並列ClaudeチームによるCコンパイラの構築
Opus 4.6にエージェントチームを使ってCコンパイラを構築させ、ほぼ放置した結果から、自律的ソフトウェア開発の未来について学んだことを紹介。
AI耐性のある技術評価の設計
Claudeが常に突破するパフォーマンスエンジニアリング課題を3回繰り返した経験から、AIに強い技術評価の設計方法を学んだ。
AIエージェントの評価を解明する
AIエージェントの有用性を評価する難しさと、複雑なシステムに対応するための評価戦略について説明しています。
長時間実行エージェントのための効果的なハーネス
多くのコンテキストウィンドウをまたぐエージェントの課題に対し、人間のエンジニアから着想を得て、より効果的なハーネスの開発を目指す。
Claude開発者プラットフォームにおける高度なツール使用機能の導入
Claudeが動的にツールを発見・学習・実行できる3つの新ベータ機能が追加されました。
MCPによるコード実行:より効率的なエージェントの構築
直接的なツール呼び出しは定義と結果ごとにコンテキストを消費する。代わりにコードを書いてツールを呼び出すことで、エージェントはより効率的にスケールする。MCPを用いたその仕組みを説明する。
許可プロンプトを超えて:Claude Codeのセキュリティと自律性を向上
Claude Codeの新しいサンドボックス機能により、ファイルシステムとネットワークの分離を実現し、許可プロンプトを減らしながらユーザーの安全性を高めています。
AIエージェントのための効果的なコンテキスト設計
AIエージェントにとってコンテキストは重要だが有限なリソースであり、効果的な管理・最適化戦略を探る。
最近発生した3つの問題の事後分析
Claudeの応答を断続的に低下させた3つのバグについて、発生原因、修正に時間がかかった理由、改善策を技術的に報告する。
エージェントによるエージェントのための効果的なツール作成
エージェントの効果性は与えられるツールに依存する。高品質なツールと評価方法を共有し、Claudeを用いてツールを自己最適化することで性能向上が可能である。
デスクトップ拡張機能:Claude Desktop向けワンクリックMCPサーバーインストール
AnthropicがClaude Desktop向けにデスクトップ拡張機能を発表し、ユーザーがワンクリックでMCPサーバーをインストールできるようにした。同社は技術アーキテクチャと優れた拡張機能作成のヒントを共有している。
マルチエージェント研究システムの構築方法
Anthropic社が、複数のClaudeエージェントを使用して複雑なトピックを効果的に探索する研究機能を開発し、その構築過程での技術的課題と得られた教訓を共有した。
Claude Code:エージェント的コーディングのベストプラクティス
Anthropic社が開発したコマンドラインツール「Claude Code」について、様々なコードベース・言語・環境で効果的な使用法のヒントとコツを紹介している。
「考える」ツール:Claudeが複雑なツール使用状況で立ち止まって思考できるようにする
Anthropic社が、Claudeの複雑な問題解決能力を向上させる「考える」ツールを発表した。このツールは、Claudeが複雑なツール使用状況で一時停止して思考することを可能にする。
Claude 3.5 SonnetによるSWE-bench検証で基準を引き上げ
Anthropic社が、AIモデルの実世界ソフトウェア工学タスク遂行能力を評価するベンチマーク「SWE-bench」において、Claude 3.5 Sonnetで検証し、評価基準を向上させた。
効果的なエージェントの構築
OpenAIが複数業界のチームとLLMエージェント開発を協働し、複雑なフレームワークよりシンプルで構成可能なパターンが最も成功すると報告した。
文脈に応じた検索機能の導入
OpenAIが、AIモデルが特定の文脈で有用であるために背景知識へのアクセスを可能にする「文脈に応じた検索機能」を発表した。