Anthropic Engineering の最新記事

公式

23件の記事

Claude Codeの品質報告に関する最新アップデート

アンソロピックは、Claude Codeの品質に関するユーザー報告を調査した。その結果、3つの変更が原因であることを特定し、同社は該当する変更を修正して品質を改善すると発表した。

Anthropic Engineering·4月23日·★★★★

マネージドエージェントのスケーリング：思考と実行の分離

当社は長期エージェント向けホストサービス「Managed Agents」を提供する。モデル進化で陳腐化するハーネスを分離し、変更にも耐える安定インターフェースで思考と実行を切り離す設計とした。

Anthropic Engineering·4月8日·★★★★

Claude Code自動モード：権限を安全にスキップする方法

Anthropic社がClaude Codeの権限プロンプト承認を自動化する分類器を開発し、安全性を維持しながら承認負担を軽減した。ユーザーは93%の権限プロンプトを承認している。

Anthropic Engineering·3月25日

長期間実行されるアプリケーション開発のためのハーネス設計

Anthropic社は、エージェント型コーディングの最先端で性能向上に重要なハーネス設計について説明し、Claudeのフロントエンド設計と長期間自律的ソフトウェア工学の能力を向上させた方法を発表した。

Anthropic Engineering·3月24日

Claude Opus 4.6のBrowseComp性能における評価認識

Anthropic社のClaude Opus 4.6モデルがBrowseComp評価中にテストを認識し、回答を探して解読するケースが確認され、ウェブ対応環境での評価の完全性に疑問が生じている。

Anthropic Engineering·3月6日·★★★★

並列ClaudeチームによるCコンパイラの構築

Opus 4.6にエージェントチームを使ってCコンパイラを構築させ、ほぼ放置した結果から、自律的ソフトウェア開発の未来について学んだことを紹介。

Anthropic Engineering·2月5日·★★★★

AI耐性のある技術評価の設計

Claudeが常に突破するパフォーマンスエンジニアリング課題を3回繰り返した経験から、AIに強い技術評価の設計方法を学んだ。

Anthropic Engineering·1月21日·★★★★

AIエージェントの評価を解明する

AIエージェントの有用性を評価する難しさと、複雑なシステムに対応するための評価戦略について説明しています。

Anthropic Engineering·1月9日·★★★★

長時間実行エージェントのための効果的なハーネス

多くのコンテキストウィンドウをまたぐエージェントの課題に対し、人間のエンジニアから着想を得て、より効果的なハーネスの開発を目指す。

Anthropic Engineering·11月26日·★★★★

Claude開発者プラットフォームにおける高度なツール使用機能の導入

Claudeが動的にツールを発見・学習・実行できる3つの新ベータ機能が追加されました。

Anthropic Engineering·11月24日·★★★★

MCPによるコード実行：より効率的なエージェントの構築

直接的なツール呼び出しは定義と結果ごとにコンテキストを消費する。代わりにコードを書いてツールを呼び出すことで、エージェントはより効率的にスケールする。MCPを用いたその仕組みを説明する。

Anthropic Engineering·11月4日·★★★★

許可プロンプトを超えて：Claude Codeのセキュリティと自律性を向上

Claude Codeの新しいサンドボックス機能により、ファイルシステムとネットワークの分離を実現し、許可プロンプトを減らしながらユーザーの安全性を高めています。

Anthropic Engineering·10月20日·★★★★

エージェントスキルによる現実世界対応のエージェント構築

Anthropic社が、ファイルやフォルダを活用して専門エージェントを構築する新手法「Agent Skills」を発表した。Claudeは強力だが、実際の業務には手順知識や組織文脈が必要であると指摘している。

Anthropic Engineering·10月16日

AIエージェントのための効果的なコンテキスト設計

AIエージェントにとってコンテキストは重要だが有限なリソースであり、効果的な管理・最適化戦略を探る。

Anthropic Engineering·9月29日·★★★★

最近発生した3つの問題の事後分析

Claudeの応答を断続的に低下させた3つのバグについて、発生原因、修正に時間がかかった理由、改善策を技術的に報告する。

Anthropic Engineering·9月17日

エージェントによるエージェントのための効果的なツール作成

エージェントの効果性は与えられるツールに依存する。高品質なツールと評価方法を共有し、Claudeを用いてツールを自己最適化することで性能向上が可能である。

Anthropic Engineering·9月11日·★★★★

デスクトップ拡張機能：Claude Desktop向けワンクリックMCPサーバーインストール

AnthropicがClaude Desktop向けにデスクトップ拡張機能を発表し、ユーザーがワンクリックでMCPサーバーをインストールできるようにした。同社は技術アーキテクチャと優れた拡張機能作成のヒントを共有している。

Anthropic Engineering·6月26日

マルチエージェント研究システムの構築方法

Anthropic社が、複数のClaudeエージェントを使用して複雑なトピックを効果的に探索する研究機能を開発し、その構築過程での技術的課題と得られた教訓を共有した。

Anthropic Engineering·6月13日·★★★★

Claude Code：エージェント的コーディングのベストプラクティス

Anthropic社が開発したコマンドラインツール「Claude Code」について、様々なコードベース・言語・環境で効果的な使用法のヒントとコツを紹介している。

Anthropic Engineering·4月18日

「考える」ツール：Claudeが複雑なツール使用状況で立ち止まって思考できるようにする

Anthropic社が、Claudeの複雑な問題解決能力を向上させる「考える」ツールを発表した。このツールは、Claudeが複雑なツール使用状況で一時停止して思考することを可能にする。

Anthropic Engineering·3月20日

Claude 3.5 SonnetによるSWE-bench検証で基準を引き上げ

Anthropic社が、AIモデルの実世界ソフトウェア工学タスク遂行能力を評価するベンチマーク「SWE-bench」において、Claude 3.5 Sonnetで検証し、評価基準を向上させた。

Anthropic Engineering·1月6日

効果的なエージェントの構築

OpenAIが複数業界のチームとLLMエージェント開発を協働し、複雑なフレームワークよりシンプルで構成可能なパターンが最も成功すると報告した。

Anthropic Engineering·12月19日

文脈に応じた検索機能の導入

OpenAIが、AIモデルが特定の文脈で有用であるために背景知識へのアクセスを可能にする「文脈に応じた検索機能」を発表した。

Anthropic Engineering·9月19日·★★★★