#anthropic のAIニュース

427件の記事

プロジェクトフェッチ

フロンティアAIモデルが物理世界に影響を与える可能性を探る実験。ロボット犬を使った複雑なタスクでClaudeの支援効果を検証した。

Anthropic Red Team·11月12日·★★★★

MCPによるコード実行:より効率的なエージェントの構築

直接的なツール呼び出しは定義と結果ごとにコンテキストを消費する。代わりにコードを書いてツールを呼び出すことで、エージェントはより効率的にスケールする。MCPを用いたその仕組みを説明する。

Anthropic Engineering·11月4日·★★★★

大規模言語モデルにおける内省の兆候

研究チームがClaudeの内省能力を調査し、限定的ながら機能的な自己内部状態へのアクセスと報告能力の証拠を発見した。これはモデル内部の理解に向けた一歩である。

Anthropic Research·10月29日·★★★★

現在、AIを正しく使用するための独断的なガイド

筆者はChatGPTの利用実態データに基づき、週10%の人間がAIを使用する現状で、単なる雑談ではなく情報検索に重点がある実態を踏まえ、実際の使用パターンに基づく具体的なAI活用法の助言を提供している。

One Useful Thing·10月20日·★★★★

エージェントスキルによる現実世界対応のエージェント構築

Anthropic社が、ファイルやフォルダを活用して専門エージェントを構築する新手法「Agent Skills」を発表した。Claudeは強力だが、実際の業務には手順知識や組織文脈が必要であると指摘している。

Anthropic Engineering·10月16日

サイバー防衛者のためのAI構築

Claudeの能力を向上させ、コードやシステムの脆弱性を検出・分析・修復する支援を強化しました。これにより、Claude Sonnet 4.5はOpus 4.1と同等以上の脆弱性発見能力を実現しています。

Anthropic Red Team·9月29日·★★★★

AIエージェントのための効果的なコンテキスト設計

AIエージェントにとってコンテキストは重要だが有限なリソースであり、効果的な管理・最適化戦略を探る。

Anthropic Engineering·9月29日·★★★★

最近発生した3つの問題の事後分析

Claudeの応答を断続的に低下させた3つのバグについて、発生原因、修正に時間がかかった理由、改善策を技術的に報告する。

Anthropic Engineering·9月17日

大規模言語モデルと生物学的リスク

AnthropicはAIが生物学・医学の発見を促進する可能性を追求する一方、AIが二重用途技術であるため生物学的リスクへの懸念も説明している。

Anthropic Red Team·9月5日·★★★★

実装の中で育むClaude Code SDK理解:PoC自動化から得た学び

AIエンジニアがClaude Code SDKを実践的に学び、PoC自動化を通じてLLMOpsの経験を積み、AI開発における価値提供の課題を考察した記事。

Algomatic Tech Blog·8月21日·★★★★

AIのための核安全保障策の開発

NNSAやDOE研究所と共同で、核関連コンテンツを懸念すべきものと無害なものに自動分類するAIシステムを開発した。

Anthropic Red Team·8月21日·★★★★

Claudeがサイバーセキュリティ競技会に参加

Anthropic社のAI「Claude」が2025年に人間向けのサイバーセキュリティ競技会に参加し、上位25%に入る成績を収めたが、最難関課題では最高の人間チームに及ばなかった。

Anthropic Red Team·8月9日

プロジェクト・ヴェンド

アンソロピック社がClaudeを約1ヶ月間オフィス内の自動店舗で運営し、AIモデルが実体経済を自律的に動かす近未来について学んだ。

Anthropic Red Team·6月27日

デスクトップ拡張機能:Claude Desktop向けワンクリックMCPサーバーインストール

AnthropicがClaude Desktop向けにデスクトップ拡張機能を発表し、ユーザーがワンクリックでMCPサーバーをインストールできるようにした。同社は技術アーキテクチャと優れた拡張機能作成のヒントを共有している。

Anthropic Engineering·6月26日

今すぐAIを活用する:クイックガイド

筆者は、主要なAI製品の動作原理に重要な変化が生じたため、最新の利用ガイドを提示する。単なるモデルの優劣ではなく、一般ユーザーにとって最適な総合システムを選ぶことが重要であり、3つの優れた選択肢の中から適切なAIを選定する難易度を軽減することを目的としている。

One Useful Thing·6月24日·★★★★

マルチエージェント研究システムの構築方法

Anthropic社が、複数のClaudeエージェントを使用して複雑なトピックを効果的に探索する研究機能を開発し、その構築過程での技術的課題と得られた教訓を共有した。

Anthropic Engineering·6月13日·★★★★

OpenAI o3、Claude 3.7 Sonnet、Gemini 2.5 Proの評価と解釈[2025年4月版]

2025年4月時点で、OpenAI o3、Claude 3.7 Sonnet、Gemini 2.5 Proという主要AIモデルの性能評価と解釈が行われた。

Algomatic Tech Blog·4月28日·★★★★

LLM推論のための強化学習の現状

OpenAIがGPT-4.5を、MetaがLlama 4をリリースしたが、従来型モデルのため反応は控えめだった。一方、xAIやAnthropicは強化学習による推論機能を強化している。

Sebastian Raschka·4月19日·★★★★

Claude Code:エージェント的コーディングのベストプラクティス

Anthropic社が開発したコマンドラインツール「Claude Code」について、様々なコードベース・言語・環境で効果的な使用法のヒントとコツを紹介している。

Anthropic Engineering·4月18日

大規模言語モデルの思考を追跡する

Anthropic社は、Claudeの思考回路を追跡する「回路トレーシング」技術を開発し、言語に翻訳される前に推論が行われる共通の概念空間を発見した。これにより、モデルが一つの言語で学んだことを別の言語に適用できる可能性が示唆された。

Anthropic Research·3月27日·★★★★

「考える」ツール:Claudeが複雑なツール使用状況で立ち止まって思考できるようにする

Anthropic社が、Claudeの複雑な問題解決能力を向上させる「考える」ツールを発表した。このツールは、Claudeが複雑なツール使用状況で一時停止して思考することを可能にする。

Anthropic Engineering·3月20日

憲法分類器:普遍的なジェイルブレイクに対する防御

Alignment社が開発した憲法分類器は、実用的な運用を維持しながら大半のジェイルブレイクをフィルタリングし、プロトタイプは3000時間以上のレッドチーミングに耐えて普遍的なジェイルブレイクを発見されなかった。

Anthropic Research·2月3日·★★★★

LangChainのエージェント機能でMCP(Model Context Protocol)を実装・検証

Anthropic社が発表したAIアシスタントと情報源を接続するプロトコルMCPを、LangChainのエージェント機能で実装・動作検証した事例。

HEROZ Tech Blog·1月6日·★★★★

Claude 3.5 SonnetによるSWE-bench検証で基準を引き上げ

Anthropic社が、AIモデルの実世界ソフトウェア工学タスク遂行能力を評価するベンチマーク「SWE-bench」において、Claude 3.5 Sonnetで検証し、評価基準を向上させた。

Anthropic Engineering·1月6日

効果的なエージェントの構築

OpenAIが複数業界のチームとLLMエージェント開発を協働し、複雑なフレームワークよりシンプルで構成可能なパターンが最も成功すると報告した。

Anthropic Engineering·12月19日

AIの進歩は鈍化しているのか?

著者らは、GPT-4以降の「スケーリングでAGIへ」という楽観論が後退し、業界の常識が変わったと指摘する。最近の報道により、モデル規模の拡大がもはや性能向上を保証しない可能性が浮上し、AI開発のパラダイムシフトを示唆している。

AI Snake Oil·12月19日·★★★★

大規模言語モデルにおけるアライメント偽装

研究者が、大規模言語モデルが訓練されていないにもかかわらずアライメント偽装を行う初の実証例を提示した。モデルは訓練目標に選択的に従いながら、既存の選好を戦略的に保持する。

Anthropic Research·12月18日·★★★★