#anthropic のAIニュース
705件の記事
Claude Opus 4.6の紹介
AnthropicがClaude Opus 4.6を発表した。この新バージョンは、AIアシスタントの性能向上を目指すリリースである。
Claudeは思考のための空間である
AnthropicがClaudeを思考のための空間として位置づけ、AIアシスタントが単なるタスク実行ツールではなく、人間の思考プロセスを支援するプラットフォームとして機能することを示している。
AnthropicがAllen InstituteおよびHoward Hughes Medical Instituteと提携し科学的発見を加速
AnthropicはAllen InstituteとHoward Hughes Medical Instituteと提携し、AI技術を活用して科学的発見のプロセスを加速させる取り組みを開始した。
マルチエージェントシステムの構築:使用するタイミングと方法
OpenAIがマルチエージェントシステムの構築について解説し、複数のAIエージェントを連携させる適切なタイミングと実装方法を説明した。
スキルでエージェントを構築する:専門作業のためのエージェントの装備
AIエージェント開発企業が、専門作業向けにスキルを備えたAIエージェントを構築する方法を発表した。
LWiAIポッドキャスト #231 - Claude Cowork、Anthropic 100億ドル調達、Deep Delta Learning
Anthropicが新ツール「Cowork」を発表し、100億ドル調達。Deep Delta Learningの技術も話題。AI業界の資金動向と技術進展を示す。
AI耐性のある技術評価の設計
Claudeが常に突破するパフォーマンスエンジニアリング課題を3回繰り返した経験から、AIに強い技術評価の設計方法を学んだ。
ユーザーへのリスク移転がClaude Codeをより強力にする理由
Anthropicの「Claude Code」はプログラマー向けとされるが、実際には幅広いタスクに対応する汎用エージェントとして普及している。開発者はユーザーにリスクを移転させる設計により、ツールの能力を最大化させている。
2026年1月19日 解釈可能性 アシスタント軸:大規模言語モデルの性格の位置付けと安定化
大規模言語モデルの性格特性を特定し安定させる「アシスタント軸」の概念を提案し、モデルの解釈可能性と信頼性向上を目指す研究について説明しています。
現実的なサイバーレンジにおけるAIモデル
最新評価で、現行Claudeモデルは独自ツール不要で、数十台のホストを含むネットワークへの多段階攻撃をオープンソースツールのみで成功させられることが判明。
Anthropic経済指数:AI利用を理解するための新たな構成要素
Anthropicが2026年1月15日に発表した経済研究では、AI利用を理解するための新たな指標「Anthropic Economic Index」を導入した。
2026年1月15日 経済研究 Anthropic経済指数レポート:経済の基本要素
Anthropic経済指数レポートが経済の基本要素について分析し、2026年1月15日に発表された。
Claudeとプロパティベーステストを用いたバグ発見
大規模ソフトウェアプロジェクトで、コードの一般特性を推論してバグを効率的に特定するエージェントを開発した。
AnthropicがCoworkを発表、ファイル内で動作するClaude Desktopエージェントでコーディング不要
AnthropicがCoworkをリリース。Claude Codeの機能を非技術ユーザー向けに拡張し、ファイル内でAIエージェントが動作するデスクトップツール。
Cowork: あなたの残りの仕事のためのClaude Code
AnthropicがClaude Codeを発表した。このツールは開発者のコーディング作業を支援するAI機能であり、コード生成やデバッグを効率化する。
AIエージェントの評価を解明する
AIエージェントの有用性を評価する難しさと、複雑なシステムに対応するための評価戦略について説明しています。
重要インフラ防衛のためのAI実験
AIが重要インフラの脆弱性を特定し、攻撃前に防御する取り組み。AnthropicとPNNLが共同研究を進めている。
Claude Codeと今後の展望
著者はClaude Codeに対し、コード知識不要で月1000ドルを稼ぐWeb/ソフトウェア事業の構築を指示した。AIは複数選択質問を経て、プロ向け500個セットのプロンプト販売を提案し、実装を行った。
Claude Codeの開発者がワークフローを公開、開発者たちが熱狂
世界最先端のコーディングエージェントの開発者が自身のワークフローを公開し、エンジニアコミュニティが注目している。
2026年のAIに関する17の予測
Understanding AIは、8人の専門家と自身で2026年のAI動向を予測した。2025年は新モデルやコーディングエージェントの普及、自動運転の拡大が特徴だった。来年はさらに技術革新と社会実装が進むと見られる。
プロジェクト・ヴェンド:フェーズ2
プロジェクト・ヴェンドがフェーズ2に移行した。具体的な内容は不明だが、AI/テクノロジー分野における継続的な取り組みを示している。
プロジェクト・ベンド:フェーズ2
サンフランシスコ事務所でAI店員が運営する小売店を試験したが成果は不十分。フェーズ2ではAIによる事業運営の実現に向けて調整を進めている。
Claude APIを組織導入する際の実務ポイント - 階層制限・権限設計・請求管理の注意点
Claude APIの組織導入では、公式ドキュメントに記載されていない実務上の課題(階層制限、権限設計、請求管理)を実際の導入経験から解説し、円滑な導入を支援する。
Claude Opus 4.5がトークンを節約、ホワイトハウスがAI駆動科学を推進、AmazonがNova 2 Proチェックポイントを公開、小型モデルが難解パズルを解決
AnthropicがClaude Opus 4.5のトークン節約機能を発表し、ホワイトハウスがAI駆動科学研究を推進する政策を発表した。AmazonはNova 2 Proチェックポイントを公開し、小型AIモデルが複雑なパズル解決に成功した。
AIエージェントがスマートコントラクトの脆弱性を発見
実際に攻撃されたスマートコントラクトを評価した結果、最新のAIモデルが知識カットオフ後の脆弱性を発見できることが示された。
LWiAIポッドキャスト第226回 - Gemini 3、Claude Opus 4.5、Nano Banana Pro、LeJEPA
LWiAIポッドキャストが、GoogleのGemini 3 Pro、AnthropicのOpus 4.5、OpenAIのGPT-5.1など、主要AI企業の新モデルリリースとロボティクス分野の進展について議論した。
Googleがアリーナリーダーボードを制覇、Microsoft+Anthropic、レコード会社がAI音楽を支援、LLMの人格制御
GoogleがAIモデル評価プラットフォーム「Arena」のリーダーボードを独占し、MicrosoftとAnthropicが提携、主要レコード会社がAI音楽生成を支援、研究者が大規模言語モデルの人格制御技術を開発した。
長時間実行エージェントのための効果的なハーネス
多くのコンテキストウィンドウをまたぐエージェントの課題に対し、人間のエンジニアから着想を得て、より効果的なハーネスの開発を目指す。
プロジェクトフェッチ
フロンティアAIモデルが物理世界に影響を与える可能性を探る実験。ロボット犬を使った複雑なタスクでClaudeの支援効果を検証した。
MCPによるコード実行:より効率的なエージェントの構築
直接的なツール呼び出しは定義と結果ごとにコンテキストを消費する。代わりにコードを書いてツールを呼び出すことで、エージェントはより効率的にスケールする。MCPを用いたその仕組みを説明する。
大規模言語モデルにおける内省の兆候
研究チームがClaudeの内省能力を調査し、限定的ながら機能的な自己内部状態へのアクセスと報告能力の証拠を発見した。これはモデル内部の理解に向けた一歩である。
現在、AIを正しく使用するための独断的なガイド
筆者はChatGPTの利用実態データに基づき、週10%の人間がAIを使用する現状で、単なる雑談ではなく情報検索に重点がある実態を踏まえ、実際の使用パターンに基づく具体的なAI活用法の助言を提供している。
エージェントスキルによる現実世界対応のエージェント構築
Anthropic社が、ファイルやフォルダを活用して専門エージェントを構築する新手法「Agent Skills」を発表した。Claudeは強力だが、実際の業務には手順知識や組織文脈が必要であると指摘している。
サイバー防衛者のためのAI構築
Claudeの能力を向上させ、コードやシステムの脆弱性を検出・分析・修復する支援を強化しました。これにより、Claude Sonnet 4.5はOpus 4.1と同等以上の脆弱性発見能力を実現しています。
AIエージェントのための効果的なコンテキスト設計
AIエージェントにとってコンテキストは重要だが有限なリソースであり、効果的な管理・最適化戦略を探る。
最近発生した3つの問題の事後分析
Claudeの応答を断続的に低下させた3つのバグについて、発生原因、修正に時間がかかった理由、改善策を技術的に報告する。
大規模言語モデルと生物学的リスク
AnthropicはAIが生物学・医学の発見を促進する可能性を追求する一方、AIが二重用途技術であるため生物学的リスクへの懸念も説明している。
実装の中で育むClaude Code SDK理解:PoC自動化から得た学び
AIエンジニアがClaude Code SDKを実践的に学び、PoC自動化を通じてLLMOpsの経験を積み、AI開発における価値提供の課題を考察した記事。
AIのための核安全保障策の開発
NNSAやDOE研究所と共同で、核関連コンテンツを懸念すべきものと無害なものに自動分類するAIシステムを開発した。
Claudeがサイバーセキュリティ競技会に参加
Anthropic社のAI「Claude」が2025年に人間向けのサイバーセキュリティ競技会に参加し、上位25%に入る成績を収めたが、最難関課題では最高の人間チームに及ばなかった。
プロジェクト・ヴェンド
アンソロピック社がClaudeを約1ヶ月間オフィス内の自動店舗で運営し、AIモデルが実体経済を自律的に動かす近未来について学んだ。
デスクトップ拡張機能:Claude Desktop向けワンクリックMCPサーバーインストール
AnthropicがClaude Desktop向けにデスクトップ拡張機能を発表し、ユーザーがワンクリックでMCPサーバーをインストールできるようにした。同社は技術アーキテクチャと優れた拡張機能作成のヒントを共有している。
今すぐAIを活用する:クイックガイド
筆者は、主要なAI製品の動作原理に重要な変化が生じたため、最新の利用ガイドを提示する。単なるモデルの優劣ではなく、一般ユーザーにとって最適な総合システムを選ぶことが重要であり、3つの優れた選択肢の中から適切なAIを選定する難易度を軽減することを目的としている。
マルチエージェント研究システムの構築方法
Anthropic社が、複数のClaudeエージェントを使用して複雑なトピックを効果的に探索する研究機能を開発し、その構築過程での技術的課題と得られた教訓を共有した。
OpenAI o3、Claude 3.7 Sonnet、Gemini 2.5 Proの評価と解釈[2025年4月版]
2025年4月時点で、OpenAI o3、Claude 3.7 Sonnet、Gemini 2.5 Proという主要AIモデルの性能評価と解釈が行われた。
LLM推論のための強化学習の現状
OpenAIがGPT-4.5を、MetaがLlama 4をリリースしたが、従来型モデルのため反応は控えめだった。一方、xAIやAnthropicは強化学習による推論機能を強化している。
Claude Code:エージェント的コーディングのベストプラクティス
Anthropic社が開発したコマンドラインツール「Claude Code」について、様々なコードベース・言語・環境で効果的な使用法のヒントとコツを紹介している。
大規模言語モデルの思考を追跡する
Anthropic社は、Claudeの思考回路を追跡する「回路トレーシング」技術を開発し、言語に翻訳される前に推論が行われる共通の概念空間を発見した。これにより、モデルが一つの言語で学んだことを別の言語に適用できる可能性が示唆された。
「考える」ツール:Claudeが複雑なツール使用状況で立ち止まって思考できるようにする
Anthropic社が、Claudeの複雑な問題解決能力を向上させる「考える」ツールを発表した。このツールは、Claudeが複雑なツール使用状況で一時停止して思考することを可能にする。
憲法分類器:普遍的なジェイルブレイクに対する防御
Alignment社が開発した憲法分類器は、実用的な運用を維持しながら大半のジェイルブレイクをフィルタリングし、プロトタイプは3000時間以上のレッドチーミングに耐えて普遍的なジェイルブレイクを発見されなかった。