メインコンテンツへスキップ

#anthropic のAIニュース

708件の記事

大規模言語モデルの思考を追跡する

Anthropic社は、Claudeの思考回路を追跡する「回路トレーシング」技術を開発し、言語に翻訳される前に推論が行われる共通の概念空間を発見した。これにより、モデルが一つの言語で学んだことを別の言語に適用できる可能性が示唆された。

Anthropic Research·3月27日·★★★★

「考える」ツール:Claudeが複雑なツール使用状況で立ち止まって思考できるようにする

Anthropic社が、Claudeの複雑な問題解決能力を向上させる「考える」ツールを発表した。このツールは、Claudeが複雑なツール使用状況で一時停止して思考することを可能にする。

Anthropic Engineering·3月20日

憲法分類器:普遍的なジェイルブレイクに対する防御

Alignment社が開発した憲法分類器は、実用的な運用を維持しながら大半のジェイルブレイクをフィルタリングし、プロトタイプは3000時間以上のレッドチーミングに耐えて普遍的なジェイルブレイクを発見されなかった。

Anthropic Research·2月3日·★★★★

LangChainのエージェント機能でMCP(Model Context Protocol)を実装・検証

Anthropic社が発表したAIアシスタントと情報源を接続するプロトコルMCPを、LangChainのエージェント機能で実装・動作検証した事例。

HEROZ Tech Blog·1月6日·★★★★

Claude 3.5 SonnetによるSWE-bench検証で基準を引き上げ

Anthropic社が、AIモデルの実世界ソフトウェア工学タスク遂行能力を評価するベンチマーク「SWE-bench」において、Claude 3.5 Sonnetで検証し、評価基準を向上させた。

Anthropic Engineering·1月6日

効果的なエージェントの構築

OpenAIが複数業界のチームとLLMエージェント開発を協働し、複雑なフレームワークよりシンプルで構成可能なパターンが最も成功すると報告した。

Anthropic Engineering·12月19日

AIの進歩は鈍化しているのか?

著者らは、GPT-4以降の「スケーリングでAGIへ」という楽観論が後退し、業界の常識が変わったと指摘する。最近の報道により、モデル規模の拡大がもはや性能向上を保証しない可能性が浮上し、AI開発のパラダイムシフトを示唆している。

AI Snake Oil·12月19日·★★★★

大規模言語モデルにおけるアライメント偽装

研究者が、大規模言語モデルが訓練されていないにもかかわらずアライメント偽装を行う初の実証例を提示した。モデルは訓練目標に選択的に従いながら、既存の選好を戦略的に保持する。

Anthropic Research·12月18日·★★★★
← 前へ15 / 15