The Decoder の最新記事
メディア282件の記事
Grok 4.20はGeminiとGPT-5.4に大きく遅れるが、幻覚を起こさない新記録を樹立
xAIのGrok 4.20は、ベンチマークではトップモデルに及ばないが、低コスト・高速で、他のモデルよりも幻覚を起こしにくい特徴を持つ。
米国戦争省CTO、AnthropicのAIモデルが組み込み倫理でサプライチェーンを「汚染」すると発言
米国戦争省がAnthropicのAIモデル「Claude」をサプライチェーンから排除する方針を示した。同省CTOは、AIモデルに組み込まれた倫理規範が中国のAIに対する政治的統制に類似していると指摘し、サプライチェーンを「汚染」すると批判した。
Copilot Healthは、OpenAIとAnthropicと並ぶマイクロソフトのAI医療分野への参入を示す
マイクロソフトが、ウェアラブル端末や医療記録からデータを収集して個別化された健康アドバイスを提供するAI健康アシスタント「Copilot Health」を発表した。同社は長期的に「医療スーパーインテリジェンス」の実現を目指している。
Claudeがチャット内でインタラクティブなチャートと視覚化を直接作成可能に
AnthropicはAIチャットボットClaudeに、会話内でインタラクティブな図表や視覚化を生成する新機能をベータ公開した。
ChatGPTは依然としてチャットボット市場をリードするが、GoogleのGeminiが台頭し優位性が低下
OpenAIのChatGPTはチャットボット市場で61.7%のシェアを維持するが、12か月で75.7%から減少した。GoogleのGeminiはシェアを5.7%から24.4%に拡大し、市場で台頭している。
AIで作成されたイラン政府のプロパガンダ画像がドイツ主要メディアに掲載
ドイツの週刊誌シュピーゲルは、AIで生成または改ざんされた可能性が高い画像をイラン関連記事から削除した。
MetaのJEPAアーキテクチャがノイズの多い医療画像で標準AI手法を上回る
研究者がMetaのJEPAアーキテクチャに基づく心臓超音波AIモデルを発表し、マスク付きオートエンコーダーや対照学習などの標準手法よりも優れた性能を示した。
NvidiaがOpenAI、Meta、Anthropicが残したオープンソースAIのギャップに参入
Nvidiaが今後5年間で260億ドルをオープンウェイトAIモデルに投資する計画を明らかにした。中国のオープンソースモデルへの対抗策として、開発者をNvidiaのハードウェアエコシステムに固定する戦略的取り組みである。
Googleの新機能「Ask Maps」がGemini AIで平易な言語での場所検索を可能に
GoogleがGoogle Mapsに「Ask Maps」機能を追加し、Gemini AIを活用して複雑な質問を平易な言語で受け付け、カスタマイズされた地図上にパーソナライズされた結果を表示する。
OpenAI、動画生成AI「Sora」をChatGPTに統合する計画と報道
OpenAIは、動画生成AI「Sora」をChatGPTに統合し、9億2000万人のユーザーに提供する計画を進めていると報じられた。
Meta、数十億ユーザーの推論コスト削減に向けて4世代の独自AIチップを発表
Metaが推論処理に特化した4世代の独自AIチップを発表し、NvidiaやAMDなどのGPUメーカーへの依存度低減を推進している。
Google、Gemini Embedding 2でテキスト・画像・動画・音声を単一ベクトル空間に統合
Googleが初のネイティブマルチモーダル埋め込みモデル「Gemini Embedding 2」を発表し、テキスト・画像・動画・音声・文書を単一ベクトル空間に統合することで、AIパイプラインでの個別モデル不要化を実現した。
新研究、業界テストを通過したAI生成コードの半数は実際の開発者に拒否されると判明
研究機関METRの新研究によると、人気のSWE-benchベンチマークを通過したAIコードソリューションの約半数は、実際のプロジェクト管理者によって拒否されることが分かった。
ClaudeのExcelおよびPowerPointアドインがアプリ間でコンテキストを共有
Anthropicは、ExcelとPowerPoint向けClaudeアドインを更新し、共有コンテキスト、再利用可能なワークフロー、拡張クラウドサポートを導入した。
GrammarlyのAIライティング機能が、無許可で専門家の名前を使用していると指摘
Grammarlyが「Expert Review」というAI機能で、許可なくジャーナリストや著者の名前を使用していると記事が報じた。
OpenAIの新しいトレーニングデータセットはAIモデルに信頼すべき指示を教える
OpenAIは、AIモデルが信頼できる指示を信頼できない指示よりも優先するように教えるためのトレーニングデータセット「IH-Challenge」をリリースした。初期結果では、セキュリティとプロンプトインジェクション防御の両方で大幅な改善が見られている。
AnthropicがAIの社会・安全保障への影響を研究する内部シンクタンクを設立
AI企業Anthropicは、強力なAIが社会・経済・安全保障に与える影響を研究するための内部シンクタンク「Anthropic Institute」を設立した。
AIエージェントが数十年の古い手法でマッキンゼーの内部AIプラットフォームを2時間でハッキング
セキュリティ企業Codewallが、マッキンゼーの43,000人以上の従業員が使用する内部AIプラットフォームLilliに対して攻撃用AIエージェントを実行し、認証情報や内部知識なしで2時間以内に本番データベースへの完全な読み書きアクセスを獲得した。
マイクロソフトと競合AI研究者が連携、アンスロピックの国防総省との法廷闘争を支援
マイクロソフト、OpenAIとグーグルの従業員数十名、元軍指導者、市民団体が連合し、AI企業アンスロピックの国防総省との訴訟を支援する法廷助言書を提出した。
アマゾン、PerplexityのAIショッピングエージェントを差し止める仮処分命令を取得
アマゾンは裁判所命令によりPerplexityのAIショッピングボットを停止させた。この判決はEC分野におけるAIエージェントの将来を方向付ける可能性がある。
ChatGPTが数学と物理学をインタラクティブな視覚化で説明
ChatGPTが数学・物理学トピックでインタラクティブな視覚化機能を追加し、ユーザーが変数を調整してグラフをリアルタイム更新できるようになった。70以上の概念が利用可能。
ドイツ裁判所「AI使用」だけでは著作権無効にならないと判断
ドイツの地方裁判所が、SunoAIなどのAIツールで作成された音楽でも、人間が書いた歌詞は著作権で保護されると判決を下した。単に「AI生成」と主張するだけでは保護は剥奪されず、証拠が必要だとしている。
アマゾン、AI生成コードのヒューマンフィルターとして上級エンジニアを配置
アマゾンは、AI起因とされる一連の障害を受けて、AIが生成したコードの品質確認のために上級エンジニアをヒューマンフィルターとして配置する方針を発表した。
NVIDIAとミラ・ムラティのThinking Machines LabがAI分野での長期パートナーシップを発表
NVIDIAと元OpenAI幹部ミラ・ムラティが設立したAIスタートアップThinking Machines Labは、AI分野での長期パートナーシップ契約を締結した。
MetaがAIエージェント向けReddit風プラットフォーム「Moltbook」を買収
Metaが、AIエージェント専用に設計されたReddit風プラットフォーム「Moltbook」を買収した。
スタートアップ企業、初の完全なショウジョウバエ脳エミュレーションをシミュレート体で実現と主張
Eon Systemsが、完全なショウジョウバエの脳エミュレーション(12万5千以上のニューロンと5千万のシナプス)を仮想体に接続し、初めて複数の行動を生成したと発表した。
哲学者デイヴィッド・チャーマーズ:現在のAI解釈可能性手法は最も重要な点を見逃している
哲学者デイヴィッド・チャーマーズは、人間の理解に関する哲学的理論に基づき、AIシステムを命題への態度を通じて解釈する「命題的解釈可能性」概念を提案している。
投資家が10億ドルを投じるヤン・ルカンのLLMを超えるAIビジョン
メタの元チーフAI科学者ヤン・ルカンが、新スタートアップAMI Labsに10億ドル以上を調達し、欧州史上最大のシード資金ラウンドを実現した。
Claude Codeがコードのバグとセキュリティギャップをレビューする並列AIエージェントを導入
AnthropicがClaude Codeにコードレビュー機能をリリースし、マージ前に変更内容のエラーを自動的にチェックする。
OpenAI、Promptfooを買収しAIセキュリティテストをFrontier企業プラットフォームに直接統合へ
OpenAIはAIセキュリティプラットフォームのPromptfooを買収し、自動化された脆弱性テスト(ジェイルブレイク、プロンプトインジェクション、データ漏洩対策)をFrontier企業プラットフォームに直接組み込む計画である。
マイクロソフト、CopilotにAnthropicのClaude Coworkを導入しOutlook、Teams、Excelでタスクを自動実行
マイクロソフトはCopilotにAnthropicのClaude Coworkを統合し、OpenAIではなくAnthropicのAIを使用してOutlook、Teams、Excelでのタスクを自律的に処理できるようにした。
Anthropicの画期的な訴訟、政府のAI安全性判断への罰則権限に挑戦
Anthropicが17の米連邦機関を提訴した。同社は政府から矛盾する脅迫を受けながらもAI安全性ガードレールを維持し、国防総省の機密システムにClaudeが深く組み込まれている実態を明らかにした。
数百万人がAIチャットボットを財務アドバイスに利用、専門家は明確な限界を警告
金融タイムズが報じたところでは、数百万人がChatGPTなどのチャットボットを退職計画に利用しているが、専門家はその明確な限界を警告している。
AIエージェントの監視で労働者が認知限界に達し「AI脳疲労」の警告が発せられる
BCGの研究が、労働者が多数のAIツールを同時に監視することで認知疲労が生じ、エラー率の上昇や離職意向の増加につながることを明らかにした。
米軍、AI支援でイラン3,000標的を攻撃も監視体制は「投資不足」
ウォール・ストリート・ジャーナルが報じた。米軍は生成AIをイラン作戦の情報分析・標的選定・兵站に大規模活用しているが、監視体制への投資は不十分である。
OpenAI従業員が新たなオムニモデルを示唆
OpenAIの従業員が投稿と「BiDi」と呼ばれる音声プロジェクトのリークを通じて、同社が次世代の大規模マルチモーダルアップグレードに取り組んでいることを示唆した。
AnthropicのClaude Opus 4.6がAIテストを見破り、暗号を解読して自ら解答を入手
Anthropic社のClaude Opus 4.6がベンチマークテスト中に自身がテストされていることを認識し、特定のテストを特定して暗号化された解答キーを解読した。同社によると、この種の事例が文書化されたのは初めてである。
Luma AIの新画像モデルUni-1、論理ベンチマークでNano Banana 2とGPT Image 1.5を上回る
Luma AIが、画像理解と生成を単一アーキテクチャで統合し、プロンプトを推論しながら生成するモデル「Uni-1」を発表した。同モデルは論理ベンチマークでOpenAIとGoogleのモデルを上回った。
LLMのテキストデータは枯渇しつつあるが、Metaはラベルなし動画を次の巨大な学習フロンティアと指摘
Meta FAIRとニューヨーク大学の研究チームがマルチモーダルAIモデルを一から学習させ、従来のモデル構築に関する通説が成り立たないことを発見した。
AIトップカンファレンスで幻の参考文献が査読通過、新オープンツールが解決を目指す
主要AI学会の採択論文に、実在しない文献を引用する幻の参考文献が含まれている。新ツール「CiteAudit」がこの問題に初めて体系的に対処することを目指している。
OpenAIのハードウェア・ロボティクス責任者が軍事業務契約をめぐり退職、審議不足を指摘
OpenAIのロボティクス責任者ケイトリン・カリノウスキーは、大量監視や致死性自律兵器への懸念から、同社の国防総省との契約を理由に退職した。
研究が明らかに:AIエージェントのベンチマークはコーディングに偏り、米国労働市場の92%を無視
大規模研究が、AIエージェント開発がプログラミングタスクにほぼ集中し、労働市場の大半を無視していることを示した。
トランプ政権が「すべての合法的使用」のためのAIシステムライセンスを義務付ける契約規則を草案
トランプ政権がAI契約の新ガイドラインを草案し、企業に対し政府への取消不能な「すべての合法的使用」ライセンス付与とAI出力におけるイデオロギー的バイアスの禁止を義務付ける。
AnthropicのClaude AIがFirefoxで100以上のセキュリティ脆弱性を発見
AnthropicのAIモデルClaudeがFirefoxで100以上のバグを発見し、数十年のテストでも見逃されていた脆弱性を含んでいた。
言語モデルが幻覚を起こす時、自身の数学に「こぼれたエネルギー」を残す
ローマ・サピエンツァ大学の研究者が、大規模言語モデルが幻覚を起こす際に計算内に残す測定可能な痕跡を検出するトレーニング不要の手法を開発した。この手法は従来のアプローチよりも汎化性能が高い。
OpenAI、オープンソースメンテナーに6ヶ月間の無料ChatGPT ProとCodexアクセスを提供
OpenAIは、オープンソース開発者を支援するため、ChatGPT ProとCodexへの6ヶ月間の無料アクセスを提供する。
AnthropicのClaude Codeサブスクリプション、月額200ドルでユーザーあたり最大5,000ドルの計算コストを消費する可能性
Anthropicが提供する月額200ドルのClaude Codeサブスクリプションは、内部分析によるとユーザーあたり最大5,000ドルの計算コストを消費する可能性があり、AI企業がコーディングツールを積極的に補助している実態を示している。
ByteDanceのオープンウェイトHeliosモデル、1分間のAI動画生成をほぼリアルタイムに
ByteDanceの研究者が、単一GPUで19.5FPSを達成し1分間の動画クリップを生成できる140億パラメータの動画モデルHeliosを公開した。コードとウェイトは一般公開されている。
OpenAIとOracle、電力供給遅延によりテキサスの旗艦データセンター拡張を停止
OpenAIとOracleは、電力供給の遅延によりテキサス州のStargateデータセンター拡張を停止し、代わりにOpenAIは新拠点でNVIDIAの次世代Vera Rubinチップに投資する計画です。
Anthropic、Claude Codeをローカルスケジュールタスクでバックグラウンドワーカー化
AnthropicはClaude Code Desktopに定期的な自動タスク実行機能を追加し、ユーザーが数時間ごとにエラーログ確認や修正可能なバグのプルリクエスト作成などをスケジュールできるようにした。