#llm のAIニュース
1830件の記事
Claude Design、日常業務でもブランド一貫性を維持
Anthropic は「Claude Design」をアップデートし、日常業務においてブランドの一貫性を保つ機能を強化しました。
Claude プラットフォームへのワークロードアイデンティティ連合によるセキュアアクセス
Anthropic は、Claude プラットフォームへのアクセスを強化するため、ワークロードアイデンティティ連合機能を提供すると発表した。これにより、クラウド環境での認証セキュリティが向上する。
Kimi K2.7 Code と Claude Fable 5 の比較:ランディングページ作成コストが 94% 削減
Together AI は、Kimi K2.7 Code モデルと Claude Fable 5 モデルを比較し、ランディングページ作成におけるコストが 94% 削減されることを示した。
Anthropic、ソウル事務所を開設し韓国 AI エコシステム全体で新たなパートナーシップを発表
AI 企業 Anthropic がソウルに事務所を開設し、韓国の AI エコシステムにおける複数の組織と新たなパートナーシップを結んだ。
トークンを無駄にするな(15 分読了)
TLDR AI は、AI モデルの推論コストを削減し、トークン使用効率を最大化するための具体的な戦略やベストプラクティスを解説している。
Anthropic、Claude Agent SDK のトークン課金見直しを一時停止
Anthropic は先月発表した価格改定案を直前で一時停止し、Claude Agent SDK の利用料を標準 API 料金に統一する方針へ変更した。同社はユーザーの構築環境に合わせたプラン更新を進めている。
最速・最大・最強:NVIDIA Blackwell が MLPerf Training 6.0 で圧勝
NVIDIA は Blackwell プラットフォームで MLPerf Training 6.0 ベンチマークを支配し、8,192 GPU を使用した最速かつ最大のトレーニング時間を達成しました。NVLink や NVFP4 の革新により MoE モデルの効率的なルーティングが可能になり、信頼性機能も大規模 AI 環境での稼働率向上に貢献しています。
トランプ政権との対立がアンソロピックの売上に好影響を与える可能性を示すデータ
販売データは、アンソロピック社がトランプ政権と繰り広げる最新の対立が、同社の売上向上に寄与する可能性があることを示唆している。
新 Siri が Apple の最も便利な OS 機能を使いにくい混乱に陥れた
Apple は WWDC で発表した新しい AI 搭載 Siri を、iOS や macOS の既存の有用な機能の上に Google の AI オーバービューを無理やり重ねた結果、生態系全体が使いにくくなったと評価している。
GitHub Models、新規顧客への提供終了を発表
GitHub は、同社が提供する AI モデルサービス「GitHub Models」について、新規顧客への提供を停止し、段階的な廃止に向けた第一歩として発表した。既存顧客は引き続き利用可能だが、将来的な完全廃止のスケジュールは追って発表される予定である。
Factory が LangSmith を活用してフィードバックループを自動化し、反復速度を 2 倍に向上させた事例
LangChain のブログは、企業 Factory が LangSmith ツールを使用してフィードバックループの自動化を実現し、開発の反復速度を 2 倍に加速させた具体的な事例を紹介している。
非同期コーディングエージェント「Open SWE」の公開を発表
LangChain が、開発者がコードを生成・修正できる非同期型のオープンソースコーディングエージェント「Open SWE」を公開した。
LangSmith ベンチマークの共有について
LangChain が開発した LangSmith のベンチマーク結果を公開し、AI アプリケーションの評価基準に関する情報を提供しました。
LangSmith:より良い整理のために再設計された製品ホームページとリソースタグ
LangChain が提供する LangSmith の製品ホームページを再設計し、リソースタグ機能を追加して情報の整理を改善しました。
エージェント工学:新たな学問分野として確立
LangChain Blog は、AI エージェントの設計・構築を体系化する「エージェント工学」という新しい学問分野の確立を提案している。
Amazon SageMaker AI で P-EAGLE を用いた推測的デコーディングの並列化
AWS は、大規模言語モデルの推論スループットを最大化し遅延を最小化する戦略として、軽量ドラフトモデルとターゲット LLM を組み合わせた「P-EAGLE」による推測的デコーディングの並列化技術を Amazon SageMaker AI で実装したと発表した。
NVIDIA ACE ゲームエージェント SDK と Unreal Engine 5 プラグインを用いたオンデバイス AI コンパニオンの構築
NVIDIA は、Unreal Engine 5 の RTX ブランチおよび DLSS プラグインを活用し、オンデバイスで動作する AI ゲームキャラクター(コンパニオン)を構築するための SDK とプラグインを発表した。
SpaceX が AI コーディングプラットフォーム Cursor を 600 億ドルで買収
SpaceX は、AI 統合を強化した IDE ツール「Cursor」を株式取引により 600 億ドルで購入すると発表した。この買収は、SpaceX の IPO と xAI との合併直後に発表された。
漏洩した財務文書が示す OpenAI の年間数十億ドル規模の赤字
OpenAI が SEC に提出する書類に先立ち、記者 Ed Zitron が入手した監査済み財務文書により、同社の収益は急成長しているものの、支出の方がさらに大きく、年間数十億ドル規模の赤字を計上していることが明らかになった。
ゲオルギ・ジェルガノフ氏への言及:Qwen3.6-27B のコーディング能力について
Simon Willison は、Georgi Gerganov 氏が Qwen3.6-27B モデルをローカル環境でコーディングタスクにほぼ毎日使用しており、実用的なツールとして非常に有能力であると証言していることを紹介した。
低精度トレーニングにおけるトランスフォーマーベースモデルの最適化手法
NVIDIA は、低精度トレーニングでトランスフォーマーモデルを効率的に実行するための具体的な最適化手法をブログ記事で公開した。
NVIDIA Blackwell、MLPerf Training 6.0 で業界をリードするスケーラビリティとパフォーマンスを獲得し首位に
NVIDIA は、同社の最新 AI チップセット「Blackwell」が MLPerf Training 6.0 ベンチマークで業界最高水準のスケーラビリティとパフォーマンスを発揮し、首位を獲得したことを発表した。
Frontier のポストトレーニングレシピを Finbarr Timbers とレビュー
著者が RLHF やポストトレーニングの基礎をまとめるため、Finbarr Timbers をポッドキャストに招き、Olmo 型レシピを最先端レベルへ引き上げるための現状と必要な手順について議論した。
ChatGPT の市場シェアが初めて 50% を下回る
OpenAI が提供する ChatGPT の市場シェアが、競合他社の台頭により初めて 50% を割り込んだことが示された。
Atoms の紹介:AI エージェントがアプリの構築・展開・マーケティングを支援するノーコード「バイブコーディング」ツール
MarkTechPost は、開発者でなくても自然言語でアイデアを伝えるだけで AI がアプリを構築・編集・改善し、さらに展開やマーケティングまで行う新ツール「Atoms」を紹介した。
Google Cloud、AI エージェントに構造化された文脈を提供するベンダー中立の Markdown 仕様「Open Knowledge Format(OKF)」を発表
Google Cloud は、LLM の知識不足という課題に対処するため、表スキーマやメトリック定義などを整理した形式を標準化するオープン仕様の「Open Knowledge Format(OKF)」を発表しました。これにより、AI エージェントが散在する情報を統合的に活用できるようになります。
Fable 5 の輸出規制が米国のサイバー防衛に悪影響を与える
Simon Willison は、Claude Fable 5 が輸出規制により禁止された理由がコード修正だったと確認し、この規制が米国のサイバー防衛を損なっていると指摘した。
アトランティック紙のマット・ウォン氏引用:ホワイトハウス報告書におけるアンソロピックとファベルの関与
サイバーセキュリティ専門家でありルタ・セキュリティCEOのカティ・ムッソウリス氏は、ホワイトハウスの「フェイブル」脱獄に関する報告書をアンソロピックが共有し、評価を求めたと明かした。同氏はこの報告書において、IT 専門家がバグの特定と修正のためにファベルに協力を依頼したと述べている。
Claude Mythos 5 を巡る争い:Anthropic がトランプ政権と輸出規制で対立
Anthropic は、トランプ政権から受けた輸出管理指令により、最新モデル「Mythos 5」および「Fable 5」へのアクセスを停止するよう命じられ、週末に政府と対立している。
独自モデルのポストトレーニングはすべきか?(4 分読了)
TLDR AI は、汎用 Frontier モデルが初期プロトタイプには適している一方、企業のミッションや収益に直結する特殊なユースケースでは、コスト・遅延・信頼性の制約に対応するため独自モデルのポストトレーニングが推奨されると述べている。
多言語 AI を構築する研究者や開発者を加速させる新オープンデータセットの発表
TLDR AI が、多言語 AI の構築を支援する新しいオープンデータセットを発表し、研究者や開発者の作業効率向上を図っている。
AWS WAF が AI トラフィックの収益化機能を追加し、コンテンツ所有者が AI ボットにアクセス料金を請求可能に
Amazon Web Services は、ウェブアプリケーションファイアウォール「AWS WAF」に新機能を実装しました。これにより、コンテンツオーナーは AI ボットのデータ利用に対してアクセス料金を請求できるようになります。
AI推論エンジニアリングへのガイド(17分読了)
TLDR AI は、生産環境で訓練済みAIモデルを効率的に実行する分野である「AI推論エンジニアリング」について解説し、遅延・スループット・コスト・品質の最適化が重要であると述べています。
Fireworks と LangChain が Qwen-3.5-35B を活用したコスト効率の高いトレース判定器を開発
Fireworks と LangChain は、Qwen-3.5-35B モデルをチャットデータで微調整し、ユーザーが特定するエラーを検出できる「知覚的エラー」判定器を開発しました。この手法により、最先端モデルに匹敵する性能を維持しながらコストを大幅に削減することに成功しています。
DFlash と Spec V2 デコーディングの解説(14 分読了)
TLDR AI が、生成モデルの推論効率を向上させる DFlash および Spec V2 デコーディング技術について解説している。
米政府のアンソロピックモデル禁止は、AI の脱獄が理由ではなかった
米国政府がアンソロピック社の生成AIモデルを禁止した背景について、その真の原因が「AI の脱獄(セキュリティ侵害)」によるものではないと指摘する分析記事。
Facebook の新 AI モード検索は投稿情報を活用
Meta は Facebook で「AI Mode」を検索機能に追加し、ユーザーの公開投稿を基に AI が生成した結果を提供する機能を本日開始した。
AI業界の命運を分ける可能性のあるMAGA派の権力闘争:Anthropicの事例
Anthropicは、政府からの輸出管理指令により、米国国外および国内の外国人に対する新モデル「Claude Fable 5」および「Mythos 5」へのアクセスを即時停止すると発表した。これにより事実上の技術禁止措置が講じられた。
Amazon Bedrock に Google DeepMind の「Gemma 4」モデルシリーズが追加
Google DeepMind が開発したオープンウェイトの AI モデル「Gemma 4」シリーズ(31B、26B-A4B、E2B)が、Amazon Bedrock で利用可能になった。
GitHub Copilot CLI 初心者向け:一般的なスラッシュコマンドの概要
GitHub は、GitHub Copilot CLI の初心者向けシリーズで、スラッシュコマンドの意味や重要性、効率的な使用方法を解説し、モデル切り替えやトークン使用量の確認などのタスクを紹介した。
ホワイトハウスとの対立に関するアンソロピックの最新ニュース
米政府は6月12日、外国からのアクセスを遮断する命令を出し、アンソロピックはペンタゴンとの紛争に加え、新モデル「Fable 5」や「Mythos 5」への規制対応に直面している。
Meta の新「AI モード」が Facebook で公開情報を活用
Meta はFacebook に新機能「AI モード」を導入し、同社プラットフォーム全体から公開された情報を参照して回答を生成する機能を展開した。
トランプ政権によるアンソロピックの停止が、非米国の AI の必要性を浮き彫りにした
ホワイトハウスの要求により、米国企業アンソロピックは週末に最新かつ最強力な AI モデルの利用を突然停止し、外国人(自社従業員含む)へのアクセスをブロックした。この出来事は、米国が最先端 AI を独占している現状と、非米国の AI 開発の重要性を改めて示した。
Fireworks を活用した 100 倍安価なトレース判定器の構築
LangChain が Fireworks の技術を活用し、従来の 100 分の 1 のコストで動作するトレース判定器を開発したと発表した。
Align Evals の紹介:LLM アプリケーション評価の効率化
LangChain が、大規模言語モデル(LLM)を用いたアプリケーションの評価プロセスを簡素化する新ツール「Align Evals」を発表した。
高度な融合カーネルによる MoE 学習スループットの向上
NVIDIA は、高度な融合カーネル技術を活用することで、混合専門家モデル(MoE)の学習処理速度を大幅に向上させる手法を発表した。
LangSmith を用いたペア評価の実装
LangChain が提供する LangSmith ツールにおいて、モデルの出力を比較するペア評価手法を紹介し、開発者が評価プロセスを効率化する方法を解説している。
サイバーセキュリティの専門家が「危険」としてアンソロピックの最強力モデル輸出禁止に抗議
サイバーセキュリティ専門家数十名がホワイトハウスに対し、アンソロピック社の最強力モデル「フェイブル」および「ミソス」への輸出規制撤廃を求めた。この規制はソフトウェアや製品のセキュリティ確保能力を制限すると主張している。
LangChain がコーディングエージェントの予測可能性を高める方法
LangChain は、コーディングエージェントがより予測可能な動作を行うための手法を開発・実装した。これにより、開発プロセスにおけるエージェントの挙動制御が可能となった。
"彼らが私たちを裏切った": 性格の衝突によりアンソロピックのモデルがオフラインに
米政府とアンソロピックの関係者によると、両者の間の性格上の対立が原因で、同社のAIモデルへのアクセスが一時的に停止された。これはホワイトハウスとの関係に関する内部告発記事に基づくものである。