#llm のAIニュース
1787件の記事
ミストラル AI とは?OpenAI の競合企業に関する全知識
TechCrunch は、フランスの人工知能スタートアップであるミストラル AI が OpenAI に挑戦する存在として注目されている背景と、同社の概要を解説している。
Mistral AI、Apache-2.0ライセンスのLean 4用コードエージェント「Leanstral 1.5」を公開しPutnamBenchで672問中587問を解決
Mistral AIは、証明支援ツールLean 4向けのコードエージェントモデル「Leanstral 1.5」をApache-2.0ライセンスで公開した。同モデルは自動定理証明と証明工学を対象とし、無料APIも提供開始された。
オープンソース AI グラップマップの公開
非営利団体「Current AI」が、パリで開催されたAIアクションサミットで設立され、4億ドルの資金を確保した同団体が、オープンソースAIの現状を可視化する「Gap Map」を公開しました。
Josh W. Comeau が AI をオンラインコース販売の減少要因と指摘
開発者向け教育者の Josh W. Comeau は、自身のオンラインコースの販売数が前年比で大幅に減少したと報告し、その最大の理由として生成 AI の普及を挙げている。
今年必要となる唯一の AI ガイダンス
TechCrunch AI が、今年中に知っておくべき AI 用語を網羅したガイドラインを発表しました。
Fable の判断力を活用する重要性について
Simon Willison は、AIE で開催された Fireside Chat で Cat Wu と Thariq Shihipar が示した通り、Fable や Opus といった AI エージェントに作業方法を指示するのではなく、自らの判断力(ジャッジメント)を任せるべきだと述べています。
2026年6月ニュースレター:Claude Fable 5、GPT-5.6、輸出規制、GLM-5.2の登場など
Simon Willison氏が公開した6月度のニュースレターでは、Claude Fable 5やGPT-5.6といった新モデル、米国の輸出規制、オープンウェイトモデルで最高性能となったGLM-5.2、トークン最適化の終焉、Datasette Appsなどの話題が紹介されています。
Fable #6:王の帰還
The Zvi は、一時的な停止を経て「Fable」が正式に復活したと発表しました。この復権を告げる公式書簡は、Dario Amodei ではなく Tom Brown宛てに送られたことが示されています。
Python で Claude API を使い始めるガイド
KDnuggets が公開した記事で、開発者が Python を用いて Anthropic の Claude API に接続し、基本的な利用方法を学ぶ手順を解説している。
Seed2.0 モデルカード(72 分間の読了)
TLDR AI が Seed2.0 モデルの詳細仕様と性能を記載したモデルカードを発表しました。
AI 向けラマヌジャン・チャレンジ(1 分読了)
TLDR AI が、AI の数学的推論能力を評価する「ラマヌジャン・チャレンジ」を発表した。この挑戦は、AI が高度な数理論理や未解決問題の解決を試みることを目的としている。
Claude Enterprise に新分析機能とコスト管理が追加されました
Anthropic は Claude Enterprise の利用者が、サービスの使用状況を詳細に分析し、コストを厳格に制御できる新機能を公開しました。
Laguna XS 2.1 の紹介(5 分読了)
TLDR AI は、エージェント型コーディングと長期タスクに最適化された 330 億パラメータの Mixture-of-Experts モデル「Laguna XS 2.1」を発表しました。このモデルは SWE-bench Multilingual で 5.4 ポイント向上し、OpenMDW-1.1 ライセンスで Hugging Face から利用可能です。
Anthropic、サムスン製チップとの提携を検討中
AI企業のアントロピックは、サムスンの半導体チップを活用するパートナーシップの構築を検討している。
メタの「Watermelon」が GPT-5.5 ベンチマークに匹敵
メタの超知能責任者アレクサンダー・ワン氏は、訓練中の新モデル「Watermelon」が OpenAI の GPT-5.5 と同等のベンチマーク性能を達成したと発表した。同モデルは計算資源を桁違いに多く使用しているという。
残差コンテキスト拡散言語モデル(2 分読了)
最先端のブロック別拡散大規模言語モデルが、自信のあるトークンのみを復号し他を破棄する仕組みに対し、破棄されたトークンの情報を残差として次ステップに注入する新モジュール「Residual Context Diffusion」を開発した。
GitHub Copilot における Gemini 2.5 Pro および Gemini 3 Flash の利用終了発表
GitHub は、2026 年 7 月 31 日までに GitHub Copilot 全機能から Gemini 2.5 Pro と Gemini 3 Flash を廃止し、それぞれ Gemini 3.1 Pro および Gemini 3.5 Flash への移行をユーザーに求めている。
RAG-Anything チュートリアル:Colab でテキスト、表、数式、画像を扱うマルチモーダル検索パイプラインの構築方法
MarkTechPost は、Colab 環境で RAG-Anything ワークフローを実装し、テキストや表、数式、画像など多様なデータ形式に対するマルチモーダル検索の仕組みを検証するチュートリアルを公開しました。
未来のウェブサイトは訪問者ごとに自動構成されるかもしれない
Adobe のカールス・サンチェス氏は、ウェブサイトのパーソナライゼーションが従来の選択肢選択から脱却し、各訪問者向けにサイト自体が自動的に構築される未来の可能性について語った。
アリババのページエージェント:DOM を介して自然言語で Web インターフェースを制御する JavaScript 内蔵 GUI エージェント
アリババが公開したオープンソースプロジェクト「Page Agent」は、外部プロセスではなくウェブページ内に JavaScript として埋め込まれ、スクリーンショットや多モーダルモデルを使わずに DOM を直接読み取って自然言語で Web インターフェースを操作する技術です。
The Pulse:新たなトレンド、スマートモデルルーティング
ゲルゲーが、エンジニアリング部門における AI 支出削減の動向を解説するニュースレターで、スマートなモデルルーティングという新トレンドを取り上げている。
Anthropic、サムスンと新カスタムチップの検討中
AI企業のアントロピックは、サムスン電子と独自に設計した新しい半導体チップの開発について協議している。
DSPy を用いた Datasette Agent の SQL システムプロンプトの評価と改善
Simon Willison は、Stanford NLP が開発した DSPy というフレームワークを活用し、Datasette Agent が生成する SQL 用のシステムプロンプトを評価・改善する研究を行いました。
コーディングエージェントの利用料金が倍増。その対策とは
LangChain は、コーディングエージェントの使用による請求額が倍増したユーザーに対し、コスト削減のための具体的な解決策を提示しました。
参加するには理解せよ:コーディングエージェントとの協働における認知負荷の課題
Simon Willison は、Geoffrey Litt が AIE で語った「参加するには理解せよ」という考えに共感し、コード生成エージェントが複雑な変更を行う際の協働難易度と、理解が追いつかないことで生じる認知負債のリスクを指摘した。
NVIDIA BioNeMo が Anthropic の Claude Science を加速
Anthropic は科学調査用 AI ワークベンチ「Claude Science」の公開ベータ版を立ち上げ、NVIDIA の BioNeMo エージェント・ツールキットとネイティブ連携することで、計算生命科学研究の高速化を実現した。
大規模モジュラー LLM:デンマーク基盤モデルプロジェクトが FlexOlmo を活用し、機密データを共有せずに専門知識を集約する方法
デンマークの基盤モデルプロジェクトは、FlexOlmo を基盤とした効率的なモジュラー LLM 構造「FlexMoRE」を採用している。これにより、各機関は機密や独自データで訓練された専門モデルを貢献でき、データを共有せずに済む。また、結果として得られるモデルは高アクセシビリティのハードウェア上で実行可能となる。
[AINews] 今日は何も大きな出来事はありませんでした
Latent Space が運営するニュースレター「AINews」は、7月1日付で、Fable の再ローンや AIE によるフィールドガイド発表など、いくつかのイベント報告を掲載しましたが、業界全体に衝撃を与えるような新技術や大型買収などの重大な出来事はなかったと結論付けています。
生成AIの利活用事例に関するLT会を開催しました! Hacking Fest 2026 Spring 開催レポート
Fable 5 のサイバーセキュリティ対策と Jailbreak フレームワークの詳細について
Anthropic が、AI モデル「Fable 5」のサイバーセキュリティ対策および同モデルに対する脱獄(Jailbreak)攻撃を検証・分析するためのフレームワークに関する詳細情報を発表した。
Claude の管理者向け支出の可視性と制御機能の強化
Anthropic は、Claude の利用における管理者向けの支出状況の可視性を高め、コスト管理をより細かく制御できる機能を追加したと発表した。
MemoryLLM:トランスフォーマー向けのプラグ・アンド・プレイ型解釈可能なフィードフォワードメモリ
Apple Machine Learning は、トランスフォーマーの構成要素を解明する研究の一環として、フィードフォワードモジュールと自己注意機構を分離し、文脈に依存しないトークンごとのニューラル検索メモリを実現する「MemoryLLM」を発表した。
マルチエージェントチームは専門家の能力を阻害する
Apple Machine Learning は、自律的な協働を行うマルチエージェント LLM システムにおいて、固定された役割やワークフローに依存しない自己組織化型チームの性能について調査し、既存の制約が専門家の能力を妨げる可能性を示唆した。
AI ゲートウェイにルーティングルールが利用可能に
Vercel は AI ゲートウェイでファイアウォール型のルーティングルールをサポートし、モデル障害時にコード変更なしで即座にリクエストを転送できるようにした。
Fable 5 の再展開(18 分読了)
Anthropic は Claude Fable 5 と Mythos 5 を再展開した。Fable 5 は 7 月 7 日まで週次利用制限の最大 50% に含まれ、以降は利用クレジットで提供される。Mythos 5 は一部の米国組織で復元され、政府と連携して Glasswing プログラムへのアクセス拡大を進めている。
ZCode が macOS、Windows、Linux で利用可能に(1 分読了)
ZCode は macOS、Windows、Linux に対応し、開発者が摩擦なく計画からデプロイまで行えるよう AI エージェントと既存ツールを統合しました。GLM-5.2 を最適化し、GLM コーディングプラン加入者は利用枠が 1.5 倍になります。
金融タスクにおける専門家判断の模倣学習(14 分読了)
TLDR AI は、最先端モデルが単純な金融タスクで苦戦する一方、専門投資家がラベル付けした独自データで微調整されたカスタムモデルの方が性能が高く安価であると報告し、今後は組織ごとに最適化されたモデルが主流になると予測している。
Google、LM Arena で Gemini Flash のアップグレードを検証中(2 分読了)
Google が LM Arena で現在の Gemini Flash より若干改善された新バージョンのテストを実施している。公式発表はないが、過去のテスト実績から「Gemini 3.6 Flash」や「Gemini 4 Flash」といった新ラベルの可能性が示唆されている。
Claude Sonnet 5 は最先端ではないが用途がある
Zvi が、Opus 4.8 や Fable 5 の利用可能により Claude Sonnet 5 の需要は限定的だが、特定の用途には有用であると指摘し、モデルの価格や能力について解説している。
企業はデフォルトで自動モデル選択を有効化可能に
GitHub は、企業管理者が設定ファイルを変更することで、新しいチャットで Copilot が自動的に最適なモデルを選択する機能をデフォルトとして有効化できるようにしました。ユーザーは個別の会話で手動変更も可能です。
GitHub Models、2026年7月30日に完全終了へ
GitHub は、同社が提供する AI モデルプラットフォーム「GitHub Models」を 2026 年 7 月 30 日をもって全機能を停止すると発表した。これにより、新規顧客だけでなく既存の利用者もサービス利用ができなくなる。
米国輸出規制解除後、Anthropic が Claude Fable 5 を再展開し新たなサイバーセキュリティ分類機能を追加
Anthropic は米国の輸出規制が解除されたため、7月1日に最も高性能な一般利用モデル「Claude Fable 5」を世界で再展開した。同社は同時に新しいサイバーセキュリティ分類機能も追加した。
ポッドキャスト:AI トークン破滅が到来
404 Media のポッドキャストでは、プロバイダーが AI トークン課金を開始したことで企業が支出を抑制しようとする動きや、LLM を原始人のように話させるツールなどの対策について解説している。
ゴッドット、AI によるコード投稿を禁止へ
オープンソースゲームエンジン「Godot」の開発チームは、AI 生成によるプルリクエストが急増したため、貢献者による AI 利用のほとんどを禁止する方針に転換し、寄与ポリシーの改訂を進めている。
GitHub Copilot に Kimi K2.7 Code が一般提供開始
Microsoft は GitHub Copilot のモデル選択機能に、Azure でホストされるオープンウェイトモデル「Kimi K2.7 Code」を新たに追加し、開発者が低コストで利用可能な選択肢を提供した。
AWS GovCloud (US) で NVIDIA Nemotron および OpenAI GPT OSS モデルを Amazon Bedrock で実行可能に
AWS が、政府機関向けクラウド環境である AWS GovCloud (US) において、NVIDIA の Nemotron と OpenAI の GPT オープンソースモデルを Amazon Bedrock で利用できるようにした。これにより、機密性の高い任務でも最新の AI 能力を安全に活用できる。
科学者らが AI に 112 人の有名人のなりすましを依頼した結果、AI の回答が本物より「本物らしく」見えたという深刻な警告
404 Media が報じた研究で、AI チャットボットが 112 人の有名人になりすますと、その回答は人間の本物の発言よりも人々に本物らしく、一貫性があり、関連性が高いと認識され、この結果は深刻な警告を示している。
オープンソースのモデルプロファイラーでAmazon Bedrock上のモデル選択を簡素化
AWSは、生成AIアプリケーション開発における複雑なモデル比較を解消するため、Amazon Bedrock上で動作するオープンソースの「Model Profiler」ツールを発表した。これにより、AnthropicやOpenAIなど100以上の基盤モデルから最適な選定が可能になる。
トランプ氏に安全テストを促された後、Anthropic の AI モデルが世界展開へ
米国政府が国家安全保障上のリスクとして指摘した Anthropic の最新モデル「Fable 5」と「Mythos 5」について、輸出規制が解除され、同社がグローバルでの提供を開始すると発表した。
小売 AI の展開によるパーソナライゼーションと顧客洞察のスケール化
業界リーダーは、静的な顧客インタラクションパターンから、ライブセッション中にユーザー環境を変更できるデータパイプラインへ移行し、従来の人口統計学的分類では不十分なエンゲージメントを解消している。