#長文コンテキストのAIニュース

10件の記事

今日は何も大きな出来事はありませんでした

Smol AI News は、6 月 17 日から 18 日にかけての期間に、主要な AI ニュースや技術進展がない静かな一日であったと報告しています。

Z.ai は週末に「GLM-5.2」をリリースし、この新モデルが世界最高のフロントエンドコーディング性能を持つと主張した。また、推測型デコーディング技術の向上を目指す「IndexShare」という仕組みも紹介された。

中国のオープンソース界隈で注目される GLM 5.2 モデルが世界最高のフロントエンドコーディング性能を達成し、関連する IndexShare サービスにより開発コストが大幅に削減された。

中国の Z.ai が開発した新モデル「GLM-5.2」が、同社のコーディングプラン利用者全員に提供開始された。このモデルは 100 万トークンのコンテキスト対応や長期的タスク処理能力を備え、来週より API やチャットボットサービスも展開される予定だ。

MiniMax は、10 日以内に M3 モデルの重みと技術報告書を公開すると発表した。同社は現在、このモデルを MiniMax Code や API で提供しており、最大 1M トークンのコンテキストウィンドウを持つ初のオープンウェイトモデルである。

MiniMax が、コーディングとエージェント機能、100 万トークンのコンテキスト長など、3 つの最先端機能を組み合わせた初のオープンウェイトモデル「M3」を発表しました。

Sebastian Raschka は、推論モデルやエージェントワークフローの増加に伴い、コンテキスト効率を重視する新しい LLM アーキテクチャが注目されていると指摘し、KV キャッシュサイズ削減のための KV シェアリングや mHC などの技術動向を紹介している。

AI ニュースレター「AINews」が、2026 年 4 月 23 日から 24 日にかけての期間に DeepSeek v4 という新しいモデルを発表したことを報じています。このニュースは Latent Space の一部として配信されています。

研究者らは、計画者・ワーカー・マネージャーによる「分割統治」フレームワークを開発した。これにより、Llama-3-70BやQwen-72Bといった比較的小さなモデルが、GPT-4oの単一ショット推論を上回る性能を発揮し、長大なコンテキスト処理におけるLLMの劣化問題を解決した。

AnthropicがClaude Opus 4.6とSonnet 4.6の長文コンテキストに対する追加料金を廃止し、20万トークンを超えるリクエストのコストが最大2倍から通常料金に引き下げられた。