#長文コンテキスト のAIニュース
10件の記事
今日は何も大きな出来事はありませんでした
Smol AI News は、6 月 17 日から 18 日にかけての期間に、主要な AI ニュースや技術進展がない静かな一日であったと報告しています。
[AINews] GLM-5.2:世界最高峰のフロントエンドコーディングモデル、推測型デコーディングのための IndexShare を発表
Z.ai は週末に「GLM-5.2」をリリースし、この新モデルが世界最高のフロントエンドコーディング性能を持つと主張した。また、推測型デコーディング技術の向上を目指す「IndexShare」という仕組みも紹介された。
GLM 5.2:世界最高峰のフロントエンドコーディングモデル、IndexShare がコスト削減を実現
中国のオープンソース界隈で注目される GLM 5.2 モデルが世界最高のフロントエンドコーディング性能を達成し、関連する IndexShare サービスにより開発コストが大幅に削減された。
Z.ai の新フラッグシップモデル「GLM-5.2」が利用可能に
中国の Z.ai が開発した新モデル「GLM-5.2」が、同社のコーディングプラン利用者全員に提供開始された。このモデルは 100 万トークンのコンテキスト対応や長期的タスク処理能力を備え、来週より API やチャットボットサービスも展開される予定だ。
MiniMax、1M トークンコンテキストモデル公開後に M3 の重みを提供すると約束
MiniMax は、10 日以内に M3 モデルの重みと技術報告書を公開すると発表した。同社は現在、このモデルを MiniMax Code や API で提供しており、最大 1M トークンのコンテキストウィンドウを持つ初のオープンウェイトモデルである。
MiniMax M3 の紹介:最先端の 3 つの能力を統合した初のオープンウェイトモデル
MiniMax が、コーディングとエージェント機能、100 万トークンのコンテキスト長など、3 つの最先端機能を組み合わせた初のオープンウェイトモデル「M3」を発表しました。
LLM アーキテクチャの最近の動向:KV シェアリング、mHC、圧縮アテンションについて
Sebastian Raschka は、推論モデルやエージェントワークフローの増加に伴い、コンテキスト効率を重視する新しい LLM アーキテクチャが注目されていると指摘し、KV キャッシュサイズ削減のための KV シェアリングや mHC などの技術動向を紹介している。
DeepSeek v4 の発表と AI ニュースまとめ
AI ニュースレター「AINews」が、2026 年 4 月 23 日から 24 日にかけての期間に DeepSeek v4 という新しいモデルを発表したことを報じています。このニュースは Latent Space の一部として配信されています。
計画、分割、征服:弱モデルが長いコンテキストタスクで優れる理由
研究者らは、計画者・ワーカー・マネージャーによる「分割統治」フレームワークを開発した。これにより、Llama-3-70BやQwen-72Bといった比較的小さなモデルが、GPT-4oの単一ショット推論を上回る性能を発揮し、長大なコンテキスト処理におけるLLMの劣化問題を解決した。
Anthropic、100万トークンコンテキストウィンドウの追加料金を廃止しOpus 4.6とSonnet 4.6を大幅に低価格化
AnthropicがClaude Opus 4.6とSonnet 4.6の長文コンテキストに対する追加料金を廃止し、20万トークンを超えるリクエストのコストが最大2倍から通常料金に引き下げられた。