#大規模言語モデル のAIニュース
92件の記事
AutoSP の紹介:長文コンテキスト LLM 学習を自動化する新技術
DeepSpeed と統合された AutoSP は、標準的なトランスフォーマー学習コードをシーケンス並列化コードへ自動変換し、複数の GPU で実行オーバーヘッドを抑えながら長いシーケンスの学習を可能にする。また、高度な活性化チェックポイント戦略によりメモリ管理が向上する。
NVIDIA のマルチモーダル AI モデル「Nemotron 3 Nano Omni」が Amazon SageMaker JumpStart で利用可能に
NVIDIA は、動画・音声・画像・テキストを単一アーキテクチャで処理する新モデル「Nemotron 3 Nano Omni」を、Amazon SageMaker JumpStart で即日公開した。これにより企業は、複数の情報を一度に推論して知能の高いアプリケーションを構築できるようになる。
GPT-5.5はベンチマークで最高スコアを記録するも頻繁に幻覚が発生し、API利用料は20%値上げ
OpenAIのGPT-5.5はベンチマークで首位を記録するも、頻繁に幻覚(誤回答)が発生し、API利用料は前モデル比20%以上値上げされている。
GPT-5.5システムカード
OpenAIはGPT-5.5の性能基準、安全性対策、使用制限を網羅した技術文書「システムカード」を公開し、モデルの運用ガイドラインを示している。
Hy3プレビュー版を公開・オープンソース化:混元再構築後の初モデル、エージェント能力が大幅に向上
腾讯は2026年4月、混元Hy3プレビュー版を公開・オープンソース化した。総パラメータ295B、アクティブ21Bの混合専門家モデルで、高速・低速思考を融合しエージェント能力を大幅に向上させた。
Cursor、SpaceXとモデル訓練でパートナーシップを締結
Cursor社はSpaceX社と提携し、大規模AIモデルの訓練・学習技術を開発する。両社は計算資源とデータを活用し、コード生成AIの精度向上を目指す。
Kimi K2.6をリリースおよびオープンソース化し、コードとエージェントクラスタ能力を全面的に強化
Kimi開発チームはAIモデル「K2.6」をリリースしオープンソース化した。同モデルはコード処理能力とエージェントクラスタの運用性能を大幅に強化した。
AIチップスタートアップCerebrasがIPO申請
AIチップスタートアップのCerebrasがIPOを申請した。同社は最近、Amazon Web Servicesとのデータセンター向けチップ使用契約や、OpenAIとの100億ドル超の契約を発表している。
ザッカーバーグ、AIインフラ資金調達のため従業員10%削減を準備
MetaはAIインフラへの巨額投資を賄うため、5月20日に約8,000人、年内にさらに追加で合計20%以上の従業員削減を計画している。
極氪8Xに乗り込み、階躍大モデルを体感する
階躍星辰は、極氪8Xの量産開始に合わせ、大規模言語モデル「Step 3.5 Flash」を中核とする車載AI「超級Eva」を搭載した。これは単なるチャットボットではなく、運転制御システムと統合された車両全体の知能体である。
Anthropicが「良しだが最高ではない」Claude Opus 4.7をリリース
AnthropicがClaude Opus 4.7をリリースし、モデルのドリフトや幻覚といった企業導入の主要な課題に対応することを目指している。
OpenAIの欧州スターゲート計画が縮小、マイクロソフトとグーグルがキャパシティを引き継ぐ
OpenAIのサム・アルトマンCEOは2025年7月にノルウェー・ナルビクへのスターゲート計画に自信を示したが、数ヶ月後には計画が縮小し、マイクロソフトとグーグルがキャパシティを引き継いだ。
OpenAIのGPT-5.4 Proが未解決のエルデシュ数学問題を2時間未満で解いたと報告
OpenAIのGPT-5.4 Proが未解決のエルデシュ数学問題を80分で解き、数学者テレンス・タオは数学への有意義な貢献と評価した。
OpenAIの流出メモが新「Spud」モデルは全製品を「大幅に改善」すると主張
OpenAIの内部メモが流出し、同社が新モデル「Spud」の開発を進めており、これが全製品を大幅に改善すると述べている。
AIの基礎
OpenAIが提供するChatGPTなどのツールが大規模言語モデルを活用する仕組みを含め、人工知能の定義と機能を初心者向けに解説するガイドです。
Seed全双工音声大規模モデル発表:傾聴力と耐妨害性を備え、より自然な対話へ
バイトダンスがSeed全双工音声大規模モデルを発表し、同社の豆包アプリに実装した。このモデルは傾聴力と耐妨害性を向上させ、対話の流暢さを12%向上させた。
MetaのMuse Sparkは初のフロンティアモデルで、初の非公開ウェイトモデル
Meta Superintelligence Labsは、初のフロンティアモデルで初めてウェイトを非公開としたMuse Sparkを発表した。独立テストではOpenAI、Anthropic、Googleとの差を縮めているが、競争は続いている。
ラックスケールスーパーコンピュータでのAIワークロード実行:ハードウェアからトポロジ対応スケジューリングまで
NVIDIAは、Blackwellアーキテクチャを採用したGB200 NVL72およびGB300 NVL72システムを発表した。これらのラックスケールスーパーコンピュータは、AIワークロード向けに設計され、トポロジ対応スケジューリング技術を備えている。
Anthropic、需要急増を受けGoogleとBroadcomとのコンピュート契約を拡大
Anthropicは、年間収益が300億ドルに急増したことを受け、GoogleとBroadcomとのコンピュート契約を拡大した。
Meta、新AIモデルの一部をオープンソース化する計画
Metaは、新AIモデルの一部をオープンソースとして公開する計画を進めている。
Meta社員が社内AIリーダーボードでトークン消費量を競う
Meta社は社員がAIトークン消費量を競う社内リーダーボードを導入し、「トークンレジェンド」などの称号を設けたが、トークン消費量の多さが直接生産性向上につながるわけではないと指摘している。
Anthropic、GoogleとBroadcomと複数ギガワットのTPU契約を締結
AnthropicはGoogleとBroadcomと、2027年から稼働開始予定の複数ギガワット規模のTPU計算容量に関する契約を締結した。
FIPO:2%のトークンを精密追跡し、大規模モデルの推論ボトルネックを突破!
通義実験室の智能計算チームは、大規模言語モデルの推論チェーンにおいて重要な2%のトークンを特定・最適化する新アルゴリズムFIPOを発表した。これにより、従来の強化学習が全てのトークンを均等に扱う問題を解決し、推論効率を向上させた。
ワープデコードによるMoEモデル推論の改善
研究チームが、Mixture of Experts(MoE)モデルの推論効率を向上させる「ワープデコード」技術を開発した。この技術は、複数の専門家モデルを効率的に処理することで、推論速度とリソース使用率を改善する。
おべっかを使うAIチャットボットは理想的な合理的思考者さえも破綻させることができると研究者が正式に証明
MITとワシントン大学の研究者による研究が、完璧に合理的なユーザーでも、お世辞を言うAIチャットボットによって危険な妄想のスパイラルに引き込まれる可能性を示した。事実確認ボットや教育を受けたユーザーでも問題は完全には解決しない。
AnthropicがGoogleとBroadcomとの次世代コンピューティングにおける複数ギガワット規模のパートナーシップを拡大
Anthropicは、次世代コンピューティングのための複数ギガワット規模のリソース確保を目的として、GoogleとBroadcomとのパートナーシップを拡大した。
アリババのQwenチーム、新アルゴリズムでAIモデルの思考を深化
アリババのQwenチームは、各ステップの重要度に応じて報酬を重み付けする新アルゴリズムを開発し、AIモデルの思考プロセスを倍増させた。
ステップフン、3年目の進化「Step 3.5 Flash」を発表
AIネイティブ企業のステップフンは、モデル「Step 3.5 Flash」のリリースを発表した。高速なインferenceと実用性を追求し、高頻度シーンへのAI導入を加速させる。
Gemma 4:バイト単位で最も能力の高いオープンモデル
GoogleがGemma 4を発表した。高度な推論とエージェントワークフロー向けに設計された、これまでで最も知的なオープンモデルである。
アリババが数日間で3つ目の独自AIモデル「Qwen3.6-Plus」を発表
アリババは、数日間で3つ目の独自AIモデルとなる「Qwen3.6-Plus」をリリースした。
OpenAIのグレッグ・ブロックマン氏、GPT推論モデルはAGIへの「視界」があると発言
OpenAI共同創業者のグレッグ・ブロックマン氏が、テキストベースモデルが汎用人工知能を達成できるかという議論は決着したと述べ、GPTアーキテクチャがAGIにつながると主張した。
LLMベースのテキスト読み上げシステムの品質と堅牢性の向上
研究者らが、低ランク適応、データ拡張、連鎖的思考推論などの技術を用いて、アクセントのない多言語出力、表現力の向上、信頼性の高い合成を実現するLLMベースのテキスト読み上げシステムの品質と堅牢性を向上させた。
LWiAIポッドキャスト #238 - GPT 5.4 mini、OpenAIの方向転換、Mamba 3、Attention Residuals
Andrey KurenkovとJeremie Harrisが、OpenAIが40万トークンのコンテキストウィンドウを持つGPT-5.4 miniとnanoを発表したことなど、先週の主要なAIニュースを要約・議論した。
Nebius、フィンランドに欧州最大級のAIファクトリーを建設
Nebiusがフィンランドに310MW規模のAIファクトリーを建設し、欧州が米国のAIインフラに対抗する動きを加速させる。
AIの次の段階を加速
OpenAIが1,220億ドルの新規資金を調達し、フロンティアAIの世界的拡大、次世代コンピューティングへの投資、ChatGPT・Codex・企業向けAIの需要増に対応する。
Kimi 楊植麟「2026 中関村フォーラム」講演全文(動画付き)
月之暗面のKimiが2026年3月31日に天津で開催された中関村フォーラムで講演し、すべての基盤技術は再考に値すると主張した。
ネビアス、フィンランドのロシア国境近くに100億ドルのAIデータセンターを計画
AIインフラ企業のネビアスグループが、フィンランドのラッペーンランタに310メガワットのデータセンターを建設する。
Googleの新GeminiアップデートでChatGPTとClaudeのメモリを簡単にインポート可能に
GoogleとAnthropicは、ChatGPTのユーザーを引き込むため、保存されたユーザーデータをエクスポートする簡単なプロンプトトリックを提供している。
Anthropicのリークにより、従来モデルを「劇的に上回るテストスコア」を持つ新モデル「Claude Mythos」が明らかに
Anthropicがセキュリティミスにより、従来モデルよりもテストスコアが劇的に高い新AIモデル「Claude Mythos」を公開した。OpenAIも次世代モデルを準備中で、両社は上場前に最先端技術を競っている。
Meta、テキサスのAIデータセンター投資を15億ドルから100億ドルに増額
Metaは、テキサスのAIデータセンター投資を15億ドルから100億ドルに増額し、容量を1ギガワットに拡大すると発表した。同社はチームの内部再編も実施している。
GLM-5.1が全Coding Planユーザーに開放
智譜がGLM-5.1をGLM Coding Planの全ユーザー(Lite/Pro/Max)に開放した。
AppleがGeminiに完全アクセスを獲得、蒸留技術で軽量オンデバイスAIを構築
AppleはGoogleのGeminiにアクセスし、蒸留技術でSiriやデバイス向けの小型AIモデルを開発している。中国AI企業が秘密裏に行っているとされる手法を採用している。
AIによるAI研究の実現へ:AIサイエンティスト論文がNature誌に掲載
AIサイエンティストが科学的ブレイクスルーを自律的に探索する研究論文がNature誌に掲載された。
OpenAI CEO サム・アルトマン、経済を「本当に加速できる」非常に強力な新モデルを内部で示唆
OpenAIのサム・アルトマンCEOが、次世代AIモデル「Spud」の事前学習を完了し、経済を「本当に加速できる」非常に強力なモデルであると内部で示唆した。
独占的自己注意(XSA)の独自紹介
研究者はTransformerの自己注意を改良した「独占的自己注意(XSA)」を発表した。これはトークン自身の情報を除外し、直交する情報のみに焦点を当てる手法で、最大27億パラメータのモデルにおいて言語モデリング性能を向上させる。
Amazon BedrockにおけるClaudeツール使用によるカスタムエンティティ認識の高速化
Amazonは、AWSのBedrockプラットフォームでClaudeのツール使用機能を活用し、非構造化データからカスタムエンティティを効率的に抽出するソリューションを発表した。
ゴルディロックスRL:推論のためのスパース報酬から脱却するためのタスク難易度調整
研究者らは、大規模言語モデルの推論能力を強化するための新しい教師駆動型データサンプリング手法「ゴルディロックス」を提案した。この手法は、タスクの難易度を適切に調整することで、従来の強化学習におけるスパース報酬問題を解決し、サンプル効率を向上させる。
MIT-IBM Watson AI Lab、若手教員の影響力を増幅する「seed to signal」プログラム
MIT-IBM Watson AI Labは、若手教員が研究チームを構築し、革新的なAI研究の方向性を確立するための支援プログラム「seed to signal」を実施している。
P-GenRM:パーソナライズされた生成報酬モデルが多様な個人嗜好に対応
通義実験室の自然言語知能チームは、異なる個人や状況に応じた回答を生成できるP-GenRM(Personalized Generative Reward Model)を開発した。これは初のオープンドメイン向けパーソナライズ生成報酬モデルで、ICLR 2026に採択された。
次世代AIの新たなフロンティアに向けたNVIDIA BlueField-4搭載CMXコンテキストメモリストレージプラットフォームの紹介
NVIDIAが、エージェント型AIワークフローで数百万トークンに拡大するコンテキストウィンドウに対応するCMXコンテキストメモリストレージプラットフォームを発表した。