#大規模言語モデル のAIニュース

92件の記事

AutoSP の紹介:長文コンテキスト LLM 学習を自動化する新技術

DeepSpeed と統合された AutoSP は、標準的なトランスフォーマー学習コードをシーケンス並列化コードへ自動変換し、複数の GPU で実行オーバーヘッドを抑えながら長いシーケンスの学習を可能にする。また、高度な活性化チェックポイント戦略によりメモリ管理が向上する。

TLDR AI·4月30日·★★★★

NVIDIA のマルチモーダル AI モデル「Nemotron 3 Nano Omni」が Amazon SageMaker JumpStart で利用可能に

NVIDIA は、動画・音声・画像・テキストを単一アーキテクチャで処理する新モデル「Nemotron 3 Nano Omni」を、Amazon SageMaker JumpStart で即日公開した。これにより企業は、複数の情報を一度に推論して知能の高いアプリケーションを構築できるようになる。

AWS Machine Learning Blog·4月29日·★★★★

GPT-5.5はベンチマークで最高スコアを記録するも頻繁に幻覚が発生し、API利用料は20%値上げ

OpenAIのGPT-5.5はベンチマークで首位を記録するも、頻繁に幻覚(誤回答)が発生し、API利用料は前モデル比20%以上値上げされている。

The Decoder·4月25日·★★★★

GPT-5.5システムカード

OpenAIはGPT-5.5の性能基準、安全性対策、使用制限を網羅した技術文書「システムカード」を公開し、モデルの運用ガイドラインを示している。

OpenAI News·4月23日·★★★★

Hy3プレビュー版を公開・オープンソース化:混元再構築後の初モデル、エージェント能力が大幅に向上

腾讯は2026年4月、混元Hy3プレビュー版を公開・オープンソース化した。総パラメータ295B、アクティブ21Bの混合専門家モデルで、高速・低速思考を融合しエージェント能力を大幅に向上させた。

腾讯混元·4月23日·★★★★

Cursor、SpaceXとモデル訓練でパートナーシップを締結

Cursor社はSpaceX社と提携し、大規模AIモデルの訓練・学習技術を開発する。両社は計算資源とデータを活用し、コード生成AIの精度向上を目指す。

Cursor Blog·4月22日

Kimi K2.6をリリースおよびオープンソース化し、コードとエージェントクラスタ能力を全面的に強化

Kimi開発チームはAIモデル「K2.6」をリリースしオープンソース化した。同モデルはコード処理能力とエージェントクラスタの運用性能を大幅に強化した。

月之暗面 Kimi·4月21日·★★★★

AIチップスタートアップCerebrasがIPO申請

AIチップスタートアップのCerebrasがIPOを申請した。同社は最近、Amazon Web Servicesとのデータセンター向けチップ使用契約や、OpenAIとの100億ドル超の契約を発表している。

TechCrunch AI·4月19日·★★★★

ザッカーバーグ、AIインフラ資金調達のため従業員10%削減を準備

MetaはAIインフラへの巨額投資を賄うため、5月20日に約8,000人、年内にさらに追加で合計20%以上の従業員削減を計画している。

The Decoder·4月18日·★★★★

極氪8Xに乗り込み、階躍大モデルを体感する

階躍星辰は、極氪8Xの量産開始に合わせ、大規模言語モデル「Step 3.5 Flash」を中核とする車載AI「超級Eva」を搭載した。これは単なるチャットボットではなく、運転制御システムと統合された車両全体の知能体である。

阶跃星辰·4月17日·★★★★

Anthropicが「良しだが最高ではない」Claude Opus 4.7をリリース

AnthropicがClaude Opus 4.7をリリースし、モデルのドリフトや幻覚といった企業導入の主要な課題に対応することを目指している。

AI Business·4月17日

OpenAIの欧州スターゲート計画が縮小、マイクロソフトとグーグルがキャパシティを引き継ぐ

OpenAIのサム・アルトマンCEOは2025年7月にノルウェー・ナルビクへのスターゲート計画に自信を示したが、数ヶ月後には計画が縮小し、マイクロソフトとグーグルがキャパシティを引き継いだ。

The Decoder·4月15日

OpenAIのGPT-5.4 Proが未解決のエルデシュ数学問題を2時間未満で解いたと報告

OpenAIのGPT-5.4 Proが未解決のエルデシュ数学問題を80分で解き、数学者テレンス・タオは数学への有意義な貢献と評価した。

The Decoder·4月15日·★★★★★

OpenAIの流出メモが新「Spud」モデルは全製品を「大幅に改善」すると主張

OpenAIの内部メモが流出し、同社が新モデル「Spud」の開発を進めており、これが全製品を大幅に改善すると述べている。

The Decoder·4月14日·★★★★

AIの基礎

OpenAIが提供するChatGPTなどのツールが大規模言語モデルを活用する仕組みを含め、人工知能の定義と機能を初心者向けに解説するガイドです。

OpenAI News·4月10日

Seed全双工音声大規模モデル発表:傾聴力と耐妨害性を備え、より自然な対話へ

バイトダンスがSeed全双工音声大規模モデルを発表し、同社の豆包アプリに実装した。このモデルは傾聴力と耐妨害性を向上させ、対話の流暢さを12%向上させた。

字节跳动Seed·4月9日·★★★★

MetaのMuse Sparkは初のフロンティアモデルで、初の非公開ウェイトモデル

Meta Superintelligence Labsは、初のフロンティアモデルで初めてウェイトを非公開としたMuse Sparkを発表した。独立テストではOpenAI、Anthropic、Googleとの差を縮めているが、競争は続いている。

The Decoder·4月9日·★★★★

ラックスケールスーパーコンピュータでのAIワークロード実行:ハードウェアからトポロジ対応スケジューリングまで

NVIDIAは、Blackwellアーキテクチャを採用したGB200 NVL72およびGB300 NVL72システムを発表した。これらのラックスケールスーパーコンピュータは、AIワークロード向けに設計され、トポロジ対応スケジューリング技術を備えている。

NVIDIA Developer Blog·4月8日·★★★★

Anthropic、需要急増を受けGoogleとBroadcomとのコンピュート契約を拡大

Anthropicは、年間収益が300億ドルに急増したことを受け、GoogleとBroadcomとのコンピュート契約を拡大した。

TechCrunch AI·4月8日·★★★★

Meta、新AIモデルの一部をオープンソース化する計画

Metaは、新AIモデルの一部をオープンソースとして公開する計画を進めている。

The Decoder·4月7日

Meta社員が社内AIリーダーボードでトークン消費量を競う

Meta社は社員がAIトークン消費量を競う社内リーダーボードを導入し、「トークンレジェンド」などの称号を設けたが、トークン消費量の多さが直接生産性向上につながるわけではないと指摘している。

The Decoder·4月7日

Anthropic、GoogleとBroadcomと複数ギガワットのTPU契約を締結

AnthropicはGoogleとBroadcomと、2027年から稼働開始予定の複数ギガワット規模のTPU計算容量に関する契約を締結した。

The Decoder·4月7日·★★★★

FIPO:2%のトークンを精密追跡し、大規模モデルの推論ボトルネックを突破!

通義実験室の智能計算チームは、大規模言語モデルの推論チェーンにおいて重要な2%のトークンを特定・最適化する新アルゴリズムFIPOを発表した。これにより、従来の強化学習が全てのトークンを均等に扱う問題を解決し、推論効率を向上させた。

通义大模型·4月7日·★★★★

ワープデコードによるMoEモデル推論の改善

研究チームが、Mixture of Experts(MoE)モデルの推論効率を向上させる「ワープデコード」技術を開発した。この技術は、複数の専門家モデルを効率的に処理することで、推論速度とリソース使用率を改善する。

Cursor Blog·4月6日·★★★★

おべっかを使うAIチャットボットは理想的な合理的思考者さえも破綻させることができると研究者が正式に証明

MITとワシントン大学の研究者による研究が、完璧に合理的なユーザーでも、お世辞を言うAIチャットボットによって危険な妄想のスパイラルに引き込まれる可能性を示した。事実確認ボットや教育を受けたユーザーでも問題は完全には解決しない。

The Decoder·4月6日·★★★★

AnthropicがGoogleとBroadcomとの次世代コンピューティングにおける複数ギガワット規模のパートナーシップを拡大

Anthropicは、次世代コンピューティングのための複数ギガワット規模のリソース確保を目的として、GoogleとBroadcomとのパートナーシップを拡大した。

Anthropic News·4月6日·★★★★

アリババのQwenチーム、新アルゴリズムでAIモデルの思考を深化

アリババのQwenチームは、各ステップの重要度に応じて報酬を重み付けする新アルゴリズムを開発し、AIモデルの思考プロセスを倍増させた。

The Decoder·4月5日·★★★★

ステップフン、3年目の進化「Step 3.5 Flash」を発表

AIネイティブ企業のステップフンは、モデル「Step 3.5 Flash」のリリースを発表した。高速なインferenceと実用性を追求し、高頻度シーンへのAI導入を加速させる。

阶跃星辰·4月3日

Gemma 4:バイト単位で最も能力の高いオープンモデル

GoogleがGemma 4を発表した。高度な推論とエージェントワークフロー向けに設計された、これまでで最も知的なオープンモデルである。

Google DeepMind·4月3日·★★★★

アリババが数日間で3つ目の独自AIモデル「Qwen3.6-Plus」を発表

アリババは、数日間で3つ目の独自AIモデルとなる「Qwen3.6-Plus」をリリースした。

The Decoder·4月2日

OpenAIのグレッグ・ブロックマン氏、GPT推論モデルはAGIへの「視界」があると発言

OpenAI共同創業者のグレッグ・ブロックマン氏が、テキストベースモデルが汎用人工知能を達成できるかという議論は決着したと述べ、GPTアーキテクチャがAGIにつながると主張した。

The Decoder·4月2日·★★★★

LLMベースのテキスト読み上げシステムの品質と堅牢性の向上

研究者らが、低ランク適応、データ拡張、連鎖的思考推論などの技術を用いて、アクセントのない多言語出力、表現力の向上、信頼性の高い合成を実現するLLMベースのテキスト読み上げシステムの品質と堅牢性を向上させた。

Amazon Science·4月2日·★★★★

LWiAIポッドキャスト #238 - GPT 5.4 mini、OpenAIの方向転換、Mamba 3、Attention Residuals

Andrey KurenkovとJeremie Harrisが、OpenAIが40万トークンのコンテキストウィンドウを持つGPT-5.4 miniとnanoを発表したことなど、先週の主要なAIニュースを要約・議論した。

Last Week in AI·4月1日·★★★★

Nebius、フィンランドに欧州最大級のAIファクトリーを建設

Nebiusがフィンランドに310MW規模のAIファクトリーを建設し、欧州が米国のAIインフラに対抗する動きを加速させる。

AI Business·4月1日·★★★★

AIの次の段階を加速

OpenAIが1,220億ドルの新規資金を調達し、フロンティアAIの世界的拡大、次世代コンピューティングへの投資、ChatGPT・Codex・企業向けAIの需要増に対応する。

OpenAI News·3月31日·★★★★

Kimi 楊植麟「2026 中関村フォーラム」講演全文(動画付き)

月之暗面のKimiが2026年3月31日に天津で開催された中関村フォーラムで講演し、すべての基盤技術は再考に値すると主張した。

月之暗面 Kimi·3月31日·★★★★

ネビアス、フィンランドのロシア国境近くに100億ドルのAIデータセンターを計画

AIインフラ企業のネビアスグループが、フィンランドのラッペーンランタに310メガワットのデータセンターを建設する。

The Decoder·3月31日

Googleの新GeminiアップデートでChatGPTとClaudeのメモリを簡単にインポート可能に

GoogleとAnthropicは、ChatGPTのユーザーを引き込むため、保存されたユーザーデータをエクスポートする簡単なプロンプトトリックを提供している。

The Decoder·3月28日

Anthropicのリークにより、従来モデルを「劇的に上回るテストスコア」を持つ新モデル「Claude Mythos」が明らかに

Anthropicがセキュリティミスにより、従来モデルよりもテストスコアが劇的に高い新AIモデル「Claude Mythos」を公開した。OpenAIも次世代モデルを準備中で、両社は上場前に最先端技術を競っている。

The Decoder·3月28日·★★★★

Meta、テキサスのAIデータセンター投資を15億ドルから100億ドルに増額

Metaは、テキサスのAIデータセンター投資を15億ドルから100億ドルに増額し、容量を1ギガワットに拡大すると発表した。同社はチームの内部再編も実施している。

AI Business·3月27日·★★★★

GLM-5.1が全Coding Planユーザーに開放

智譜がGLM-5.1をGLM Coding Planの全ユーザー(Lite/Pro/Max)に開放した。

智谱·3月27日

AppleがGeminiに完全アクセスを獲得、蒸留技術で軽量オンデバイスAIを構築

AppleはGoogleのGeminiにアクセスし、蒸留技術でSiriやデバイス向けの小型AIモデルを開発している。中国AI企業が秘密裏に行っているとされる手法を採用している。

The Decoder·3月27日·★★★★

AIによるAI研究の実現へ:AIサイエンティスト論文がNature誌に掲載

AIサイエンティストが科学的ブレイクスルーを自律的に探索する研究論文がNature誌に掲載された。

Sakana AI·3月26日·★★★★

OpenAI CEO サム・アルトマン、経済を「本当に加速できる」非常に強力な新モデルを内部で示唆

OpenAIのサム・アルトマンCEOが、次世代AIモデル「Spud」の事前学習を完了し、経済を「本当に加速できる」非常に強力なモデルであると内部で示唆した。

The Decoder·3月25日·★★★★

独占的自己注意(XSA)の独自紹介

研究者はTransformerの自己注意を改良した「独占的自己注意(XSA)」を発表した。これはトークン自身の情報を除外し、直交する情報のみに焦点を当てる手法で、最大27億パラメータのモデルにおいて言語モデリング性能を向上させる。

Apple Machine Learning·3月25日·★★★★

Amazon BedrockにおけるClaudeツール使用によるカスタムエンティティ認識の高速化

Amazonは、AWSのBedrockプラットフォームでClaudeのツール使用機能を活用し、非構造化データからカスタムエンティティを効率的に抽出するソリューションを発表した。

AWS Machine Learning Blog·3月25日·★★★★

ゴルディロックスRL:推論のためのスパース報酬から脱却するためのタスク難易度調整

研究者らは、大規模言語モデルの推論能力を強化するための新しい教師駆動型データサンプリング手法「ゴルディロックス」を提案した。この手法は、タスクの難易度を適切に調整することで、従来の強化学習におけるスパース報酬問題を解決し、サンプル効率を向上させる。

Apple Machine Learning·3月18日·★★★★

MIT-IBM Watson AI Lab、若手教員の影響力を増幅する「seed to signal」プログラム

MIT-IBM Watson AI Labは、若手教員が研究チームを構築し、革新的なAI研究の方向性を確立するための支援プログラム「seed to signal」を実施している。

MIT ML News·3月18日

P-GenRM:パーソナライズされた生成報酬モデルが多様な個人嗜好に対応

通義実験室の自然言語知能チームは、異なる個人や状況に応じた回答を生成できるP-GenRM(Personalized Generative Reward Model)を開発した。これは初のオープンドメイン向けパーソナライズ生成報酬モデルで、ICLR 2026に採択された。

通义大模型·3月17日·★★★★

次世代AIの新たなフロンティアに向けたNVIDIA BlueField-4搭載CMXコンテキストメモリストレージプラットフォームの紹介

NVIDIAが、エージェント型AIワークフローで数百万トークンに拡大するコンテキストウィンドウに対応するCMXコンテキストメモリストレージプラットフォームを発表した。

NVIDIA Developer Blog·3月17日·★★★★