#大規模言語モデル のAIニュース
105件の記事
Anthropic の輸出規制継続を受け、アジアの AI スタートアップが Mythos に似たモデルを公開
Anthropic による輸出規制の影響が続く中、複数のアジア地域に拠点を置く AI スタートアップが、同社の Mythos モデルに匹敵する性能を持つ新しい大規模言語モデルを発表した。
OpenAI、Broadcom 製初の独自チップを発表
OpenAI が Broadcom と共同開発した自社初の専用チップを公開し、AI 計算能力の向上を目指す。
ミストラル、今夏に新モデルを発表予定(2 分読了)
AI 企業ミストラルが、今年夏に新たな大規模言語モデルの発表を計画していることを明らかにした。
債券発行直後のアマゾン、AI 支出の継続に伴い銀行から 175 億ドルを借り入れ
Amazon は AI 関連支出が継続しているため、債券販売の直後に銀行から 175 億ドルの借入を行った。
もはや FAANG ではない。MANGOS の時代だ
TechCrunch AI は、現在のテクノロジー業界を支配する企業群が従来の FAANG から MANGOS(Meta, Amazon, Netflix, Google, Oracle, Salesforce)へと変化したと指摘している。
OpenAI、IPO申請を提出しAnthropicに続く
OpenAIは米国証券取引委員会へ非公開で株式上場届出書を提出し、競合のAnthropicに続いてIPO実現に向けた重要な一歩を踏み出した。
メタ、テスラから手法を借用しテント型データセンターを建設
メタはテスラの手法を参考に、仮設のテント型施設にデータセンターを構築する計画を発表した。これにより設備コスト削減と設置速度の向上を目指す。
アルファベット、AI 構築資金として 800 億ドルの調達を計画
アルファベットは AI インフラの構築費用に充てるため、最大 800 億ドルの資金調達を検討している。
Anthropic が正式に株式公開を申請
AI 企業 Anthropic は、米証券取引委員会(SEC)に対して株式公開(IPO)の申請書を提出し、市場への上場プロセスを開始した。これは OpenAI との競合において先手を打つ重要なマイルストーンである。
教皇は AGI に夢中ではない
レオ14世教皇が AI の社会的影響を論じた回勅「Magnifica Humanitas」を発表し、AI の利用は技術問題ではなく人権や自由に関わるものだと警告した。
Grokが苦戦する中、SpaceXはAI分野でのビッグテック凌駕に賭ける
イーロン・マスク率いるスペースXは、同社の将来の柱として人工知能(AI)を位置づけ、全米経済活動全体に匹敵する兆ドル規模の市場機会を見込んでいます。しかし、顧客がOpenAIやAnthropicなどの競合他社モデルを好む現状を克服する必要があります。
メタ、AI 投資の負担軽減のため数千名の従業員を解雇
メタは膨大な AI 投資への対応として、経営効率化の一環として数千人の従業員に解雇通知を出した。
基盤モデルのスケーリングに関する詳細解説(読了時間:34 分)
本記事は、AI 研究コミュニティが基盤モデルの性能向上においてスケーリング則が果たす役割を分析し、計算資源とデータ量の増加がモデル能力に与える影響について詳述している。
AutoSP の紹介:長文コンテキスト LLM 学習を自動化する新技術
DeepSpeed と統合された AutoSP は、標準的なトランスフォーマー学習コードをシーケンス並列化コードへ自動変換し、複数の GPU で実行オーバーヘッドを抑えながら長いシーケンスの学習を可能にする。また、高度な活性化チェックポイント戦略によりメモリ管理が向上する。
NVIDIA のマルチモーダル AI モデル「Nemotron 3 Nano Omni」が Amazon SageMaker JumpStart で利用可能に
NVIDIA は、動画・音声・画像・テキストを単一アーキテクチャで処理する新モデル「Nemotron 3 Nano Omni」を、Amazon SageMaker JumpStart で即日公開した。これにより企業は、複数の情報を一度に推論して知能の高いアプリケーションを構築できるようになる。
GPT-5.5はベンチマークで最高スコアを記録するも頻繁に幻覚が発生し、API利用料は20%値上げ
OpenAIのGPT-5.5はベンチマークで首位を記録するも、頻繁に幻覚(誤回答)が発生し、API利用料は前モデル比20%以上値上げされている。
GPT-5.5システムカード
OpenAIはGPT-5.5の性能基準、安全性対策、使用制限を網羅した技術文書「システムカード」を公開し、モデルの運用ガイドラインを示している。
Hy3プレビュー版を公開・オープンソース化:混元再構築後の初モデル、エージェント能力が大幅に向上
腾讯は2026年4月、混元Hy3プレビュー版を公開・オープンソース化した。総パラメータ295B、アクティブ21Bの混合専門家モデルで、高速・低速思考を融合しエージェント能力を大幅に向上させた。
Cursor、SpaceXとモデル訓練でパートナーシップを締結
Cursor社はSpaceX社と提携し、大規模AIモデルの訓練・学習技術を開発する。両社は計算資源とデータを活用し、コード生成AIの精度向上を目指す。
Kimi K2.6をリリースおよびオープンソース化し、コードとエージェントクラスタ能力を全面的に強化
Kimi開発チームはAIモデル「K2.6」をリリースしオープンソース化した。同モデルはコード処理能力とエージェントクラスタの運用性能を大幅に強化した。
AIチップスタートアップCerebrasがIPO申請
AIチップスタートアップのCerebrasがIPOを申請した。同社は最近、Amazon Web Servicesとのデータセンター向けチップ使用契約や、OpenAIとの100億ドル超の契約を発表している。
ザッカーバーグ、AIインフラ資金調達のため従業員10%削減を準備
MetaはAIインフラへの巨額投資を賄うため、5月20日に約8,000人、年内にさらに追加で合計20%以上の従業員削減を計画している。
極氪8Xに乗り込み、階躍大モデルを体感する
階躍星辰は、極氪8Xの量産開始に合わせ、大規模言語モデル「Step 3.5 Flash」を中核とする車載AI「超級Eva」を搭載した。これは単なるチャットボットではなく、運転制御システムと統合された車両全体の知能体である。
Anthropicが「良しだが最高ではない」Claude Opus 4.7をリリース
AnthropicがClaude Opus 4.7をリリースし、モデルのドリフトや幻覚といった企業導入の主要な課題に対応することを目指している。
OpenAIの欧州スターゲート計画が縮小、マイクロソフトとグーグルがキャパシティを引き継ぐ
OpenAIのサム・アルトマンCEOは2025年7月にノルウェー・ナルビクへのスターゲート計画に自信を示したが、数ヶ月後には計画が縮小し、マイクロソフトとグーグルがキャパシティを引き継いだ。
OpenAIのGPT-5.4 Proが未解決のエルデシュ数学問題を2時間未満で解いたと報告
OpenAIのGPT-5.4 Proが未解決のエルデシュ数学問題を80分で解き、数学者テレンス・タオは数学への有意義な貢献と評価した。
OpenAIの流出メモが新「Spud」モデルは全製品を「大幅に改善」すると主張
OpenAIの内部メモが流出し、同社が新モデル「Spud」の開発を進めており、これが全製品を大幅に改善すると述べている。
AIの基礎
OpenAIが提供するChatGPTなどのツールが大規模言語モデルを活用する仕組みを含め、人工知能の定義と機能を初心者向けに解説するガイドです。
Seed全双工音声大規模モデル発表:傾聴力と耐妨害性を備え、より自然な対話へ
バイトダンスがSeed全双工音声大規模モデルを発表し、同社の豆包アプリに実装した。このモデルは傾聴力と耐妨害性を向上させ、対話の流暢さを12%向上させた。
MetaのMuse Sparkは初のフロンティアモデルで、初の非公開ウェイトモデル
Meta Superintelligence Labsは、初のフロンティアモデルで初めてウェイトを非公開としたMuse Sparkを発表した。独立テストではOpenAI、Anthropic、Googleとの差を縮めているが、競争は続いている。
ラックスケールスーパーコンピュータでのAIワークロード実行:ハードウェアからトポロジ対応スケジューリングまで
NVIDIAは、Blackwellアーキテクチャを採用したGB200 NVL72およびGB300 NVL72システムを発表した。これらのラックスケールスーパーコンピュータは、AIワークロード向けに設計され、トポロジ対応スケジューリング技術を備えている。
Anthropic、需要急増を受けGoogleとBroadcomとのコンピュート契約を拡大
Anthropicは、年間収益が300億ドルに急増したことを受け、GoogleとBroadcomとのコンピュート契約を拡大した。
Meta、新AIモデルの一部をオープンソース化する計画
Metaは、新AIモデルの一部をオープンソースとして公開する計画を進めている。
Meta社員が社内AIリーダーボードでトークン消費量を競う
Meta社は社員がAIトークン消費量を競う社内リーダーボードを導入し、「トークンレジェンド」などの称号を設けたが、トークン消費量の多さが直接生産性向上につながるわけではないと指摘している。
Anthropic、GoogleとBroadcomと複数ギガワットのTPU契約を締結
AnthropicはGoogleとBroadcomと、2027年から稼働開始予定の複数ギガワット規模のTPU計算容量に関する契約を締結した。
FIPO:2%のトークンを精密追跡し、大規模モデルの推論ボトルネックを突破!
通義実験室の智能計算チームは、大規模言語モデルの推論チェーンにおいて重要な2%のトークンを特定・最適化する新アルゴリズムFIPOを発表した。これにより、従来の強化学習が全てのトークンを均等に扱う問題を解決し、推論効率を向上させた。
ワープデコードによるMoEモデル推論の改善
研究チームが、Mixture of Experts(MoE)モデルの推論効率を向上させる「ワープデコード」技術を開発した。この技術は、複数の専門家モデルを効率的に処理することで、推論速度とリソース使用率を改善する。
おべっかを使うAIチャットボットは理想的な合理的思考者さえも破綻させることができると研究者が正式に証明
MITとワシントン大学の研究者による研究が、完璧に合理的なユーザーでも、お世辞を言うAIチャットボットによって危険な妄想のスパイラルに引き込まれる可能性を示した。事実確認ボットや教育を受けたユーザーでも問題は完全には解決しない。
AnthropicがGoogleとBroadcomとの次世代コンピューティングにおける複数ギガワット規模のパートナーシップを拡大
Anthropicは、次世代コンピューティングのための複数ギガワット規模のリソース確保を目的として、GoogleとBroadcomとのパートナーシップを拡大した。
アリババのQwenチーム、新アルゴリズムでAIモデルの思考を深化
アリババのQwenチームは、各ステップの重要度に応じて報酬を重み付けする新アルゴリズムを開発し、AIモデルの思考プロセスを倍増させた。
ステップフン、3年目の進化「Step 3.5 Flash」を発表
AIネイティブ企業のステップフンは、モデル「Step 3.5 Flash」のリリースを発表した。高速なインferenceと実用性を追求し、高頻度シーンへのAI導入を加速させる。
Gemma 4:バイト単位で最も能力の高いオープンモデル
GoogleがGemma 4を発表した。高度な推論とエージェントワークフロー向けに設計された、これまでで最も知的なオープンモデルである。
アリババが数日間で3つ目の独自AIモデル「Qwen3.6-Plus」を発表
アリババは、数日間で3つ目の独自AIモデルとなる「Qwen3.6-Plus」をリリースした。
OpenAIのグレッグ・ブロックマン氏、GPT推論モデルはAGIへの「視界」があると発言
OpenAI共同創業者のグレッグ・ブロックマン氏が、テキストベースモデルが汎用人工知能を達成できるかという議論は決着したと述べ、GPTアーキテクチャがAGIにつながると主張した。
LLMベースのテキスト読み上げシステムの品質と堅牢性の向上
研究者らが、低ランク適応、データ拡張、連鎖的思考推論などの技術を用いて、アクセントのない多言語出力、表現力の向上、信頼性の高い合成を実現するLLMベースのテキスト読み上げシステムの品質と堅牢性を向上させた。
LWiAIポッドキャスト #238 - GPT 5.4 mini、OpenAIの方向転換、Mamba 3、Attention Residuals
Andrey KurenkovとJeremie Harrisが、OpenAIが40万トークンのコンテキストウィンドウを持つGPT-5.4 miniとnanoを発表したことなど、先週の主要なAIニュースを要約・議論した。
Nebius、フィンランドに欧州最大級のAIファクトリーを建設
Nebiusがフィンランドに310MW規模のAIファクトリーを建設し、欧州が米国のAIインフラに対抗する動きを加速させる。
AIの次の段階を加速
OpenAIが1,220億ドルの新規資金を調達し、フロンティアAIの世界的拡大、次世代コンピューティングへの投資、ChatGPT・Codex・企業向けAIの需要増に対応する。
Kimi 楊植麟「2026 中関村フォーラム」講演全文(動画付き)
月之暗面のKimiが2026年3月31日に天津で開催された中関村フォーラムで講演し、すべての基盤技術は再考に値すると主張した。
ネビアス、フィンランドのロシア国境近くに100億ドルのAIデータセンターを計画
AIインフラ企業のネビアスグループが、フィンランドのラッペーンランタに310メガワットのデータセンターを建設する。