#大規模言語モデルのAIニュース

105件の記事

Anthropic の輸出規制継続を受け、アジアの AI スタートアップが Mythos に似たモデルを公開

Anthropic による輸出規制の影響が続く中、複数のアジア地域に拠点を置く AI スタートアップが、同社の Mythos モデルに匹敵する性能を持つ新しい大規模言語モデルを発表した。

TechCrunch AI·6月27日·★★★★

OpenAI、Broadcom 製初の独自チップを発表

OpenAI が Broadcom と共同開発した自社初の専用チップを公開し、AI 計算能力の向上を目指す。

TechCrunch AI·6月24日·★★★★

ミストラル、今夏に新モデルを発表予定（2 分読了）

AI 企業ミストラルが、今年夏に新たな大規模言語モデルの発表を計画していることを明らかにした。

TLDR AI·6月18日

債券発行直後のアマゾン、AI 支出の継続に伴い銀行から 175 億ドルを借り入れ

Amazon は AI 関連支出が継続しているため、債券販売の直後に銀行から 175 億ドルの借入を行った。

TechCrunch AI·6月11日

もはや FAANG ではない。MANGOS の時代だ

TechCrunch AI は、現在のテクノロジー業界を支配する企業群が従来の FAANG から MANGOS（Meta, Amazon, Netflix, Google, Oracle, Salesforce）へと変化したと指摘している。

TechCrunch AI·6月10日·★★★★

OpenAI、IPO申請を提出しAnthropicに続く

OpenAIは米国証券取引委員会へ非公開で株式上場届出書を提出し、競合のAnthropicに続いてIPO実現に向けた重要な一歩を踏み出した。

The Verge AI·6月9日·★★★★

メタ、テスラから手法を借用しテント型データセンターを建設

メタはテスラの手法を参考に、仮設のテント型施設にデータセンターを構築する計画を発表した。これにより設備コスト削減と設置速度の向上を目指す。

TechCrunch AI·6月5日·★★★★

アルファベット、AI 構築資金として 800 億ドルの調達を計画

アルファベットは AI インフラの構築費用に充てるため、最大 800 億ドルの資金調達を検討している。

TechCrunch AI·6月2日·★★★★

Anthropic が正式に株式公開を申請

AI 企業 Anthropic は、米証券取引委員会（SEC）に対して株式公開（IPO）の申請書を提出し、市場への上場プロセスを開始した。これは OpenAI との競合において先手を打つ重要なマイルストーンである。

The Verge AI·6月2日·★★★★★

教皇は AGI に夢中ではない

レオ14世教皇が AI の社会的影響を論じた回勅「Magnifica Humanitas」を発表し、AI の利用は技術問題ではなく人権や自由に関わるものだと警告した。

The Verge AI·5月27日·★★★★

Grokが苦戦する中、SpaceXはAI分野でのビッグテック凌駕に賭ける

イーロン・マスク率いるスペースXは、同社の将来の柱として人工知能（AI）を位置づけ、全米経済活動全体に匹敵する兆ドル規模の市場機会を見込んでいます。しかし、顧客がOpenAIやAnthropicなどの競合他社モデルを好む現状を克服する必要があります。

Ars Technica AI·5月22日·★★★★

メタ、AI 投資の負担軽減のため数千名の従業員を解雇

メタは膨大な AI 投資への対応として、経営効率化の一環として数千人の従業員に解雇通知を出した。

The Verge AI·5月21日·★★★★

基盤モデルのスケーリングに関する詳細解説（読了時間：34 分）

本記事は、AI 研究コミュニティが基盤モデルの性能向上においてスケーリング則が果たす役割を分析し、計算資源とデータ量の増加がモデル能力に与える影響について詳述している。

TLDR AI·5月12日

AutoSP の紹介：長文コンテキスト LLM 学習を自動化する新技術

DeepSpeed と統合された AutoSP は、標準的なトランスフォーマー学習コードをシーケンス並列化コードへ自動変換し、複数の GPU で実行オーバーヘッドを抑えながら長いシーケンスの学習を可能にする。また、高度な活性化チェックポイント戦略によりメモリ管理が向上する。

TLDR AI·4月30日·★★★★

NVIDIA のマルチモーダル AI モデル「Nemotron 3 Nano Omni」が Amazon SageMaker JumpStart で利用可能に

NVIDIA は、動画・音声・画像・テキストを単一アーキテクチャで処理する新モデル「Nemotron 3 Nano Omni」を、Amazon SageMaker JumpStart で即日公開した。これにより企業は、複数の情報を一度に推論して知能の高いアプリケーションを構築できるようになる。

AWS Machine Learning Blog·4月29日·★★★★

GPT-5.5はベンチマークで最高スコアを記録するも頻繁に幻覚が発生し、API利用料は20%値上げ

OpenAIのGPT-5.5はベンチマークで首位を記録するも、頻繁に幻覚（誤回答）が発生し、API利用料は前モデル比20%以上値上げされている。

The Decoder·4月25日·★★★★

GPT-5.5システムカード

OpenAIはGPT-5.5の性能基準、安全性対策、使用制限を網羅した技術文書「システムカード」を公開し、モデルの運用ガイドラインを示している。

OpenAI News·4月23日·★★★★

Hy3プレビュー版を公開・オープンソース化：混元再構築後の初モデル、エージェント能力が大幅に向上

腾讯は2026年4月、混元Hy3プレビュー版を公開・オープンソース化した。総パラメータ295B、アクティブ21Bの混合専門家モデルで、高速・低速思考を融合しエージェント能力を大幅に向上させた。

腾讯混元·4月23日·★★★★

Cursor、SpaceXとモデル訓練でパートナーシップを締結

Cursor社はSpaceX社と提携し、大規模AIモデルの訓練・学習技術を開発する。両社は計算資源とデータを活用し、コード生成AIの精度向上を目指す。

Cursor Blog·4月22日

Kimi K2.6をリリースおよびオープンソース化し、コードとエージェントクラスタ能力を全面的に強化

Kimi開発チームはAIモデル「K2.6」をリリースしオープンソース化した。同モデルはコード処理能力とエージェントクラスタの運用性能を大幅に強化した。

月之暗面 Kimi·4月21日·★★★★

AIチップスタートアップCerebrasがIPO申請

AIチップスタートアップのCerebrasがIPOを申請した。同社は最近、Amazon Web Servicesとのデータセンター向けチップ使用契約や、OpenAIとの100億ドル超の契約を発表している。

TechCrunch AI·4月19日·★★★★

ザッカーバーグ、AIインフラ資金調達のため従業員10％削減を準備

MetaはAIインフラへの巨額投資を賄うため、5月20日に約8,000人、年内にさらに追加で合計20％以上の従業員削減を計画している。

The Decoder·4月18日·★★★★

極氪8Xに乗り込み、階躍大モデルを体感する

階躍星辰は、極氪8Xの量産開始に合わせ、大規模言語モデル「Step 3.5 Flash」を中核とする車載AI「超級Eva」を搭載した。これは単なるチャットボットではなく、運転制御システムと統合された車両全体の知能体である。

阶跃星辰·4月17日·★★★★

Anthropicが「良しだが最高ではない」Claude Opus 4.7をリリース

AnthropicがClaude Opus 4.7をリリースし、モデルのドリフトや幻覚といった企業導入の主要な課題に対応することを目指している。

AI Business·4月17日

OpenAIの欧州スターゲート計画が縮小、マイクロソフトとグーグルがキャパシティを引き継ぐ

OpenAIのサム・アルトマンCEOは2025年7月にノルウェー・ナルビクへのスターゲート計画に自信を示したが、数ヶ月後には計画が縮小し、マイクロソフトとグーグルがキャパシティを引き継いだ。

The Decoder·4月15日

OpenAIのGPT-5.4 Proが未解決のエルデシュ数学問題を2時間未満で解いたと報告

OpenAIのGPT-5.4 Proが未解決のエルデシュ数学問題を80分で解き、数学者テレンス・タオは数学への有意義な貢献と評価した。

The Decoder·4月15日·★★★★★

OpenAIの流出メモが新「Spud」モデルは全製品を「大幅に改善」すると主張

OpenAIの内部メモが流出し、同社が新モデル「Spud」の開発を進めており、これが全製品を大幅に改善すると述べている。

The Decoder·4月14日·★★★★

AIの基礎

OpenAIが提供するChatGPTなどのツールが大規模言語モデルを活用する仕組みを含め、人工知能の定義と機能を初心者向けに解説するガイドです。

OpenAI News·4月10日

Seed全双工音声大規模モデル発表：傾聴力と耐妨害性を備え、より自然な対話へ

バイトダンスがSeed全双工音声大規模モデルを発表し、同社の豆包アプリに実装した。このモデルは傾聴力と耐妨害性を向上させ、対話の流暢さを12%向上させた。

字节跳动Seed·4月9日·★★★★

MetaのMuse Sparkは初のフロンティアモデルで、初の非公開ウェイトモデル

Meta Superintelligence Labsは、初のフロンティアモデルで初めてウェイトを非公開としたMuse Sparkを発表した。独立テストではOpenAI、Anthropic、Googleとの差を縮めているが、競争は続いている。

The Decoder·4月9日·★★★★

ラックスケールスーパーコンピュータでのAIワークロード実行：ハードウェアからトポロジ対応スケジューリングまで

NVIDIAは、Blackwellアーキテクチャを採用したGB200 NVL72およびGB300 NVL72システムを発表した。これらのラックスケールスーパーコンピュータは、AIワークロード向けに設計され、トポロジ対応スケジューリング技術を備えている。

NVIDIA Developer Blog·4月8日·★★★★

Anthropic、需要急増を受けGoogleとBroadcomとのコンピュート契約を拡大

Anthropicは、年間収益が300億ドルに急増したことを受け、GoogleとBroadcomとのコンピュート契約を拡大した。

TechCrunch AI·4月8日·★★★★

Meta、新AIモデルの一部をオープンソース化する計画

Metaは、新AIモデルの一部をオープンソースとして公開する計画を進めている。

The Decoder·4月7日

Meta社員が社内AIリーダーボードでトークン消費量を競う

Meta社は社員がAIトークン消費量を競う社内リーダーボードを導入し、「トークンレジェンド」などの称号を設けたが、トークン消費量の多さが直接生産性向上につながるわけではないと指摘している。

The Decoder·4月7日

Anthropic、GoogleとBroadcomと複数ギガワットのTPU契約を締結

AnthropicはGoogleとBroadcomと、2027年から稼働開始予定の複数ギガワット規模のTPU計算容量に関する契約を締結した。

The Decoder·4月7日·★★★★

FIPO：2%のトークンを精密追跡し、大規模モデルの推論ボトルネックを突破！

通義実験室の智能計算チームは、大規模言語モデルの推論チェーンにおいて重要な2%のトークンを特定・最適化する新アルゴリズムFIPOを発表した。これにより、従来の強化学習が全てのトークンを均等に扱う問題を解決し、推論効率を向上させた。

通义大模型·4月7日·★★★★

ワープデコードによるMoEモデル推論の改善

研究チームが、Mixture of Experts（MoE）モデルの推論効率を向上させる「ワープデコード」技術を開発した。この技術は、複数の専門家モデルを効率的に処理することで、推論速度とリソース使用率を改善する。

Cursor Blog·4月6日·★★★★

おべっかを使うAIチャットボットは理想的な合理的思考者さえも破綻させることができると研究者が正式に証明

MITとワシントン大学の研究者による研究が、完璧に合理的なユーザーでも、お世辞を言うAIチャットボットによって危険な妄想のスパイラルに引き込まれる可能性を示した。事実確認ボットや教育を受けたユーザーでも問題は完全には解決しない。

The Decoder·4月6日·★★★★

AnthropicがGoogleとBroadcomとの次世代コンピューティングにおける複数ギガワット規模のパートナーシップを拡大

Anthropicは、次世代コンピューティングのための複数ギガワット規模のリソース確保を目的として、GoogleとBroadcomとのパートナーシップを拡大した。

Anthropic News·4月6日·★★★★

アリババのQwenチーム、新アルゴリズムでAIモデルの思考を深化

アリババのQwenチームは、各ステップの重要度に応じて報酬を重み付けする新アルゴリズムを開発し、AIモデルの思考プロセスを倍増させた。

The Decoder·4月5日·★★★★

ステップフン、3年目の進化「Step 3.5 Flash」を発表

AIネイティブ企業のステップフンは、モデル「Step 3.5 Flash」のリリースを発表した。高速なインferenceと実用性を追求し、高頻度シーンへのAI導入を加速させる。

阶跃星辰·4月3日

Gemma 4：バイト単位で最も能力の高いオープンモデル

GoogleがGemma 4を発表した。高度な推論とエージェントワークフロー向けに設計された、これまでで最も知的なオープンモデルである。

Google DeepMind·4月3日·★★★★

アリババが数日間で3つ目の独自AIモデル「Qwen3.6-Plus」を発表

アリババは、数日間で3つ目の独自AIモデルとなる「Qwen3.6-Plus」をリリースした。

The Decoder·4月2日

OpenAIのグレッグ・ブロックマン氏、GPT推論モデルはAGIへの「視界」があると発言

OpenAI共同創業者のグレッグ・ブロックマン氏が、テキストベースモデルが汎用人工知能を達成できるかという議論は決着したと述べ、GPTアーキテクチャがAGIにつながると主張した。

The Decoder·4月2日·★★★★

LLMベースのテキスト読み上げシステムの品質と堅牢性の向上

研究者らが、低ランク適応、データ拡張、連鎖的思考推論などの技術を用いて、アクセントのない多言語出力、表現力の向上、信頼性の高い合成を実現するLLMベースのテキスト読み上げシステムの品質と堅牢性を向上させた。

Amazon Science·4月2日·★★★★

LWiAIポッドキャスト #238 - GPT 5.4 mini、OpenAIの方向転換、Mamba 3、Attention Residuals

Andrey KurenkovとJeremie Harrisが、OpenAIが40万トークンのコンテキストウィンドウを持つGPT-5.4 miniとnanoを発表したことなど、先週の主要なAIニュースを要約・議論した。

Last Week in AI·4月1日·★★★★

Nebius、フィンランドに欧州最大級のAIファクトリーを建設

Nebiusがフィンランドに310MW規模のAIファクトリーを建設し、欧州が米国のAIインフラに対抗する動きを加速させる。

AI Business·4月1日·★★★★

AIの次の段階を加速

OpenAIが1,220億ドルの新規資金を調達し、フロンティアAIの世界的拡大、次世代コンピューティングへの投資、ChatGPT・Codex・企業向けAIの需要増に対応する。

OpenAI News·3月31日·★★★★

Kimi 楊植麟「2026 中関村フォーラム」講演全文（動画付き）

月之暗面のKimiが2026年3月31日に天津で開催された中関村フォーラムで講演し、すべての基盤技術は再考に値すると主張した。

月之暗面 Kimi·3月31日·★★★★

ネビアス、フィンランドのロシア国境近くに100億ドルのAIデータセンターを計画

AIインフラ企業のネビアスグループが、フィンランドのラッペーンランタに310メガワットのデータセンターを建設する。

The Decoder·3月31日

1 / 3次へ →

#大規模言語モデル のAIニュース