#大規模言語モデル のAIニュース

78件の記事

Gemma 4:バイト単位で最も能力の高いオープンモデル

GoogleがGemma 4を発表した。高度な推論とエージェントワークフロー向けに設計された、これまでで最も知的なオープンモデルである。

Google DeepMind·4月3日·★★★★

アリババが数日間で3つ目の独自AIモデル「Qwen3.6-Plus」を発表

アリババは、数日間で3つ目の独自AIモデルとなる「Qwen3.6-Plus」をリリースした。

The Decoder·4月2日

OpenAIのグレッグ・ブロックマン氏、GPT推論モデルはAGIへの「視界」があると発言

OpenAI共同創業者のグレッグ・ブロックマン氏が、テキストベースモデルが汎用人工知能を達成できるかという議論は決着したと述べ、GPTアーキテクチャがAGIにつながると主張した。

The Decoder·4月2日·★★★★

LLMベースのテキスト読み上げシステムの品質と堅牢性の向上

研究者らが、低ランク適応、データ拡張、連鎖的思考推論などの技術を用いて、アクセントのない多言語出力、表現力の向上、信頼性の高い合成を実現するLLMベースのテキスト読み上げシステムの品質と堅牢性を向上させた。

Amazon Science·4月2日·★★★★

Nebius、フィンランドに欧州最大級のAIファクトリーを建設

Nebiusがフィンランドに310MW規模のAIファクトリーを建設し、欧州が米国のAIインフラに対抗する動きを加速させる。

AI Business·4月1日·★★★★

AIの次の段階を加速

OpenAIが1,220億ドルの新規資金を調達し、フロンティアAIの世界的拡大、次世代コンピューティングへの投資、ChatGPT・Codex・企業向けAIの需要増に対応する。

OpenAI News·3月31日·★★★★

ネビアス、フィンランドのロシア国境近くに100億ドルのAIデータセンターを計画

AIインフラ企業のネビアスグループが、フィンランドのラッペーンランタに310メガワットのデータセンターを建設する。

The Decoder·3月31日

Gemini 3.1 Flash Live発表

Google AIがGemini 3.1 Flash Liveをリリースした週間まとめ

X: Google AI·3月28日

Googleの新GeminiアップデートでChatGPTとClaudeのメモリを簡単にインポート可能に

GoogleとAnthropicは、ChatGPTのユーザーを引き込むため、保存されたユーザーデータをエクスポートする簡単なプロンプトトリックを提供している。

The Decoder·3月28日

Anthropicのリークにより、従来モデルを「劇的に上回るテストスコア」を持つ新モデル「Claude Mythos」が明らかに

Anthropicがセキュリティミスにより、従来モデルよりもテストスコアが劇的に高い新AIモデル「Claude Mythos」を公開した。OpenAIも次世代モデルを準備中で、両社は上場前に最先端技術を競っている。

The Decoder·3月28日·★★★★

Meta、テキサスのAIデータセンター投資を15億ドルから100億ドルに増額

Metaは、テキサスのAIデータセンター投資を15億ドルから100億ドルに増額し、容量を1ギガワットに拡大すると発表した。同社はチームの内部再編も実施している。

AI Business·3月27日·★★★★

GLM-5.1が全Coding Planユーザーに開放

智譜がGLM-5.1をGLM Coding Planの全ユーザー(Lite/Pro/Max)に開放した。

智谱·3月27日

AppleがGeminiに完全アクセスを獲得、蒸留技術で軽量オンデバイスAIを構築

AppleはGoogleのGeminiにアクセスし、蒸留技術でSiriやデバイス向けの小型AIモデルを開発している。中国AI企業が秘密裏に行っているとされる手法を採用している。

The Decoder·3月27日·★★★★

OpenAI CEO サム・アルトマン、経済を「本当に加速できる」非常に強力な新モデルを内部で示唆

OpenAIのサム・アルトマンCEOが、次世代AIモデル「Spud」の事前学習を完了し、経済を「本当に加速できる」非常に強力なモデルであると内部で示唆した。

The Decoder·3月25日·★★★★

排他的自己注意機構

研究者らが、Transformerの性能を向上させる排他的自己注意機構(XSA)を提案した。XSAは、トークン自身の情報を除外し、文脈モデリングを改善する。最大27億パラメータのモデルで、標準的な言語モデリングタスクにおいて従来の自己注意機構を一貫して上回った。

Apple Machine Learning·3月25日·★★★★

Kimi 1TパラメータM4 Maxで動作

1兆パラメータのKimiモデルがM4 Maxで1.7トークン/秒で動作

X: Simon Willison·3月25日

Macで巨大MoEモデル実行可能

Macハードウェアで大規模なMixture-of-Expertsモデルを実行できる技術について

X: Simon Willison·3月24日·★★★★

NvidiaがNemotron-Cascade 2を公開

NvidiaがHugging Faceで新しいモデルNemotron-Cascade 2をリリース

X: AK·3月21日

ゴルディロックスRL:推論のためのスパース報酬から脱却するためのタスク難易度調整

研究者らは、大規模言語モデルの推論能力を強化するための新しい教師駆動型データサンプリング手法「ゴルディロックス」を提案した。この手法は、タスクの難易度を適切に調整することで、従来の強化学習におけるスパース報酬問題を解決し、サンプル効率を向上させる。

Apple Machine Learning·3月18日·★★★★

MIT-IBM Watson AI Lab、若手教員の影響力を増幅する「seed to signal」プログラム

MIT-IBM Watson AI Labは、若手教員が研究チームを構築し、革新的なAI研究の方向性を確立するための支援プログラム「seed to signal」を実施している。

MIT ML News·3月18日

P-GenRM:パーソナライズされた生成報酬モデルが多様な個人嗜好に対応

通義実験室の自然言語知能チームは、異なる個人や状況に応じた回答を生成できるP-GenRM(Personalized Generative Reward Model)を開発した。これは初のオープンドメイン向けパーソナライズ生成報酬モデルで、ICLR 2026に採択された。

通义大模型·3月17日·★★★★

次世代AIの新たなフロンティアに向けたNVIDIA BlueField-4搭載CMXコンテキストメモリストレージプラットフォームの紹介

NVIDIAが、エージェント型AIワークフローで数百万トークンに拡大するコンテキストウィンドウに対応するCMXコンテキストメモリストレージプラットフォームを発表した。

NVIDIA Developer Blog·3月17日·★★★★

NVIDIA Vera Rubin POD:7チップ、5つのラックスケールシステム、1つのAIスーパーコンピューター

NVIDIAは、7つのチップと5つのラックスケールシステムで構成される「Vera Rubin POD」AIスーパーコンピューターを発表した。同システムはトークン駆動型AI処理に最適化されており、急増するトークン消費需要に対応する高性能計算基盤を提供する。

NVIDIA Developer Blog·3月17日·★★★★

メタ、AI投資の費用相殺のため従業員の最大20%削減を計画と報道

メタは、6000億ドル規模のAI投資の費用を相殺するため、従業員の最大20%を削減する大規模なレイオフを計画していると報じられた。

The Decoder·3月14日·★★★★

GeminiモデルでGoogle Mapsを進化

Google Mapsの機能向上にGeminiモデルを活用する取り組みを紹介

X: Google AI·3月14日

GeminiモデルでGoogle Mapsを強化

GoogleがGeminiモデルをGoogle Mapsに統合、新機能を公開

X: Google AI·3月14日·★★★★

Claude 100万トークン対応

Claude Opus/Sonnet 4.6で100万トークン対応が一般提供開始

X: Claude·3月14日·★★★★

mAceReason-Math:RLVR対応の高品質多言語数学問題データセット

研究者らが、多言語数学問題の高品質データセット「mAceReason-Math」を公開した。このデータセットは、検証可能な報酬による強化学習(RLVR)の訓練用に設計されており、英語以外の言語での数学・論理問題解決能力の向上に貢献する。

Apple Machine Learning·3月13日·★★★★

Grok 4.20はGeminiとGPT-5.4に大きく遅れるが、幻覚を起こさない新記録を樹立

xAIのGrok 4.20は、ベンチマークではトップモデルに及ばないが、低コスト・高速で、他のモデルよりも幻覚を起こしにくい特徴を持つ。

The Decoder·3月13日

Metaの次世代AI向けカスタムシリコン進化

Metaが次世代AIスケーリングのためのカスタムシリコン進化を詳細に説明

X: AI at Meta·3月11日·★★★★

Wayfair、OpenAIを活用してカタログ精度とサポート速度を向上

WayfairはOpenAIのモデルを活用し、eコマースサポートの自動化と数百万の製品属性の精度向上を実現した。

OpenAI News·3月11日

GoogleがChromeにGeminiをインドで導入

GoogleがChromeブラウザにGemini AIをインドで展開し、ヒンディー語やベンガル語など複数のインド言語をサポートする。

TechCrunch AI·3月11日

トークンを流し続ける:16のオープンソースRLライブラリからの教訓

研究者が16のオープンソース強化学習ライブラリを分析し、効率的なトークン管理と学習安定化のための実践的な知見を共有した。

Hugging Face Blog·3月10日·★★★★

インドでAmazon Bedrock経由でAnthropic Claudeモデルにグローバルなクロスリージョン推論でアクセス可能に

Amazonが、インドの顧客がAmazon Bedrockを通じてAnthropicのClaudeモデルをグローバルなクロスリージョン推論で利用できるようにした。これにより、生成AIアプリケーションの大規模運用が容易になる。

AWS Machine Learning Blog·3月10日·★★★★

ユリシーズ・シーケンス並列処理:100万トークンのコンテキストでのトレーニング

研究者らが、ユリシーズ・シーケンス並列処理という手法を開発し、100万トークンの長いコンテキストで大規模言語モデルを効率的にトレーニングできるようにした。

Hugging Face Blog·3月9日·★★★★

ByteDanceのオープンウェイトHeliosモデル、1分間のAI動画生成をほぼリアルタイムに

ByteDanceの研究者が、単一GPUで19.5FPSを達成し1分間の動画クリップを生成できる140億パラメータの動画モデルHeliosを公開した。コードとウェイトは一般公開されている。

The Decoder·3月7日·★★★★

iPhoneでQwen 3.5実行可能

iPhoneアプリでQwen 3.5の4Bモデルが実行可能に。3.06GBのダウンロード。

X: Simon Willison·3月7日

CoT制御性評価スイート公開

OpenAIがChain-of-Thoughtの制御性に関する評価スイートと研究論文を公開

X: OpenAI·3月6日·★★★★

GPT-5.4 Windsurfで公開

GPT-5.4がWindsurfで利用可能に、複数推論機能搭載

X: Windsurf·3月6日

GPT-5.4発表

GPT-5.4とPro版の提供開始。ChatGPT、API、Codexで順次展開。

X: OpenAI·3月6日·★★★★

GPT-5.4発表

OpenAIがGPT-5.4を発表。事実性と効率性を向上

X: OpenAI·3月6日·★★★★

アリババのAI開発責任者が退社、主要チームメンバーも同行

アリババのAI開発責任者Junyang Linが突然退社し、Qwenチームの複数の主要メンバーも同行した。退社は内部組織再編が引き金となったと報じられている。

The Decoder·3月5日

GPT-5.4の紹介

OpenAIが、プロフェッショナル向けに最も高性能で効率的なフロンティアモデル「GPT-5.4」を発表した。最新のコーディング、コンピュータ使用、ツール検索機能と100万トークンのコンテキストを備えている。

OpenAI News·3月5日·★★★★

ペンタゴンとの対立にもかかわらず、Anthropicが200億ドルの年間収益規模に迫る

Bloombergによると、Anthropicは現在の業績に基づき年間約200億ドルの収益を生み出す軌道にある。

The Decoder·3月4日·★★★★

アリババのQwen技術リーダーが主要AI推進後に退任

アリババのQwenチームは、主要モデル発表後に技術リーダーのJunyang Linが退任したことで反響が広がった。

TechCrunch AI·3月4日

Gemini 3.1 Flash-Lite プレビュー開始

Google DeepMindがGemini 3.1 Flash-Liteのプレビュー提供を開始。

X: Google DeepMind·3月4日

Gemini 3.1 Flash-Lite発表

Google DeepMindがコスト効率重視の新モデルを発表

X: Google DeepMind·3月4日

NVIDIA NeMoを用いた自律ネットワーク向け通信事業者推論モデルの構築

NVIDIAが通信事業者向けに、自律ネットワークを実現する推論モデルをNeMoフレームワークで構築する取り組みを発表した。

NVIDIA Developer Blog·3月1日·★★★★

ChatGPTの週間アクティブユーザー数が9億人に到達

OpenAIが、1,100億ドルの私募資金調達を発表し、ChatGPTの週間アクティブユーザー数が9億人に達したことを明らかにした。

TechCrunch AI·2月28日·★★★★

NVIDIA GPUアクセラレーテッドエンドポイントを使用したQwen3.5 VLMによるネイティブマルチモーダルエージェントの開発

Alibabaが約4000億パラメータのネイティブマルチモーダルエージェント向けに設計されたオープンソースQwen3.5シリーズを発表した。

NVIDIA Developer Blog·2月28日·★★★★