#大規模言語モデル のAIニュース
77件の記事
アリババが数日間で3つ目の独自AIモデル「Qwen3.6-Plus」を発表
アリババは、数日間で3つ目の独自AIモデルとなる「Qwen3.6-Plus」をリリースした。
OpenAIのグレッグ・ブロックマン氏、GPT推論モデルはAGIへの「視界」があると発言
OpenAI共同創業者のグレッグ・ブロックマン氏が、テキストベースモデルが汎用人工知能を達成できるかという議論は決着したと述べ、GPTアーキテクチャがAGIにつながると主張した。
LLMベースのテキスト読み上げシステムの品質と堅牢性の向上
研究者らが、低ランク適応、データ拡張、連鎖的思考推論などの技術を用いて、アクセントのない多言語出力、表現力の向上、信頼性の高い合成を実現するLLMベースのテキスト読み上げシステムの品質と堅牢性を向上させた。
Nebius、フィンランドに欧州最大級のAIファクトリーを建設
Nebiusがフィンランドに310MW規模のAIファクトリーを建設し、欧州が米国のAIインフラに対抗する動きを加速させる。
AIの次の段階を加速
OpenAIが1,220億ドルの新規資金を調達し、フロンティアAIの世界的拡大、次世代コンピューティングへの投資、ChatGPT・Codex・企業向けAIの需要増に対応する。
ネビアス、フィンランドのロシア国境近くに100億ドルのAIデータセンターを計画
AIインフラ企業のネビアスグループが、フィンランドのラッペーンランタに310メガワットのデータセンターを建設する。
Gemini 3.1 Flash Live発表
Google AIがGemini 3.1 Flash Liveをリリースした週間まとめ
Googleの新GeminiアップデートでChatGPTとClaudeのメモリを簡単にインポート可能に
GoogleとAnthropicは、ChatGPTのユーザーを引き込むため、保存されたユーザーデータをエクスポートする簡単なプロンプトトリックを提供している。
Anthropicのリークにより、従来モデルを「劇的に上回るテストスコア」を持つ新モデル「Claude Mythos」が明らかに
Anthropicがセキュリティミスにより、従来モデルよりもテストスコアが劇的に高い新AIモデル「Claude Mythos」を公開した。OpenAIも次世代モデルを準備中で、両社は上場前に最先端技術を競っている。
Meta、テキサスのAIデータセンター投資を15億ドルから100億ドルに増額
Metaは、テキサスのAIデータセンター投資を15億ドルから100億ドルに増額し、容量を1ギガワットに拡大すると発表した。同社はチームの内部再編も実施している。
GLM-5.1が全Coding Planユーザーに開放
智譜がGLM-5.1をGLM Coding Planの全ユーザー(Lite/Pro/Max)に開放した。
AppleがGeminiに完全アクセスを獲得、蒸留技術で軽量オンデバイスAIを構築
AppleはGoogleのGeminiにアクセスし、蒸留技術でSiriやデバイス向けの小型AIモデルを開発している。中国AI企業が秘密裏に行っているとされる手法を採用している。
OpenAI CEO サム・アルトマン、経済を「本当に加速できる」非常に強力な新モデルを内部で示唆
OpenAIのサム・アルトマンCEOが、次世代AIモデル「Spud」の事前学習を完了し、経済を「本当に加速できる」非常に強力なモデルであると内部で示唆した。
排他的自己注意機構
研究者らが、Transformerの性能を向上させる排他的自己注意機構(XSA)を提案した。XSAは、トークン自身の情報を除外し、文脈モデリングを改善する。最大27億パラメータのモデルで、標準的な言語モデリングタスクにおいて従来の自己注意機構を一貫して上回った。
Kimi 1TパラメータM4 Maxで動作
1兆パラメータのKimiモデルがM4 Maxで1.7トークン/秒で動作
Macで巨大MoEモデル実行可能
Macハードウェアで大規模なMixture-of-Expertsモデルを実行できる技術について
NvidiaがNemotron-Cascade 2を公開
NvidiaがHugging Faceで新しいモデルNemotron-Cascade 2をリリース
ゴルディロックスRL:推論のためのスパース報酬から脱却するためのタスク難易度調整
研究者らは、大規模言語モデルの推論能力を強化するための新しい教師駆動型データサンプリング手法「ゴルディロックス」を提案した。この手法は、タスクの難易度を適切に調整することで、従来の強化学習におけるスパース報酬問題を解決し、サンプル効率を向上させる。
MIT-IBM Watson AI Lab、若手教員の影響力を増幅する「seed to signal」プログラム
MIT-IBM Watson AI Labは、若手教員が研究チームを構築し、革新的なAI研究の方向性を確立するための支援プログラム「seed to signal」を実施している。
P-GenRM:パーソナライズされた生成報酬モデルが多様な個人嗜好に対応
通義実験室の自然言語知能チームは、異なる個人や状況に応じた回答を生成できるP-GenRM(Personalized Generative Reward Model)を開発した。これは初のオープンドメイン向けパーソナライズ生成報酬モデルで、ICLR 2026に採択された。
次世代AIの新たなフロンティアに向けたNVIDIA BlueField-4搭載CMXコンテキストメモリストレージプラットフォームの紹介
NVIDIAが、エージェント型AIワークフローで数百万トークンに拡大するコンテキストウィンドウに対応するCMXコンテキストメモリストレージプラットフォームを発表した。
NVIDIA Vera Rubin POD:7チップ、5つのラックスケールシステム、1つのAIスーパーコンピューター
NVIDIAは、7つのチップと5つのラックスケールシステムで構成される「Vera Rubin POD」AIスーパーコンピューターを発表した。同システムはトークン駆動型AI処理に最適化されており、急増するトークン消費需要に対応する高性能計算基盤を提供する。
メタ、AI投資の費用相殺のため従業員の最大20%削減を計画と報道
メタは、6000億ドル規模のAI投資の費用を相殺するため、従業員の最大20%を削減する大規模なレイオフを計画していると報じられた。
GeminiモデルでGoogle Mapsを進化
Google Mapsの機能向上にGeminiモデルを活用する取り組みを紹介
GeminiモデルでGoogle Mapsを強化
GoogleがGeminiモデルをGoogle Mapsに統合、新機能を公開
Claude 100万トークン対応
Claude Opus/Sonnet 4.6で100万トークン対応が一般提供開始
mAceReason-Math:RLVR対応の高品質多言語数学問題データセット
研究者らが、多言語数学問題の高品質データセット「mAceReason-Math」を公開した。このデータセットは、検証可能な報酬による強化学習(RLVR)の訓練用に設計されており、英語以外の言語での数学・論理問題解決能力の向上に貢献する。
Grok 4.20はGeminiとGPT-5.4に大きく遅れるが、幻覚を起こさない新記録を樹立
xAIのGrok 4.20は、ベンチマークではトップモデルに及ばないが、低コスト・高速で、他のモデルよりも幻覚を起こしにくい特徴を持つ。
Metaの次世代AI向けカスタムシリコン進化
Metaが次世代AIスケーリングのためのカスタムシリコン進化を詳細に説明
Wayfair、OpenAIを活用してカタログ精度とサポート速度を向上
WayfairはOpenAIのモデルを活用し、eコマースサポートの自動化と数百万の製品属性の精度向上を実現した。
GoogleがChromeにGeminiをインドで導入
GoogleがChromeブラウザにGemini AIをインドで展開し、ヒンディー語やベンガル語など複数のインド言語をサポートする。
トークンを流し続ける:16のオープンソースRLライブラリからの教訓
研究者が16のオープンソース強化学習ライブラリを分析し、効率的なトークン管理と学習安定化のための実践的な知見を共有した。
インドでAmazon Bedrock経由でAnthropic Claudeモデルにグローバルなクロスリージョン推論でアクセス可能に
Amazonが、インドの顧客がAmazon Bedrockを通じてAnthropicのClaudeモデルをグローバルなクロスリージョン推論で利用できるようにした。これにより、生成AIアプリケーションの大規模運用が容易になる。
ユリシーズ・シーケンス並列処理:100万トークンのコンテキストでのトレーニング
研究者らが、ユリシーズ・シーケンス並列処理という手法を開発し、100万トークンの長いコンテキストで大規模言語モデルを効率的にトレーニングできるようにした。
ByteDanceのオープンウェイトHeliosモデル、1分間のAI動画生成をほぼリアルタイムに
ByteDanceの研究者が、単一GPUで19.5FPSを達成し1分間の動画クリップを生成できる140億パラメータの動画モデルHeliosを公開した。コードとウェイトは一般公開されている。
iPhoneでQwen 3.5実行可能
iPhoneアプリでQwen 3.5の4Bモデルが実行可能に。3.06GBのダウンロード。
CoT制御性評価スイート公開
OpenAIがChain-of-Thoughtの制御性に関する評価スイートと研究論文を公開
GPT-5.4 Windsurfで公開
GPT-5.4がWindsurfで利用可能に、複数推論機能搭載
GPT-5.4発表
GPT-5.4とPro版の提供開始。ChatGPT、API、Codexで順次展開。
GPT-5.4発表
OpenAIがGPT-5.4を発表。事実性と効率性を向上
アリババのAI開発責任者が退社、主要チームメンバーも同行
アリババのAI開発責任者Junyang Linが突然退社し、Qwenチームの複数の主要メンバーも同行した。退社は内部組織再編が引き金となったと報じられている。
GPT-5.4の紹介
OpenAIが、プロフェッショナル向けに最も高性能で効率的なフロンティアモデル「GPT-5.4」を発表した。最新のコーディング、コンピュータ使用、ツール検索機能と100万トークンのコンテキストを備えている。
ペンタゴンとの対立にもかかわらず、Anthropicが200億ドルの年間収益規模に迫る
Bloombergによると、Anthropicは現在の業績に基づき年間約200億ドルの収益を生み出す軌道にある。
アリババのQwen技術リーダーが主要AI推進後に退任
アリババのQwenチームは、主要モデル発表後に技術リーダーのJunyang Linが退任したことで反響が広がった。
Gemini 3.1 Flash-Lite プレビュー開始
Google DeepMindがGemini 3.1 Flash-Liteのプレビュー提供を開始。
Gemini 3.1 Flash-Lite発表
Google DeepMindがコスト効率重視の新モデルを発表
NVIDIA NeMoを用いた自律ネットワーク向け通信事業者推論モデルの構築
NVIDIAが通信事業者向けに、自律ネットワークを実現する推論モデルをNeMoフレームワークで構築する取り組みを発表した。
ChatGPTの週間アクティブユーザー数が9億人に到達
OpenAIが、1,100億ドルの私募資金調達を発表し、ChatGPTの週間アクティブユーザー数が9億人に達したことを明らかにした。
NVIDIA GPUアクセラレーテッドエンドポイントを使用したQwen3.5 VLMによるネイティブマルチモーダルエージェントの開発
Alibabaが約4000億パラメータのネイティブマルチモーダルエージェント向けに設計されたオープンソースQwen3.5シリーズを発表した。
Perplexity新ベンチマーク発表
PPLXQuery2QueryとPPLXQuery2Docの内部ベンチマークを公開