#大規模言語モデル のAIニュース
92件の記事
NVIDIA Vera Rubin POD:7チップ、5つのラックスケールシステム、1つのAIスーパーコンピューター
NVIDIAは、7つのチップと5つのラックスケールシステムで構成される「Vera Rubin POD」AIスーパーコンピューターを発表した。同システムはトークン駆動型AI処理に最適化されており、急増するトークン消費需要に対応する高性能計算基盤を提供する。
メタ、AI投資の費用相殺のため従業員の最大20%削減を計画と報道
メタは、6000億ドル規模のAI投資の費用を相殺するため、従業員の最大20%を削減する大規模なレイオフを計画していると報じられた。
mAceReason-Math:RLVR対応の高品質多言語数学問題データセット
研究者らが、多言語数学問題の高品質データセット「mAceReason-Math」を公開した。このデータセットは、検証可能な報酬による強化学習(RLVR)の訓練用に設計されており、英語以外の言語での数学・論理問題解決能力の向上に貢献する。
Grok 4.20はGeminiとGPT-5.4に大きく遅れるが、幻覚を起こさない新記録を樹立
xAIのGrok 4.20は、ベンチマークではトップモデルに及ばないが、低コスト・高速で、他のモデルよりも幻覚を起こしにくい特徴を持つ。
Googleは過去のニュース報道とAIを活用して鉄砲水を予測
Googleは、大規模言語モデルを用いて質的な報道を定量的データに変換し、データ不足を解消する新手法で鉄砲水予測を開発した。
Wayfair、OpenAIを活用してカタログ精度とサポート速度を向上
WayfairはOpenAIのモデルを活用し、eコマースサポートの自動化と数百万の製品属性の精度向上を実現した。
GoogleがChromeにGeminiをインドで導入
GoogleがChromeブラウザにGemini AIをインドで展開し、ヒンディー語やベンガル語など複数のインド言語をサポートする。
トークンを流し続ける:16のオープンソースRLライブラリからの教訓
研究者が16のオープンソース強化学習ライブラリを分析し、効率的なトークン管理と学習安定化のための実践的な知見を共有した。
インドでAmazon Bedrock経由でAnthropic Claudeモデルにグローバルなクロスリージョン推論でアクセス可能に
Amazonが、インドの顧客がAmazon Bedrockを通じてAnthropicのClaudeモデルをグローバルなクロスリージョン推論で利用できるようにした。これにより、生成AIアプリケーションの大規模運用が容易になる。
ユリシーズ・シーケンス並列処理:100万トークンのコンテキストでのトレーニング
研究者らが、ユリシーズ・シーケンス並列処理という手法を開発し、100万トークンの長いコンテキストで大規模言語モデルを効率的にトレーニングできるようにした。
ByteDanceのオープンウェイトHeliosモデル、1分間のAI動画生成をほぼリアルタイムに
ByteDanceの研究者が、単一GPUで19.5FPSを達成し1分間の動画クリップを生成できる140億パラメータの動画モデルHeliosを公開した。コードとウェイトは一般公開されている。
アリババのAI開発責任者が退社、主要チームメンバーも同行
アリババのAI開発責任者Junyang Linが突然退社し、Qwenチームの複数の主要メンバーも同行した。退社は内部組織再編が引き金となったと報じられている。
GPT-5.4の紹介
OpenAIが、プロフェッショナル向けに最も高性能で効率的なフロンティアモデル「GPT-5.4」を発表した。最新のコーディング、コンピュータ使用、ツール検索機能と100万トークンのコンテキストを備えている。
ペンタゴンとの対立にもかかわらず、Anthropicが200億ドルの年間収益規模に迫る
Bloombergによると、Anthropicは現在の業績に基づき年間約200億ドルの収益を生み出す軌道にある。
アリババのQwen技術リーダーが主要AI推進後に退任
アリババのQwenチームは、主要モデル発表後に技術リーダーのJunyang Linが退任したことで反響が広がった。
NVIDIA NeMoを用いた自律ネットワーク向け通信事業者推論モデルの構築
NVIDIAが通信事業者向けに、自律ネットワークを実現する推論モデルをNeMoフレームワークで構築する取り組みを発表した。
ChatGPTの週間アクティブユーザー数が9億人に到達
OpenAIが、1,100億ドルの私募資金調達を発表し、ChatGPTの週間アクティブユーザー数が9億人に達したことを明らかにした。
NVIDIA GPUアクセラレーテッドエンドポイントを使用したQwen3.5 VLMによるネイティブマルチモーダルエージェントの開発
Alibabaが約4000億パラメータのネイティブマルチモーダルエージェント向けに設計されたオープンソースQwen3.5シリーズを発表した。
ダリオ・アモデイ氏による国防総省との協議に関する声明
ダリオ・アモデイ氏が、自社と米国国防総省との協議について声明を発表した。具体的な内容は明らかにされていないが、AI企業と政府機関の連携に関する動向を示している。
AI投資家の忠誠心は(ほぼ)死んだ:少なくとも12のOpenAIベンチャーキャピタルがAnthropicも支援
複数のVCがOpenAIと競合するAnthropicの両方に出資しており、従来の利益相反ルールが無視されている状況を示している。
GoogleのクラウドAI責任者が語る、モデル能力の3つのフロンティア
AIモデルは、知性、応答速度、拡張性の3つのフロンティアで同時に進化を続けている。
NVFP4低精度モデルトレーニングによる精度を損なわない高スループットの実現
NVIDIAのNVFP4低精度トレーニング技術は、モデルの精度を維持しながら計算スループットを向上させ、AI開発の効率化とコスト削減に貢献する。
2026年2月23日 アライメント ペルソナ選択モデル
2026年2月23日に発表された、AIのペルソナ選択モデルに関するアライメント(整合性)の研究についての記事。
初の証明提出
AIモデルが数学チャレンジ「First Proof」に挑戦した証明を公開。専門家レベルの問題で研究水準の推論能力をテスト。
検索拡張生成と多目的アライメントによるクエリ自動補完におけるランキングと生成の統合
クエリ自動補完の課題を解決するため、検索拡張生成と多目的アライメントを用いてランキングと生成を統合する新手法を提案。
LWiAIポッドキャスト #234 - Opus 4.6、GPT-5.3-Codex、Seedance 2.0、GLM-5
AI技術の最新動向を紹介するポッドキャスト。Opus 4.6、GPT-5.3-Codex、Seedance 2.0、GLM-5などの新モデルやアップデートについて議論。
Anthropic CEOダリオ・アモデイインタビュー:指数関数的成長の終点に近づいている
AnthropicのCEOダリオ・アモデイが、同社の年収が10倍増加し、300億円を調達し、評価額が3.8兆円に達したが、OpenAIのように計算資源に全力を注ぐことは避けていると述べた。方向性の予測は容易だが、時期の予測はほぼ不可能であり、1年の誤りで破綻する可能性があるためである。
Anthropicが3800億ドルの評価額でGシリーズ資金調達300億ドルを実施
AI企業AnthropicがGシリーズで300億ドルを調達し、調達後の企業価値は3800億ドルに達した。
NVFP4がAIトレーニングと推論を加速する3つの方法
NVIDIAのNVFP4技術が、AIモデルの学習速度向上、推論処理の効率化、エネルギー消費削減の3点でAI開発を革新する内容。
xAIが200億ドルのシリーズE資金調達を実施
xAI社が200億ドルのシリーズE資金調達を完了し、高度なAI開発の進捗を加速させている。
AI週間ニュース #327 - Gemini 3、Opus 4.5、Nano Banana Pro、GPT-5.1-Codex-Max
Googleは新モデル「Gemini 3」を公開し、コーディングアプリと記録的なベンチマークスコアを示した。この発表によりAlphabetの株価が上昇し、AIによる成長で4兆ドル規模の評価額へ向かっている。
サウジアラビアとHUMAINとの画期的な提携を発表
GrokがサウジアラビアとHUMAINと提携し、グローバル展開を進めている。
後悔のないLoRA
John Schulmanらによる、LoRA(Low-Rank Adaptation)の効率的な適応手法についての研究。従来の微調整よりも計算コストを抑えつつ、モデル性能を維持する方法を提案。
Gemini APIで利用可能なGemini 2.5 FlashおよびPro、Live API、Veo 2
GoogleがGemini APIでGemini 2.5 FlashとProモデル、リアルタイム処理のLive API、動画生成モデルVeo 2を提供開始した。
Grok 3 ベータ版 — 推論エージェントの時代
xAI社が、高度な推論能力と大規模事前学習知識を融合させた最先端モデル「Grok 3」の早期プレビューを発表した。
憲法分類器:普遍的なジェイルブレイクに対する防御
Alignment社が開発した憲法分類器は、実用的な運用を維持しながら大半のジェイルブレイクをフィルタリングし、プロトタイプは3000時間以上のレッドチーミングに耐えて普遍的なジェイルブレイクを発見されなかった。
社D、生き残っています
平日フルタイム勤務の社会人が、業後・休日に博士課程や連携研究を始めて半年。具体的な成果を紹介する。
xAIが60億ドルのシリーズC資金調達を実施
xAIがA16Z、ブラックロック、フィデリティ、セコイア・キャピタルなど複数の投資家から60億ドルの資金調達を完了した。
シリーズB資金調達ラウンド
xAIが60億ドルのシリーズB資金調達を発表しました。
Llama 3
Meta社が次世代の大規模言語モデル「Llama 3」を公開し、Ollamaで利用可能になった。現在公開されている中で最も高性能なオープンLLMである。
AIレッドチームによる敵対的訓練:ChatGPTと大規模言語モデルの敵対的堅牢性向上方法
OpenAIは、創造的なデータラベラーからなるAIレッドチームを組織し、大規模言語モデルが攻撃に耐えるよう、敵対的訓練を通じて防御力を高める取り組みを進めている。
Cohereによる大規模言語モデルの実世界への応用
CohereはGPTやBERTのような大規模言語モデルをAPIとして提供し、Google Brain出身の創業者がTransformers論文の共著者を含む。