#大規模言語モデル のAIニュース

92件の記事

NVIDIA Vera Rubin POD:7チップ、5つのラックスケールシステム、1つのAIスーパーコンピューター

NVIDIAは、7つのチップと5つのラックスケールシステムで構成される「Vera Rubin POD」AIスーパーコンピューターを発表した。同システムはトークン駆動型AI処理に最適化されており、急増するトークン消費需要に対応する高性能計算基盤を提供する。

NVIDIA Developer Blog·3月17日·★★★★

メタ、AI投資の費用相殺のため従業員の最大20%削減を計画と報道

メタは、6000億ドル規模のAI投資の費用を相殺するため、従業員の最大20%を削減する大規模なレイオフを計画していると報じられた。

The Decoder·3月14日·★★★★

mAceReason-Math:RLVR対応の高品質多言語数学問題データセット

研究者らが、多言語数学問題の高品質データセット「mAceReason-Math」を公開した。このデータセットは、検証可能な報酬による強化学習(RLVR)の訓練用に設計されており、英語以外の言語での数学・論理問題解決能力の向上に貢献する。

Apple Machine Learning·3月13日·★★★★

Grok 4.20はGeminiとGPT-5.4に大きく遅れるが、幻覚を起こさない新記録を樹立

xAIのGrok 4.20は、ベンチマークではトップモデルに及ばないが、低コスト・高速で、他のモデルよりも幻覚を起こしにくい特徴を持つ。

The Decoder·3月13日

Googleは過去のニュース報道とAIを活用して鉄砲水を予測

Googleは、大規模言語モデルを用いて質的な報道を定量的データに変換し、データ不足を解消する新手法で鉄砲水予測を開発した。

TechCrunch AI·3月12日·★★★★

Wayfair、OpenAIを活用してカタログ精度とサポート速度を向上

WayfairはOpenAIのモデルを活用し、eコマースサポートの自動化と数百万の製品属性の精度向上を実現した。

OpenAI News·3月11日

GoogleがChromeにGeminiをインドで導入

GoogleがChromeブラウザにGemini AIをインドで展開し、ヒンディー語やベンガル語など複数のインド言語をサポートする。

TechCrunch AI·3月11日

トークンを流し続ける:16のオープンソースRLライブラリからの教訓

研究者が16のオープンソース強化学習ライブラリを分析し、効率的なトークン管理と学習安定化のための実践的な知見を共有した。

Hugging Face Blog·3月10日·★★★★

インドでAmazon Bedrock経由でAnthropic Claudeモデルにグローバルなクロスリージョン推論でアクセス可能に

Amazonが、インドの顧客がAmazon Bedrockを通じてAnthropicのClaudeモデルをグローバルなクロスリージョン推論で利用できるようにした。これにより、生成AIアプリケーションの大規模運用が容易になる。

AWS Machine Learning Blog·3月10日·★★★★

ユリシーズ・シーケンス並列処理:100万トークンのコンテキストでのトレーニング

研究者らが、ユリシーズ・シーケンス並列処理という手法を開発し、100万トークンの長いコンテキストで大規模言語モデルを効率的にトレーニングできるようにした。

Hugging Face Blog·3月9日·★★★★

ByteDanceのオープンウェイトHeliosモデル、1分間のAI動画生成をほぼリアルタイムに

ByteDanceの研究者が、単一GPUで19.5FPSを達成し1分間の動画クリップを生成できる140億パラメータの動画モデルHeliosを公開した。コードとウェイトは一般公開されている。

The Decoder·3月7日·★★★★

アリババのAI開発責任者が退社、主要チームメンバーも同行

アリババのAI開発責任者Junyang Linが突然退社し、Qwenチームの複数の主要メンバーも同行した。退社は内部組織再編が引き金となったと報じられている。

The Decoder·3月5日

GPT-5.4の紹介

OpenAIが、プロフェッショナル向けに最も高性能で効率的なフロンティアモデル「GPT-5.4」を発表した。最新のコーディング、コンピュータ使用、ツール検索機能と100万トークンのコンテキストを備えている。

OpenAI News·3月5日·★★★★

ペンタゴンとの対立にもかかわらず、Anthropicが200億ドルの年間収益規模に迫る

Bloombergによると、Anthropicは現在の業績に基づき年間約200億ドルの収益を生み出す軌道にある。

The Decoder·3月4日·★★★★

アリババのQwen技術リーダーが主要AI推進後に退任

アリババのQwenチームは、主要モデル発表後に技術リーダーのJunyang Linが退任したことで反響が広がった。

TechCrunch AI·3月4日

NVIDIA NeMoを用いた自律ネットワーク向け通信事業者推論モデルの構築

NVIDIAが通信事業者向けに、自律ネットワークを実現する推論モデルをNeMoフレームワークで構築する取り組みを発表した。

NVIDIA Developer Blog·3月1日·★★★★

ChatGPTの週間アクティブユーザー数が9億人に到達

OpenAIが、1,100億ドルの私募資金調達を発表し、ChatGPTの週間アクティブユーザー数が9億人に達したことを明らかにした。

TechCrunch AI·2月28日·★★★★

NVIDIA GPUアクセラレーテッドエンドポイントを使用したQwen3.5 VLMによるネイティブマルチモーダルエージェントの開発

Alibabaが約4000億パラメータのネイティブマルチモーダルエージェント向けに設計されたオープンソースQwen3.5シリーズを発表した。

NVIDIA Developer Blog·2月28日·★★★★

ダリオ・アモデイ氏による国防総省との協議に関する声明

ダリオ・アモデイ氏が、自社と米国国防総省との協議について声明を発表した。具体的な内容は明らかにされていないが、AI企業と政府機関の連携に関する動向を示している。

Anthropic News·2月26日·★★★★

AI投資家の忠誠心は(ほぼ)死んだ:少なくとも12のOpenAIベンチャーキャピタルがAnthropicも支援

複数のVCがOpenAIと競合するAnthropicの両方に出資しており、従来の利益相反ルールが無視されている状況を示している。

TechCrunch AI·2月24日·★★★★

GoogleのクラウドAI責任者が語る、モデル能力の3つのフロンティア

AIモデルは、知性、応答速度、拡張性の3つのフロンティアで同時に進化を続けている。

TechCrunch AI·2月24日·★★★★

NVFP4低精度モデルトレーニングによる精度を損なわない高スループットの実現

NVIDIAのNVFP4低精度トレーニング技術は、モデルの精度を維持しながら計算スループットを向上させ、AI開発の効率化とコスト削減に貢献する。

NVIDIA Developer Blog·2月24日·★★★★

2026年2月23日 アライメント ペルソナ選択モデル

2026年2月23日に発表された、AIのペルソナ選択モデルに関するアライメント(整合性)の研究についての記事。

Anthropic Research·2月23日·★★★★

初の証明提出

AIモデルが数学チャレンジ「First Proof」に挑戦した証明を公開。専門家レベルの問題で研究水準の推論能力をテスト。

OpenAI News·2月20日·★★★★

検索拡張生成と多目的アライメントによるクエリ自動補完におけるランキングと生成の統合

クエリ自動補完の課題を解決するため、検索拡張生成と多目的アライメントを用いてランキングと生成を統合する新手法を提案。

Apple Machine Learning·2月18日·★★★★

LWiAIポッドキャスト #234 - Opus 4.6、GPT-5.3-Codex、Seedance 2.0、GLM-5

AI技術の最新動向を紹介するポッドキャスト。Opus 4.6、GPT-5.3-Codex、Seedance 2.0、GLM-5などの新モデルやアップデートについて議論。

Last Week in AI·2月17日·★★★★

Anthropic CEOダリオ・アモデイインタビュー:指数関数的成長の終点に近づいている

AnthropicのCEOダリオ・アモデイが、同社の年収が10倍増加し、300億円を調達し、評価額が3.8兆円に達したが、OpenAIのように計算資源に全力を注ぐことは避けていると述べた。方向性の予測は容易だが、時期の予測はほぼ不可能であり、1年の誤りで破綻する可能性があるためである。

宝玉的分享·2月14日·★★★★

Anthropicが3800億ドルの評価額でGシリーズ資金調達300億ドルを実施

AI企業AnthropicがGシリーズで300億ドルを調達し、調達後の企業価値は3800億ドルに達した。

Anthropic News·2月12日·★★★★★

NVFP4がAIトレーニングと推論を加速する3つの方法

NVIDIAのNVFP4技術が、AIモデルの学習速度向上、推論処理の効率化、エネルギー消費削減の3点でAI開発を革新する内容。

NVIDIA Developer Blog·2月7日·★★★★

xAIが200億ドルのシリーズE資金調達を実施

xAI社が200億ドルのシリーズE資金調達を完了し、高度なAI開発の進捗を加速させている。

xAI News·1月6日

AI週間ニュース #327 - Gemini 3、Opus 4.5、Nano Banana Pro、GPT-5.1-Codex-Max

Googleは新モデル「Gemini 3」を公開し、コーディングアプリと記録的なベンチマークスコアを示した。この発表によりAlphabetの株価が上昇し、AIによる成長で4兆ドル規模の評価額へ向かっている。

Last Week in AI·11月26日·★★★★

サウジアラビアとHUMAINとの画期的な提携を発表

GrokがサウジアラビアとHUMAINと提携し、グローバル展開を進めている。

xAI News·11月19日

後悔のないLoRA

John Schulmanらによる、LoRA(Low-Rank Adaptation)の効率的な適応手法についての研究。従来の微調整よりも計算コストを抑えつつ、モデル性能を維持する方法を提案。

Thinking Machines Lab·9月29日·★★★★

Gemini APIで利用可能なGemini 2.5 FlashおよびPro、Live API、Veo 2

GoogleがGemini APIでGemini 2.5 FlashとProモデル、リアルタイム処理のLive API、動画生成モデルVeo 2を提供開始した。

Google Developers JP·4月10日·★★★★

Grok 3 ベータ版 — 推論エージェントの時代

xAI社が、高度な推論能力と大規模事前学習知識を融合させた最先端モデル「Grok 3」の早期プレビューを発表した。

xAI News·2月19日

憲法分類器:普遍的なジェイルブレイクに対する防御

Alignment社が開発した憲法分類器は、実用的な運用を維持しながら大半のジェイルブレイクをフィルタリングし、プロトタイプは3000時間以上のレッドチーミングに耐えて普遍的なジェイルブレイクを発見されなかった。

Anthropic Research·2月3日·★★★★

社D、生き残っています

平日フルタイム勤務の社会人が、業後・休日に博士課程や連携研究を始めて半年。具体的な成果を紹介する。

Mirai Translate Tech Blog·12月23日

xAIが60億ドルのシリーズC資金調達を実施

xAIがA16Z、ブラックロック、フィデリティ、セコイア・キャピタルなど複数の投資家から60億ドルの資金調達を完了した。

xAI News·12月23日·★★★★

シリーズB資金調達ラウンド

xAIが60億ドルのシリーズB資金調達を発表しました。

xAI News·5月26日·★★★★

Llama 3

Meta社が次世代の大規模言語モデル「Llama 3」を公開し、Ollamaで利用可能になった。現在公開されている中で最も高性能なオープンLLMである。

Ollama Blog·4月18日·★★★★

AIレッドチームによる敵対的訓練:ChatGPTと大規模言語モデルの敵対的堅牢性向上方法

OpenAIは、創造的なデータラベラーからなるAIレッドチームを組織し、大規模言語モデルが攻撃に耐えるよう、敵対的訓練を通じて防御力を高める取り組みを進めている。

Surge AI Blog·12月12日·★★★★

Cohereによる大規模言語モデルの実世界への応用

CohereはGPTやBERTのような大規模言語モデルをAPIとして提供し、Google Brain出身の創業者がTransformers論文の共著者を含む。

Jay Alammar·3月7日