#nvidia blackwell のAIニュース
15件の記事
NVIDIA Blackwell を用いた Amazon SageMaker AI でのモデル学習の最適化
AWS は、NVIDIA の最新 GPU「Blackwell」を活用することで、Amazon SageMaker AI 上で大規模 AI モデルの学習におけるメモリ制約やシーケンス長の制限といった課題を克服し、実用的な運用範囲を広げる方法を発表した。
DFlash、NVIDIA Blackwell で最大 15 倍のスループット向上を実現する並列トークンブロックドラフト方式を提案
研究チームが開発した DFlash は、推論のボトルネックである逐次生成を改善し、小規模モデルで未来のトークンを並列にドラフトして大規模モデルが検証する手法により、NVIDIA Blackwell 上で最大 15 倍のスループット向上を実現しました。
最速・最大・最強:NVIDIA Blackwell が MLPerf Training 6.0 で圧勝
NVIDIA は Blackwell プラットフォームで MLPerf Training 6.0 ベンチマークを支配し、8,192 GPU を使用した最速かつ最大のトレーニング時間を達成しました。NVLink や NVFP4 の革新により MoE モデルの効率的なルーティングが可能になり、信頼性機能も大規模 AI 環境での稼働率向上に貢献しています。
NVIDIA Blackwell、MLPerf Training 6.0 で業界をリードするスケーラビリティとパフォーマンスを獲得し首位に
NVIDIA は、同社の最新 AI チップセット「Blackwell」が MLPerf Training 6.0 ベンチマークで業界最高水準のスケーラビリティとパフォーマンスを発揮し、首位を獲得したことを発表した。
NVIDIA Blackwell が初のエージェント型 AI インフラベンチマークで首位に立つ(4 分読)
NVIDIA は、Blackwell アーキテクチャが最初のエージェント型 AI インフラベンチマークにおいて他社製品を上回る性能を示したと発表した。
MiniMax のスパースアテンション技術が百万トークンコンテキストを実現(GitHub リポジトリ)
MiniMax が開発したスパースアテンションアーキテクチャは、グループ固有の Top-k ブロック選択を用いて、モデル品質を維持しつつ 109B モデルで 1M トークンの推論計算量を約 30 倍削減し、GQA と同等のパフォーマンスを達成しました。
e スクーター創業者が宇宙データセンター構築に 500 万ドルを調達
e スクーターの創業者が、宇宙空間でのデータセンター建設プロジェクトのために 500 万ドルの資金調達を実現した。
NVIDIA Blackwell で NVFP4 を使用し、JAX と MaxText でモデルの学習を高速化
NVIDIA は、Blackwell アーキテクチャ上で NVFP4 技術を活用することで、JAX および MaxText を用いた大規模言語モデルの前学習処理におけるスループットが向上し、学習速度が大幅に改善されることを発表した。
Amazon FSx for LustreとTurboQuantによるGPUDirect活用でLLMの読み込み加速とコンテキストウィンドウ拡大
AWSは、GPUの高帯域メモリへの大規模言語モデル(LLM)読み込み時間の短縮とコンテキストウィンドウの拡大を実現する技術として、Amazon FSx for LustreとTurboQuantをGPUDirectと組み合わせて活用する方法を発表した。
TokenSpeed:エージェントワークロード向け光速 LLM 推論エンジン
NVIDIA DevTech と共同開発された高性能推論エンジン「TokenSpeed」は、コンパイラ支援モデル機構とスケジューラーを活用し、コーディングエージェントの処理速度を TensorRT-LLM より向上させ、遅延を大幅に削減します。
本日は特に目立った出来事なし
AIニュース配信「AINews」は、2026年4月27日から28日にかけて12のサブレッドと544件のツイートを調査したが、特筆すべき技術進展や業界動向は見られず、静かな一日であったと報告している。
NVIDIA BlackwellとGPUアクセラレーションエンドポイントを用いたDeepSeek V4の構築
DeepSeekは第4世代フラッグシップモデル「V4-Pro/Flash」を公開し、NVIDIA BlackwellとGPUアクセラレーションエンドポイントを活用した構築環境を提供した。
バイトダンス、マレーシアでNvidia Blackwellクラスターへのアクセスを確保、米国の対中輸出禁止を回避
バイトダンス(TikTokの親会社)が、米国の対中輸出規制を回避するため、マレーシアで約36,000個のNvidia Blackwellチップを使用する計画を立てている。
Arcee AI、米国産オープンモデルに全集中
スタートアップのArcee AIは、特定ドメイン向けポストトレーニングで収益を上げている。今後は米国産の大型高性能オープンモデルを事前学習し、市場での実証とニッチの埋め合わせを目指す。
Blackwell上で6TB/s超を達成するMXFP8量子化器
CuTeDSLを用いたMXFP8量子化器が、Blackwell B200上で6TB/s超の処理速度を達成した。スケールファクターを直接書き込むことで、後続のGEMM処理における追加パックステップを省略し、効率化した。