#nvidia のAIニュース
125件の記事
NVIDIA Run:aiとNIMによるGPU利用率の最大化
NVIDIAは、異なるリソース要件を持つ推論ワークロードに直面する組織向けに、Run:aiとNIMを活用してGPU利用率を最適化するソリューションを提供している。
MetaがGoogleのTPUを数十億ドルでレンタル契約、NVIDIAのAIチップ支配に直接挑戦
Metaは自社のAIモデルを訓練するため、GoogleのAIチップ(TPU)を数十億ドル規模でレンタルする契約を結んだ。この取引はNVIDIAのAIチップ市場における支配的地位への直接的な挑戦となる。
OpenAIが史上最大級のプライベート資金調達で1100億ドルを調達
OpenAIが史上最大級のプライベート資金調達で1100億ドルを調達した。アマゾンが500億ドル、NVIDIAとソフトバンクが各300億ドルを出資し、評価額は7300億ドルとなった。
AIをすべての人に拡大
企業が7300億ドルの評価額で1100億ドルの新規投資を発表した。ソフトバンクが300億ドル、NVIDIAが300億ドル、アマゾンが500億ドルを出資する。
Nvidia、記録的な設備投資の中で四半期売上高を更新
NVIDIAのCEOがトークン需要の指数関数的増加を指摘し、同社が設備投資拡大中に売上高記録を更新したことを報告。
NVIDIA Blackwell UltraによるSoftmaxの効率化
NVIDIAの次世代アーキテクチャBlackwell Ultraが、AI計算の重要な関数Softmaxを効率化し、大規模言語モデルの性能向上に貢献する技術革新について。
Nvidiaは投資を招待されただけだった
Nvidiaは投資を招待されただけであり、これは約束の一つの撤回を示している。AI企業間の循環投資を示す図表が話題になっている。
NVIDIA Multi-Instance GPUとNUMAノードローカライゼーションによるデータ処理の高速化
NVIDIAのMIG技術とNUMAノード最適化を組み合わせ、GPUリソースの効率的な分割とメモリアクセス最適化により、AI/機械学習ワークロードのデータ処理速度を向上させる手法を紹介。
「データ不足」の壁を乗り越える:合成ペルソナが日本のAI開発を加速
日本ではAI開発におけるデータ不足が課題だが、合成ペルソナ(人工的に生成されたユーザーデータ)を活用することで、この壁を克服し開発を加速できる可能性がある。
5つの重要なマルチモーダルRAG機能でAI対応知識システムを構築
NVIDIAが提案する5つのマルチモーダルRAG機能を活用し、AI対応の知識システムを効果的に構築する方法について説明しています。
R²D²:NVIDIA Isaac Labによるマルチモーダルロボット学習の拡張
NVIDIA Isaac Labが開発したR²D²は、マルチモーダルロボット学習を拡張する技術で、ロボットの知能向上を目指しています。
大規模研究施設における加速コンピューティングを用いた科学実験のリアルタイム制御
NVIDIAの加速コンピューティング技術により、大規模研究施設での科学実験をリアルタイムで制御・調整できるようになり、研究効率が大幅に向上。
Tritonにおけるインライン要素別アセンブリによる命令レベルの制御
TritonはGPUカーネル作成を簡素化するDSLだが、詳細な制御が必要な場合の課題がある。本記事は、インライン要素別アセンブリ(Inline Elementwise ASM)を用いて、Triton内で命令レベルの細かな制御を行う手法を紹介している。
NVIDIA TensorRT LLM AutoDeployによる推論最適化の自動化
NVIDIAがTensorRT LLM AutoDeployを発表し、大規模言語モデルの推論最適化とデプロイを自動化するツールを提供。AI開発の効率化を目指す。
NVFP4がAIトレーニングと推論を加速する3つの方法
NVIDIAのNVFP4技術が、AIモデルの学習速度向上、推論処理の効率化、エネルギー消費削減の3点でAI開発を革新する内容。
NVIDIA GPUアクセラレーションエンドポイントを使用したKimi K2.5マルチモーダルVLMの構築
Kimiが最新のオープンソース視覚言語モデル「Kimi K2.5」を発表した。このモデルは汎用マルチモーダルモデルであり、NVIDIA GPUアクセラレーションエンドポイントを活用して構築できる。
なぜNvidiaはオープンモデルを構築するのか:ブライアン・カタンザロに聞く
Nvidiaは2025年にオープンモデルプログラムを大幅に強化し、高品質なモデルやデータセットの公開を進めている。技術担当副社長のブライアン・カタンザロ氏は、12月に公開された「Nemotron 3 Nano」や今後の大型モデルについて説明し、オープン化が同社のビジネスに利益をもたらす理由を語った。
Nemotronを使用したRAG向け文書処理パイプラインの構築方法
NVIDIAが、複雑なPDFの解析、ネストされた表の抽出、チャート内データの認識を可能にする、RAG(検索拡張生成)向け文書処理パイプラインの構築方法を紹介している。
JAXとXLAにおける長文脈モデル学習の高速化
NVIDIAが、大規模言語モデルの長文脈学習をJAXとXLAで高速化する技術を発表した。128Kトークン以上の長文脈処理を効率化する手法を開発した。
ハイブリッドエキスパート並列によるMixture-of-Expertsトレーニングの通信最適化
NVIDIAが、大規模MoEモデルのトレーニングにおけるエキスパート並列通信の課題を解決するハイブリッド手法を提案した。
OpenAI Triton向けCUDA Tile IRバックエンドによるGPUプログラミングの進展
NVIDIAがCUDA Tileを発表した。これはNVIDIA Tensor Core向けの移植性を目指すGPUベースのプログラミングモデルであり、GPUのピーク性能を引き出すことを可能にする。
NVIDIA、新AIチップとメルセデスとの自動運転車プロジェクトを発表
NVIDIAがCES 2026で新AIチップ「Alpamayo」と自動運転車向けAIプラットフォーム「Vera Rubin」を発表し、メルセデスとの自動運転車プロジェクトを詳細に説明した。
AI週報 #330 - Groq→Nvidia、ChatGPTアプリ、米国AI創世ミッション
NvidiaがAIチップスタートアップのGroqの資産を約200億ドルで買収し、同社最大の取引となった。
falのシリーズD資金調達:1億4000万ドルを調達し、スケールアップ
生成メディア企業falは、シークオヤやNVIDIAなどから1億4000万ドルのシリーズD資金調達に成功した。この資金は、デザインや商業分野での急増する需要に対応し、プラットフォームの規模拡大に充てられる。
AIエージェントが資金を使用、オンライン賭博が自動化、ChatGPTユーザーが移行、強化学習が加速
中国は先週、主要テック企業によるNVIDIAチップの購入を禁止した。