#nvidia のAIニュース
108件の記事
NVIDIA Vera CPU、AIファクトリー向けに高性能・高帯域幅・高効率を実現
NVIDIAがVera CPUを発表し、AIインフラの各層に新たな要件が生じる中、推論モデルのトークン需要増加に対応する高性能・高帯域幅・高効率をAIファクトリー向けに提供する。
NVIDIA Vera Rubin POD:7チップ、5つのラックスケールシステム、1つのAIスーパーコンピューター
NVIDIAは、7つのチップと5つのラックスケールシステムで構成される「Vera Rubin POD」AIスーパーコンピューターを発表した。同システムはトークン駆動型AI処理に最適化されており、急増するトークン消費需要に対応する高性能計算基盤を提供する。
NVIDIAのDLSS 5、生成AIでゲームの写実性を向上、ゲーム以外への展開も視野
NVIDIAが生成AIと構造化グラフィックスデータを活用したDLSS 5を発表し、ビデオゲームの写実性を高めた。CEOのジェンセン・フアンは、この技術が他の産業にも広がる可能性があると述べている。
ディープテックチップスタートアップのFroreがユニコーンに:評価額16.4億ドル達成
NVIDIA CEOジェンスン・フアンの後押しで、Frore社がチップ用液体冷却技術を開発し、1億4300万ドルの資金調達に成功した。
エージェントAI新章発表
NVIDIA主導の複数企業連携によるエージェントAI新展開
意味的類似性を超えて:NVIDIA NeMo Retrieverの汎用化可能なエージェント型検索パイプラインの紹介
NVIDIAが、従来の意味的類似性検索を超える汎用化可能なエージェント型検索パイプライン「NeMo Retriever」を発表した。
NVIDIAのAI-QがDeepResearch Bench IとIIで首位を獲得
NVIDIAが開発したAI-Qが、DeepResearch Bench IとIIのベンチマークで1位を達成した。
LangChain-NVIDIA連携ドキュメント公開
LangChainとNVIDIAの連携に関する公式ドキュメントが公開されました。
LangChainがNemotron 3 Superをサポート
NvidiaのオープンソースモデルNemotron 3 SuperをLangChainがサポート開始
コードコンセプト:プログラミング概念の種から生成された大規模合成データセット
研究者がプログラミング概念の種から生成した大規模合成データセット「Code Concepts」を発表した。このデータセットはAIによるコード生成や理解の研究に活用される。
NVIDIAとミラ・ムラティのThinking Machines LabがAI分野での長期パートナーシップを発表
NVIDIAと元OpenAI幹部ミラ・ムラティが設立したAIスタートアップThinking Machines Labは、AI分野での長期パートナーシップ契約を締結した。
シンキング・マシンズ・ラボ、Nvidiaと大規模なコンピュート契約を締結
シンキング・マシンズ・ラボがNvidiaと複数年にわたる契約を結び、少なくとも1ギガワットの計算能力を確保し、Nvidiaから戦略的投資も受ける。
NVIDIAとthinkymachinesが1GWのVera Rubin展開で提携
NVIDIAがthinkymachinesと提携し、Vera Rubinシステムを1GW以上展開する計画を発表。
CUDA 13.2が強化されたCUDA Tileサポートと新Python機能を導入
NVIDIAがCUDA 13.2をリリースし、CUDA TileをNVIDIA AmpereとAdaアーキテクチャでサポートし、Python機能も追加した。
NVIDIA Megatron CoreにおけるFalcon-H1ハイブリッドアーキテクチャの実装
NVIDIAが、大規模言語モデル開発の基盤フレームワーク「Megatron Core」に、新しいハイブリッドアーキテクチャ「Falcon-H1」を実装した。この技術は、LLMトレーニングの効率性と拡張性を向上させることを目的としている。
NVIDIA推論転送ライブラリによる分散推論性能の向上
NVIDIAが大規模言語モデルの分散推論を効率化する「推論転送ライブラリ」を発表し、複数GPU間での計算負荷分散とリクエスト処理の最適化を実現した。
分散型サービングから推測作業を排除
NVIDIAが、大規模言語モデルの高性能かつコスト効率の良いサービングにおける分散型アーキテクチャの最適化手法を提案し、推測作業を減らす技術を発表した。
広告・マーケティングAIの最新動向
GTC 2026で主要プラットフォームがAI活用事例を発表
OpenAIとOracle、電力供給遅延によりテキサスの旗艦データセンター拡張を停止
OpenAIとOracleは、電力供給の遅延によりテキサス州のStargateデータセンター拡張を停止し、代わりにOpenAIは新拠点でNVIDIAの次世代Vera Rubinチップに投資する計画です。
NVIDIA NeMo Evaluator Agent Skillsによる数分での対話型LLM評価
NVIDIAは、NeMo Evaluator Agent Skillsを発表した。このツールは、大規模言語モデルの対話能力を数分で自動評価できる。
LangChainとNVIDIAのセッション
オープンで信頼性の高いAIデプロイに関するセッション
NVIDIA Blackwellが金融分野におけるLLM推論でSTAC-AI記録を樹立
NVIDIAのBlackwellプラットフォームが、金融取引向け大規模言語モデルの推論性能でSTAC-AIベンチマーク記録を達成した。同技術は大量の非構造化データを分析し、金融取引の意思決定を支援する。
NVIDIA CCCLにおける浮動小数点演算の決定性制御
NVIDIAが、同一入力データに対して複数回実行しても同じビット単位の結果を生成する浮動小数点演算の決定性を制御する技術について説明している。
ジェンセン・フアン氏、NvidiaがOpenAIとAnthropicへの投資を縮小すると発言、説明は疑問を残す
NvidiaのCEOジェンセン・フアン氏が、同社がOpenAIとAnthropicへの投資を縮小し、これが最後の投資になる可能性があると述べた。
NVIDIA、オープンソースモデルで通信業界に挑戦
NVIDIAは通信会社向けの自律的なワークフローを可能にするオープンソースモデルを発表したが、エリクソンやノキアなどの従来のネットワークベンダーとの競争に直面している。
AI需要と電力網の課題
大規模AI需要に対応する電力網の課題についての問いかけ
コーディングエージェントでゲームランタイム推論コストを最小化する方法
NVIDIAが、ゲーム向けAIエージェント構築技術スイート「ACE」を提供し、クラウドとオンデバイスのAIモデルを統合することで、ゲーム内推論コストの最適化を実現している。
NVIDIA、AIインフラ拡大に向けて企業に40億ドル投資
NVIDIAがAIインフラ拡大のために企業に40億ドルを投資する。LumentumとCoherentとの新たな提携は、次世代データセンター向けの高速・高効率技術への需要増を示している。
NVIDIA AIポッドキャスト新着
AI企業社長がAI活用事例を共有
NVIDIA NeMoを用いた自律ネットワーク向け通信事業者推論モデルの構築
NVIDIAが通信事業者向けに、自律ネットワークを実現する推論モデルをNeMoフレームワークで構築する取り組みを発表した。
開発者が6Gネットワーク構築に活用できる5つの新デジタルツイン製品
NVIDIAが、AIネイティブな6Gネットワークの設計・訓練・検証を支援する5つのデジタルツイン製品を開発者向けに発表した。
NASCARのGPUシミュレーション活用
NASCARがGPU加速シミュレーションで安全性と競技性向上を実現
アリババ社長がAIエージェントを語る
NVIDIAポッドキャストでアリババ社長がAIエージェントについて語る
NVIDIA GPUアクセラレーテッドエンドポイントを使用したQwen3.5 VLMによるネイティブマルチモーダルエージェントの開発
Alibabaが約4000億パラメータのネイティブマルチモーダルエージェント向けに設計されたオープンソースQwen3.5シリーズを発表した。
NVIDIA Run:aiとNIMによるGPU利用率の最大化
NVIDIAは、異なるリソース要件を持つ推論ワークロードに直面する組織向けに、Run:aiとNIMを活用してGPU利用率を最適化するソリューションを提供している。
MetaがGoogleのTPUを数十億ドルでレンタル契約、NVIDIAのAIチップ支配に直接挑戦
Metaは自社のAIモデルを訓練するため、GoogleのAIチップ(TPU)を数十億ドル規模でレンタルする契約を結んだ。この取引はNVIDIAのAIチップ市場における支配的地位への直接的な挑戦となる。
AIをすべての人に拡大
企業が7300億ドルの評価額で1100億ドルの新規投資を発表した。ソフトバンクが300億ドル、NVIDIAが300億ドル、アマゾンが500億ドルを出資する。
NVIDIA 2026年AI通信レポート発表
NVIDIAが2026年の通信分野におけるAIの現状に関する公式レポートを公開
AIエージェントで文書分析
PDFや表からAIエージェントで洞察を抽出する企業事例
NVIDIA GTCに金融大手参加
RBC、WellsFargo、NasdaqがNVIDIA GTCに参加予定
金融市場向け生成AIモデル開発
NVIDIAが世界初の金融市場向け生成AIモデルを開発中
Nvidia、記録的な設備投資の中で四半期売上高を更新
NVIDIAのCEOがトークン需要の指数関数的増加を指摘し、同社が設備投資拡大中に売上高記録を更新したことを報告。
NVIDIA Blackwell UltraによるSoftmaxの効率化
NVIDIAの次世代アーキテクチャBlackwell Ultraが、AI計算の重要な関数Softmaxを効率化し、大規模言語モデルの性能向上に貢献する技術革新について。
NVIDIAとRed HatがAI連携
NVIDIAとRed Hatが企業向けAIイノベーション加速で提携
NVIDIA AI通信業界レポート発表
NVIDIAが2026年の通信業界におけるAIの現状に関するレポートを発表
NVIDIA Multi-Instance GPUとNUMAノードローカライゼーションによるデータ処理の高速化
NVIDIAのMIG技術とNUMAノード最適化を組み合わせ、GPUリソースの効率的な分割とメモリアクセス最適化により、AI/機械学習ワークロードのデータ処理速度を向上させる手法を紹介。
5つの重要なマルチモーダルRAG機能でAI対応知識システムを構築
NVIDIAが提案する5つのマルチモーダルRAG機能を活用し、AI対応の知識システムを効果的に構築する方法について説明しています。
R²D²:NVIDIA Isaac Labによるマルチモーダルロボット学習の拡張
NVIDIA Isaac Labが開発したR²D²は、マルチモーダルロボット学習を拡張する技術で、ロボットの知能向上を目指しています。
大規模研究施設における加速コンピューティングを用いた科学実験のリアルタイム制御
NVIDIAの加速コンピューティング技術により、大規模研究施設での科学実験をリアルタイムで制御・調整できるようになり、研究効率が大幅に向上。
NVIDIA TensorRT LLM AutoDeployによる推論最適化の自動化
NVIDIAがTensorRT LLM AutoDeployを発表し、大規模言語モデルの推論最適化とデプロイを自動化するツールを提供。AI開発の効率化を目指す。