#nvidia のAIニュース

109件の記事

NVIDIA TensorRT LLM AutoDeployによる推論最適化の自動化

NVIDIAがTensorRT LLM AutoDeployを発表し、大規模言語モデルの推論最適化とデプロイを自動化するツールを提供。AI開発の効率化を目指す。

NVIDIA Developer Blog·2月10日·★★★★

NVFP4がAIトレーニングと推論を加速する3つの方法

NVIDIAのNVFP4技術が、AIモデルの学習速度向上、推論処理の効率化、エネルギー消費削減の3点でAI開発を革新する内容。

NVIDIA Developer Blog·2月7日·★★★★

NVIDIA GPUアクセラレーションエンドポイントを使用したKimi K2.5マルチモーダルVLMの構築

Kimiが最新のオープンソース視覚言語モデル「Kimi K2.5」を発表した。このモデルは汎用マルチモーダルモデルであり、NVIDIA GPUアクセラレーションエンドポイントを活用して構築できる。

NVIDIA Developer Blog·2月5日·★★★★

Nemotronを使用したRAG向け文書処理パイプラインの構築方法

NVIDIAが、複雑なPDFの解析、ネストされた表の抽出、チャート内データの認識を可能にする、RAG(検索拡張生成)向け文書処理パイプラインの構築方法を紹介している。

NVIDIA Developer Blog·2月5日·★★★★

JAXとXLAにおける長文脈モデル学習の高速化

NVIDIAが、大規模言語モデルの長文脈学習をJAXとXLAで高速化する技術を発表した。128Kトークン以上の長文脈処理を効率化する手法を開発した。

NVIDIA Developer Blog·2月4日·★★★★

ハイブリッドエキスパート並列によるMixture-of-Expertsトレーニングの通信最適化

NVIDIAが、大規模MoEモデルのトレーニングにおけるエキスパート並列通信の課題を解決するハイブリッド手法を提案した。

NVIDIA Developer Blog·2月3日·★★★★

OpenAI Triton向けCUDA Tile IRバックエンドによるGPUプログラミングの進展

NVIDIAがCUDA Tileを発表した。これはNVIDIA Tensor Core向けの移植性を目指すGPUベースのプログラミングモデルであり、GPUのピーク性能を引き出すことを可能にする。

NVIDIA Developer Blog·1月31日·★★★★

NVIDIA、新AIチップとメルセデスとの自動運転車プロジェクトを発表

NVIDIAがCES 2026で新AIチップ「Alpamayo」と自動運転車向けAIプラットフォーム「Vera Rubin」を発表し、メルセデスとの自動運転車プロジェクトを詳細に説明した。

Last Week in AI·1月6日·★★★★

AI週報 #330 - Groq→Nvidia、ChatGPTアプリ、米国AI創世ミッション

NvidiaがAIチップスタートアップのGroqの資産を約200億ドルで買収し、同社最大の取引となった。

Last Week in AI·12月25日·★★★★★