#nvidia のAIニュース
109件の記事
NVIDIA TensorRT LLM AutoDeployによる推論最適化の自動化
NVIDIAがTensorRT LLM AutoDeployを発表し、大規模言語モデルの推論最適化とデプロイを自動化するツールを提供。AI開発の効率化を目指す。
NVIDIA Developer Blog·2月10日·★★★★
NVFP4がAIトレーニングと推論を加速する3つの方法
NVIDIAのNVFP4技術が、AIモデルの学習速度向上、推論処理の効率化、エネルギー消費削減の3点でAI開発を革新する内容。
NVIDIA Developer Blog·2月7日·★★★★
NVIDIA GPUアクセラレーションエンドポイントを使用したKimi K2.5マルチモーダルVLMの構築
Kimiが最新のオープンソース視覚言語モデル「Kimi K2.5」を発表した。このモデルは汎用マルチモーダルモデルであり、NVIDIA GPUアクセラレーションエンドポイントを活用して構築できる。
NVIDIA Developer Blog·2月5日·★★★★
Nemotronを使用したRAG向け文書処理パイプラインの構築方法
NVIDIAが、複雑なPDFの解析、ネストされた表の抽出、チャート内データの認識を可能にする、RAG(検索拡張生成)向け文書処理パイプラインの構築方法を紹介している。
NVIDIA Developer Blog·2月5日·★★★★
JAXとXLAにおける長文脈モデル学習の高速化
NVIDIAが、大規模言語モデルの長文脈学習をJAXとXLAで高速化する技術を発表した。128Kトークン以上の長文脈処理を効率化する手法を開発した。
NVIDIA Developer Blog·2月4日·★★★★
ハイブリッドエキスパート並列によるMixture-of-Expertsトレーニングの通信最適化
NVIDIAが、大規模MoEモデルのトレーニングにおけるエキスパート並列通信の課題を解決するハイブリッド手法を提案した。
NVIDIA Developer Blog·2月3日·★★★★
OpenAI Triton向けCUDA Tile IRバックエンドによるGPUプログラミングの進展
NVIDIAがCUDA Tileを発表した。これはNVIDIA Tensor Core向けの移植性を目指すGPUベースのプログラミングモデルであり、GPUのピーク性能を引き出すことを可能にする。
NVIDIA Developer Blog·1月31日·★★★★
NVIDIA、新AIチップとメルセデスとの自動運転車プロジェクトを発表
NVIDIAがCES 2026で新AIチップ「Alpamayo」と自動運転車向けAIプラットフォーム「Vera Rubin」を発表し、メルセデスとの自動運転車プロジェクトを詳細に説明した。
Last Week in AI·1月6日·★★★★
AI週報 #330 - Groq→Nvidia、ChatGPTアプリ、米国AI創世ミッション
NvidiaがAIチップスタートアップのGroqの資産を約200億ドルで買収し、同社最大の取引となった。
Last Week in AI·12月25日·★★★★★
← 前へ3 / 3