#ハードウェア最適化 のAIニュース
18件の記事
Anthropic、サムスンと新カスタムチップの検討中
AI企業のアントロピックは、サムスン電子と独自に設計した新しい半導体チップの開発について協議している。
OpenAI から SpaceX までが独自チップ開発に乗り出し、Nvidia の支配に熱を帯びさせる理由
OpenAI は Broadcom と共同で推論用カスタムチップ「Jalapeño」を開発中であり、Google や Apple、SpaceX も同様に単一サプライヤー依存からの脱却を図っている。これにより長年 AI チップ市場を支配してきた Nvidia の独占体制に終止符が打たれる可能性がある。
OpenAI、Broadcom 製初の独自チップを発表
OpenAI が Broadcom と共同開発した自社初の専用チップを公開し、AI 計算能力の向上を目指す。
TPU スタックの力を解き放つ:新開発者ハブの紹介
Google は、モデルビルダーや開発者が Google Cloud TPU の性能を最大化できるよう支援する教育リソース「TPU 開発者ハブ」を正式に立ち上げました。
NVIDIA Ising、フォールトトレラント量子システム構築のためのAI駆動ワークフローを導入
NVIDIAがIsingを発表した。これは量子プロセッサ構築のための世界初のオープンAIモデルファミリーで、Ising CalibrationとIsing...の2つのモデルドメインを備えている。
GoogleとIntelがAIインフラパートナーシップを深化
GoogleとIntelは、世界的なCPU不足による需要高騰を背景に、カスタムチップの共同開発を進めている。
NVIDIAの極限共同設計が新たなMLPerf推論記録を達成
NVIDIAは、ハードウェア・ソフトウェア・モデルの共同設計により、AIファクトリーの最高スループットと最低トークンコストを実現し、MLPerf推論ベンチマークで新記録を樹立した。
ワット当たり性能の最大化によるトークンファクトリー収益とAI効率の拡大
NVIDIAは、AI時代において電力が最大の制約要因であると指摘し、ワット当たり性能の最適化がAIファクトリーの効率向上と収益拡大に不可欠だと主張している。
スタートアップGimlet Labs、驚くほど洗練された方法でAI推論のボトルネックを解決
Gimlet Labsは、AIがNVIDIA、AMD、Intel、ARM、Cerebras、d-Matrixのチップを同時に実行できる技術で8000万ドルのシリーズA資金を調達した。
独占取材:AmazonのTrainiumチップラボ、Anthropic・OpenAI・Appleも採用
AmazonはOpenAIに500億ドル投資し、AWSがその中核となるTrainiumチップラボを公開した。同チップはAnthropic、OpenAI、Appleにも採用されている。
NVIDIA Groq 3 LPXの内部:NVIDIA Vera Rubinプラットフォーム向け低遅延推論アクセラレータ
NVIDIAは、NVIDIA Vera Rubinプラットフォーム向けに、低遅延・大規模コンテキスト対応のラックスケール推論アクセラレータ「Groq 3 LPX」を発表した。
ディープテックチップスタートアップのFroreがユニコーンに:評価額16.4億ドル達成
NVIDIA CEOジェンスン・フアンの後押しで、Frore社がチップ用液体冷却技術を開発し、1億4300万ドルの資金調達に成功した。
CUDA 13.2が強化されたCUDA Tileサポートと新Python機能を導入
NVIDIAがCUDA 13.2をリリースし、CUDA TileをNVIDIA AmpereとAdaアーキテクチャでサポートし、Python機能も追加した。
AppleがM5 ProとM5 Maxを発表、MシリーズCPUコアの名称変更も実施
Appleがプロ向けノートパソコン用チップ「M5 Pro」と「M5 Max」を発表した。新設計のFusion Architectureを採用し、18コアCPUやNeural Engineなどを統合したSoCとして、新型MacBook Proに搭載される。
NVIDIA Blackwell UltraによるSoftmaxの効率化
NVIDIAの次世代アーキテクチャBlackwell Ultraが、AI計算の重要な関数Softmaxを効率化し、大規模言語モデルの性能向上に貢献する技術革新について。
Nvidiaに挑戦するAIチップ新興企業MatXが5億ドルを調達
元Google TPUエンジニアが設立したAIチップ新興企業MatXが5億ドルを調達。Nvidiaへの競争激化を示す動き。
GPT-5.3-Codex-Sparkの紹介
初のリアルタイムコーディングモデルGPT-5.3-Codex-Sparkを発表。生成速度15倍、128kコンテキストを実現し、ChatGPT Proユーザー向けに研究プレビュー開始。
OpenAI Triton向けCUDA Tile IRバックエンドによるGPUプログラミングの進展
NVIDIAがCUDA Tileを発表した。これはNVIDIA Tensor Core向けの移植性を目指すGPUベースのプログラミングモデルであり、GPUのピーク性能を引き出すことを可能にする。