#aiインフラ のAIニュース
69件の記事
Metaの天然ガス大量消費がサウスダコタ州を電力供給する可能性
Metaが建設中のHyperion AIデータセンターは、10基の新設天然ガス発電所によって稼働する。
NVIDIAの極限共同設計が新たなMLPerf推論記録を達成
NVIDIAは、ハードウェア・ソフトウェア・モデルの共同設計により、AIファクトリーの最高スループットと最低トークンコストを実現し、MLPerf推論ベンチマークで新記録を樹立した。
マイクロソフト、タイのAI未来に10億ドルを投資
マイクロソフトがタイのAIインフラ構築に10億ドルを投資し、テック大手による主権的AIインフラへの投資が進んでいる。
Nebius、フィンランドに欧州最大級のAIファクトリーを建設
Nebiusがフィンランドに310MW規模のAIファクトリーを建設し、欧州が米国のAIインフラに対抗する動きを加速させる。
AIの次の段階を加速
OpenAIが1,220億ドルの新規資金を調達し、フロンティアAIの世界的拡大、次世代コンピューティングへの投資、ChatGPT・Codex・企業向けAIの需要増に対応する。
ゲオルギ・ゲルガノフ氏の発言を引用
ゲオルギ・ゲルガノフ氏は、ローカルAIモデルの現在の主な課題が、モデル操作の仕組みやプロンプト構築の複雑さ、推論バグなどにあると指摘し、クライアントから結果までの脆弱な連鎖を問題視している。
Mistral AI、AIデータセンターに8億3000万ドルを調達
Mistral AIは、パリ近郊に設立するAIデータセンターに8億3000万ドルを調達し、数千のNvidiaチップで稼働させる。
Mistral AI、パリ近郊に新データセンターを運営するため8億3000万ドルを借り入れる
Mistral AIは、パリ近郊に約14,000台のNVIDIA GPUを備えたデータセンターを建設するため、8億3000万ドルの借り入れを行った。銀行は支援しているが、まだ利益を上げていない可能性のあるスタートアップにとってリスクは大きい。
VCがAIの次波に数十億ドルを賭ける中、なぜOpenAIはSoraを終了させるのか?
ベンチャーキャピタルがAIの次世代技術に巨額投資を行う一方、OpenAIはSoraプロジェクトを終了させている。記事は、AIインフラ拡大に対する現実世界の抵抗(例:土地所有者の拒否)を指摘し、技術発展と社会的受容の緊張関係を論じている。
Meta、テキサスのAIデータセンター投資を15億ドルから100億ドルに増額
Metaは、テキサスのAIデータセンター投資を15億ドルから100億ドルに増額し、容量を1ギガワットに拡大すると発表した。同社はチームの内部再編も実施している。
OpenAIはSoraを停止、Metaは法廷で排除される
OpenAIはAIモデルSoraの提供を停止し、Metaは法廷で土地取得を拒否された。82歳の女性がAIデータセンター建設の土地売却を拒否した事例が示すように、AIインフラ拡大に対する現実世界の反発が広がっている。
アジア太平洋(ニュージーランド)地域でAmazon Bedrockによる生成AI推論を実行可能に
AWSは、ニュージーランドの顧客が自国のAWSリージョンからAmazon Bedrockの基盤モデルにアクセスできるように、アジア太平洋(ニュージーランド)リージョンで同サービスを提供開始した。
全AIゲートウェイ使用状況の統合レポート
Vercelが、複数のAIプロバイダーに分散する使用データを統合し、請求前に基本的な質問に答えられるようにするAIゲートウェイの統合レポート機能を発表した。
ワット当たり性能の最大化によるトークンファクトリー収益とAI効率の拡大
NVIDIAは、AI時代において電力が最大の制約要因であると指摘し、ワット当たり性能の最適化がAIファクトリーの効率向上と収益拡大に不可欠だと主張している。
マイクロソフト、オラクルとOpenAIが残したテキサスのデータセンターを取得
マイクロソフトが、オラクルとOpenAIが当初建設したテキサス州アビリーンのデータセンターをリース契約したとブルームバーグが報じた。
ベゾスのブルーオリジン、宇宙にAIデータセンターを設置する競争に参入
ブルーオリジンは、AI計算用に5万基以上の衛星を軌道に打ち上げる申請を行い、宇宙空間でのAIデータセンター設置競争に加わった。
サム・アルトマン支援の核融合スタートアップHelion、OpenAIと協議中
核融合スタートアップHelionが、発電出力の12.5%をOpenAIに販売する契約を交渉していると報じられた。
独占取材:AmazonのTrainiumチップラボ、Anthropic・OpenAI・Appleも採用
AmazonはOpenAIに500億ドル投資し、AWSがその中核となるTrainiumチップラボを公開した。同チップはAnthropic、OpenAI、Appleにも採用されている。
GPU性能新ベンチマーク発表
NVIDIAがGPU性能を「光速スコア」で評価する新ベンチマークを発表
AIのスケーリング効率化
AIの応答性と経済性向上には、データ生成源への近接が必要とNVIDIAが指摘
IBMとNVIDIAがAI向けデータ処理を刷新
IBMとNVIDIAがAI時代のデータ処理技術を共同開発中
Nvidia、チップ事業に匹敵する数十億ドル規模の巨大ネットワーク事業を静かに構築中
Nvidiaは、チップ・ゲーム事業ほどの注目を集めていないものの、前四半期に110億ドルを売り上げたネットワーク事業を数十億ドル規模に拡大し、チップ事業と競合する巨大事業を構築している。
ミストラル、欧州で主権AIを開拓
フランスのAI企業ミストラルは、独自のAIスタック、データセンター容量への投資、オープンウェイトのフロンティアモデルを提供し、米国のプロプライエタリAIモデルに代わる選択肢をCIOに提供している。
Niv-AIがステルスモードを脱し、GPUの電力パフォーマンス向上を目指す
Niv-AIが1200万ドルのシード資金を調達し、GPUの電力サージを測定・管理する技術を開発している。
ゴールドマン・サックス、AI投資がデータセンターへシフトすると見通し
ゴールドマン・サックスは、AI投資が初期の興奮を超え、AIシステムを稼働させるデータセンターインフラに焦点を当てる「質への逃避」段階に入ったと分析した。
ベクトル検索エンジンValdの長期運用で見えたパフォーマンス最適化とベストプラクティス
企業がCloud Nativeな近似最近傍探索ベクトル検索エンジン「Vald」を約4年間運用・開発し、得られたパフォーマンス最適化とベストプラクティスを共有している。
NVIDIA Groq 3 LPXの内部:NVIDIA Vera Rubinプラットフォーム向け低遅延推論アクセラレータ
NVIDIAは、NVIDIA Vera Rubinプラットフォーム向けに、低遅延・大規模コンテキスト対応のラックスケール推論アクセラレータ「Groq 3 LPX」を発表した。
NVIDIA Dynamo 1.0が本番規模のマルチノード推論を実現する仕組み
NVIDIAがDynamo 1.0を発表し、大規模化する推論モデルを複数ノードで効率的に実行する本番環境向けソリューションを提供した。
NVIDIA Vera CPU、AIファクトリー向けに高性能・高帯域幅・高効率を実現
NVIDIAがVera CPUを発表し、AIインフラの各層に新たな要件が生じる中、推論モデルのトークン需要増加に対応する高性能・高帯域幅・高効率をAIファクトリー向けに提供する。
NVIDIA Vera Rubin POD:7チップ、5つのラックスケールシステム、1つのAIスーパーコンピューター
NVIDIAは、7つのチップと5つのラックスケールシステムで構成される「Vera Rubin POD」AIスーパーコンピューターを発表した。同システムはトークン駆動型AI処理に最適化されており、急増するトークン消費需要に対応する高性能計算基盤を提供する。
MetaがNebiusにAIインフラに270億ドルを追加投資
MetaがAIインフラ企業Nebiusに270億ドルを追加投資した。これは史上最大級のAIコンピュート契約の一つで、Metaを含むAIベンダーが大量解雇を検討していると報じられる中での契約である。
メタ社、全社員の20%に影響する可能性のある人員削減を検討か
メタ社は、AIインフラやAI関連の買収・採用への積極的な支出を相殺するため、全社員の最大20%に影響する可能性のある人員削減を検討していると報じられた。
OpenAI Responses API 1周年
OpenAIがResponses APIの1周年を発表。ツール連携で応答が行動に変わる。
NVIDIAとthinkymachinesが1GWのVera Rubin展開で提携
NVIDIAがthinkymachinesと提携し、Vera Rubinシステムを1GW以上展開する計画を発表。
シドニーがAnthropicのアジア太平洋地域における4つ目のオフィスに
AI企業Anthropicがシドニーにアジア太平洋地域で4つ目のオフィスを開設することを発表した。同社は地域での事業拡大を進めている。
Nscale、20億ドル追加調達で評価額146億ドルに
急成長中のGPUサービス企業Nscaleが20億ドルの追加資金調達を実施し、評価額が146億ドルに達した。同社はAIインフラ提供企業の新興グループに属している。
NVIDIA Megatron CoreにおけるFalcon-H1ハイブリッドアーキテクチャの実装
NVIDIAが、大規模言語モデル開発の基盤フレームワーク「Megatron Core」に、新しいハイブリッドアーキテクチャ「Falcon-H1」を実装した。この技術は、LLMトレーニングの効率性と拡張性を向上させることを目的としている。
NVIDIA推論転送ライブラリによる分散推論性能の向上
NVIDIAが大規模言語モデルの分散推論を効率化する「推論転送ライブラリ」を発表し、複数GPU間での計算負荷分散とリクエスト処理の最適化を実現した。
ICE収容施設運営会社、AI関連労働者向けキャンプに大きな機会を見出す
AIデータセンター開発企業が、遠隔地の油田労働者向けに普及した男性用キャンプを、AI関連労働者の宿泊施設として活用する動きを強めている。
OpenAIとOracle、電力供給遅延によりテキサスの旗艦データセンター拡張を停止
OpenAIとOracleは、電力供給の遅延によりテキサス州のStargateデータセンター拡張を停止し、代わりにOpenAIは新拠点でNVIDIAの次世代Vera Rubinチップに投資する計画です。
AI GatewayがOpenAIのResponses APIをサポート
OpenAIがResponses APIをAI Gateway経由で利用可能にした。このAPIはChat Completions APIの代替として、TypeScriptとPythonでテキスト生成やストリーミング機能を提供する。
オラクル、AI投資の資金圧迫で数千人の人員削減を計画
オラクル社は、AIデータセンター拡大の巨額コストを管理するため、数千人の人員削減を計画しているとブルームバーグが報じた。
Vercel AI Gatewayでタイムアウトをカスタマイズして自動フェイルオーバーを高速化
VercelがAI Gatewayで推論プロバイダーごとのタイムアウト設定をベータ提供し、設定時間内に応答がない場合に次のプロバイダーへ自動的に切り替えることで、フェイルオーバーを高速化する。
AI Gatewayでプロバイダーごとのカスタムタイムアウト機能が利用可能に
AI Gatewayが推論プロバイダーごとのタイムアウト設定を導入し、応答が遅い場合に次のプロバイダーへ自動的にフェイルオーバーする機能を提供した。現在はBYOK認証でのみベータ版として利用可能。
ジェンセン・フアン氏、NvidiaがOpenAIとAnthropicへの投資を縮小すると発言、説明は疑問を残す
NvidiaのCEOジェンセン・フアン氏が、同社がOpenAIとAnthropicへの投資を縮小し、これが最後の投資になる可能性があると述べた。
現代自動車、韓国でAI・ロボティクス拠点に61億ドルを投資
現代自動車が韓国でAI・ロボティクス拠点に61億ドルを投資することを発表した。投資は5つの分野に分けられ、最大の割合はAIセンターのインフラ整備に充てられる。
NVIDIA、AIインフラ拡大に向けて企業に40億ドル投資
NVIDIAがAIインフラ拡大のために企業に40億ドルを投資する。LumentumとCoherentとの新たな提携は、次世代データセンター向けの高速・高効率技術への需要増を示している。
NVIDIA Run:aiとNIMによるGPU利用率の最大化
NVIDIAは、異なるリソース要件を持つ推論ワークロードに直面する組織向けに、Run:aiとNIMを活用してGPU利用率を最適化するソリューションを提供している。
Nvidia、記録的な設備投資の中で四半期売上高を更新
NVIDIAのCEOがトークン需要の指数関数的増加を指摘し、同社が設備投資拡大中に売上高記録を更新したことを報告。
Cilium 10周年:大規模クラスター向けの強化された暗号化、安全なポリシー、明確な可視性
eBPFベースのネットワーク・セキュリティプロジェクトCiliumが10周年を迎え、バージョン1.19をリリース。大規模クラスター向けに暗号化、ポリシー管理、可視性を強化した機能を提供。