メインコンテンツへスキップ

#コスト効率化 のAIニュース

5件の記事

Elastic Build Machinesが正式リリース

Vercelは、Elastic Build Machinesを全Pro・Enterprise顧客向けに正式リリースし、新規Proチームのデフォルト設定とした。プロジェクトごとに最適なマシンを割り当てることで、ベータ期間中に約80%のプロジェクトでコスト削減を実現した。

Vercel Blog·4月14日

アドバイザー戦略:エージェントに知能ブーストを与える

OpenAIが、AIエージェントにアドバイザー戦略を導入し、複雑なタスクの実行能力を向上させる手法を発表した。

Claude Blog·4月9日·★★★★

Kimi API:90%のキャッシュヒット率で価格を25%に削減

月之暗面(Moonshot AI)は、Kimi K2.5多モーダルモデルのAPI価格が、90%のキャッシュヒット率により標準価格の25%相当まで実質的に低下することを明らかにした。これは、同社が清華大学と共同開発した推論アーキテクチャ「Mooncake」による技術的成果である。

月之暗面 Kimi·2月27日·★★★★

SambaNovaのAI市場における戦略的動き

SambaNovaはインテルと提携し、市場が複雑な多段階推論へ移行する中で、コスト効率の高いAI推論システムを提供することを目指している。

AI Business·2月27日

Amazon SageMaker AIとAmazon BedrockでvLLMを使用して数十のファインチューニングモデルを効率的に提供

vLLMでMixture of ExpertsモデルのマルチLoRA推論を実装し、カーネルレベルの最適化を行い、効率的なモデル提供方法を解説。GPT-OSS 20Bを例に使用。

AWS Machine Learning Blog·2月26日·★★★★