#コスト効率化 のAIニュース
5件の記事
Elastic Build Machinesが正式リリース
Vercelは、Elastic Build Machinesを全Pro・Enterprise顧客向けに正式リリースし、新規Proチームのデフォルト設定とした。プロジェクトごとに最適なマシンを割り当てることで、ベータ期間中に約80%のプロジェクトでコスト削減を実現した。
Vercel Blog·4月14日
アドバイザー戦略:エージェントに知能ブーストを与える
OpenAIが、AIエージェントにアドバイザー戦略を導入し、複雑なタスクの実行能力を向上させる手法を発表した。
Claude Blog·4月9日·★★★★
Kimi API:90%のキャッシュヒット率で価格を25%に削減
月之暗面(Moonshot AI)は、Kimi K2.5多モーダルモデルのAPI価格が、90%のキャッシュヒット率により標準価格の25%相当まで実質的に低下することを明らかにした。これは、同社が清華大学と共同開発した推論アーキテクチャ「Mooncake」による技術的成果である。
月之暗面 Kimi·2月27日·★★★★
SambaNovaのAI市場における戦略的動き
SambaNovaはインテルと提携し、市場が複雑な多段階推論へ移行する中で、コスト効率の高いAI推論システムを提供することを目指している。
AI Business·2月27日
Amazon SageMaker AIとAmazon BedrockでvLLMを使用して数十のファインチューニングモデルを効率的に提供
vLLMでMixture of ExpertsモデルのマルチLoRA推論を実装し、カーネルレベルの最適化を行い、効率的なモデル提供方法を解説。GPT-OSS 20Bを例に使用。
AWS Machine Learning Blog·2月26日·★★★★