#コスト効率 のAIニュース
7件の記事
OpenAI、GPT-5.6 シリーズの限定プレビューを開始
OpenAI は、主力モデル「Sol」を含む GPT-5.6 シリーズ(Sol, Terra, Luna)の限定プレビューを開始し、今後数週間で一般提供予定であることを発表した。
Simon Willison Blog·6月27日·★★★★★
マイクロソフトのMAI-Transcribe-1、前モデルより2.5倍高速で1時間あたり0.36ドルで音声文字起こしを提供
マイクロソフトがMAI-Transcribe-1を発表した。このモデルは、25言語で背景ノイズがあっても正確に音声をテキストに変換し、前モデルより2.5倍高速で1時間あたり0.36ドルのコストで動作する。マイクロソフトは既に自社製品でこのモデルを使用している。
The Decoder·4月3日
NVIDIAの極限共同設計が新たなMLPerf推論記録を達成
NVIDIAは、ハードウェア・ソフトウェア・モデルの共同設計により、AIファクトリーの最高スループットと最低トークンコストを実現し、MLPerf推論ベンチマークで新記録を樹立した。
NVIDIA Developer Blog·4月2日·★★★★
Cursorが中国のオープンソースKimi K2.5を基盤に新コーディングモデルを静かに構築
Cursor社がソフトウェア開発向けAIモデル「Composer 2」をリリースした。同モデルは中国のオープンソースKimi K2.5を基盤に構築され、AnthropicやOpenAIの主要コーディングモデルと同等の性能を低コストで実現することを目指している。
The Decoder·3月21日
Cursor社、競合の1割のコストで同等性能のコード専用モデル「Composer 2」を発表
Cursor社がソフトウェア開発向けAIモデル「Composer 2」を発表した。このモデルはAnthropicとOpenAIの主要コーディングモデルと同等の性能を、大幅に低いコストで実現することを目指している。
The Decoder·3月20日
分散型サービングから推測作業を排除
NVIDIAが、大規模言語モデルの高性能かつコスト効率の良いサービングにおける分散型アーキテクチャの最適化手法を提案し、推測作業を減らす技術を発表した。
NVIDIA Developer Blog·3月10日·★★★★
Gemini 3.1 Flash-Lite:大規模な知能処理のために構築
Googleが、Gemini 3シリーズで最速かつ最もコスト効率の高いモデル「Gemini 3.1 Flash-Lite」を発表した。
Google DeepMind·3月4日·★★★★