#cost optimization のAIニュース
11件の記事
Workflow SDK が実行およびステップペイロードの圧縮に対応
Vercel は Workflow SDK のベータ版で、zstd を用いた自動圧縮機能を導入した。これにより、特に AI 会話の JSON データなどで保存領域とコストが最大 85% 削減され、処理速度も向上する。
Claude Code とローカルモデルの組み合わせ
2026 年において、コード補完やリファクタリングなどの日常タスクには、ゼロコストでレート制限のない量子化されたローカルモデルが十分機能し、実用ケースの大半をカバーできるとしている。
Vercel、Pro および新 Enterprise ユーザー向けに関数呼び出し課金を単価制へ移行
Vercel は Pro および新規 Enterprise カスタマーに対し、パッケージベースの課金から単位ごとの課金(1 回あたり 0.0000006 ドル)へ移行すると発表した。現在の請求サイクル終了までは従来料金を維持し、次期から使用量に連動した課金体系となる。
Opus 4.8 (4 minute read)
Claude Opus 4.8 の紹介
Anthropic が、同社の最上位モデル「Claude Opus」の最新バージョンである「4.8」を発表しました。
React Native 向け高速・特化型モデル「Apex」の紹介
TLDR AI は、アーキテクチャ判断やフレームワーク固有の問題修正を分析してアプリ構築を行う React Native 特化型コーディングモデル「Apex」を発表しました。この最適化されたモデルは特定領域で性能対コスト比を大幅に改善し、現在選定チーム限定のプライベートベータ版として提供されています。
Uber 社長、AI 投資の正当性が困難だと指摘
Uber のアンドリュー・マクドナルド社長は、同社が 2026 年の AI 予算を 4 ヶ月で使い果たしたにもかかわらず、Claude Code などの利用増加と明確な収益向上の関連が見られないとし、今後の AI 投資の正当性を疑問視していると語った。
AI Gateway の生産性インデックス
Vercel が提供する AI Gateway は、数百のモデルにまたがる実アプリケーションやエージェントを通じて、毎週新モデルが発表される業界において、実際の稼働負荷に基づいた独自の指標を示している。Anthropic が単価の高さにもかかわらず支出で首位を維持し、Google がリードする状況が確認された。
AWS Inferentia2 上でペット行動検出を行うビジョン言語モデルの低コスト展開
台湾のペットテック企業トムファン(Furbo)は、AWS Inferentia2 を活用し、視覚と言語を組み合わせた AI モデルを低コストで展開することで、ペットカメラによるリアルタイムな行動検知を実現した。
SERHANT.の迅速なAIイテレーションのためのプレイブック
SERHANT.は、Next.jsとVercelを基盤に、OpenAI、Claude、Geminiをタスク別に使い分けることでAI開発を効率化し、内部パイロットから800〜900人以上の不動産エージェントに拡大した。
限られたデータでの学習 第2部:アクティブラーニング
教師あり学習では高品質なラベルが重要だが、収集コストが高い。アクティブラーニングは、限られた予算でラベル付けリソースを活用し、データ不足を補う手法である。本記事は限られたラベルデータへの対応策の第2部として、人間のラベリング作業を一部含むアプローチについて解説する。