Composer 2の紹介
Cursor社は、CursorBenchで高い結果を示し、トークン効率が向上し、より高速なデフォルトバリアントを備えた次世代AIコーディングツール「Composer 2」を発表した。
キーポイント
性能向上
CursorBenchでフロンティアレベルのコーディング性能を達成し、従来モデルよりも優れた結果を示している。
効率性の改善
トークン使用効率が高められ、同じ処理により少ないリソースで実行できるようになった。
速度の向上
より高速なデフォルトバリアントが提供され、開発者のワークフローが加速される。
影響分析・編集コメントを表示
影響分析
この発表は、AI支援コーディングツール市場における競争を激化させる可能性がある。Cursorが自社のベンチマークで優れた結果を示すことで、開発者ツールの性能基準を再定義し、開発者の生産性向上に直接寄与する実用的な進化と言える。
編集コメント
製品アップデートの発表であり、具体的な技術詳細や比較データが限られているため、業界全体への影響は現時点では限定的と評価。今後の実運用での検証が待たれる。
最先端レベルのコーディング性能を備え、強力なCursorBenchスコア、より高いトークン効率、そしてより高速なデフォルトモデルを実現しています。
原文を表示
Composer 2 is now available in Cursor.
It's frontier-level at coding and priced at $0.50/M input and $2.50/M output tokens, making it a new, optimal combination of intelligence and cost. We also released a technical report on how we trained it.
Frontier-level coding intelligence
We're rapidly improving the quality of our model. Composer 2 delivers large improvements on all benchmarks we measure, including Terminal-Bench 2.01 and SWE-bench Multilingual:
ModelCursorBenchTerminal-Bench 2.0SWE-bench MultilingualComposer 261.361.773.7Composer 1.544.247.965.9Composer 138.040.056.9
These quality improvements come from our first continued pretraining run, which provides a far stronger base to scale our reinforcement learning.
From this base, we train on long-horizon coding tasks through reinforcement learning. Composer 2 is able to solve challenging tasks requiring hundreds of actions.
Try Composer 2
Composer 2 is priced at $0.50/M input and $2.50/M output tokens.
There is also a faster variant with the same intelligence at $1.50/M input and $7.50/M output tokens, which has a lower cost than other fast models2. We're making fast the default option. See our model docs for full details.
On individual plans, Composer usage is part of a standalone usage pool with generous usage included. Try Composer 2 today in Cursor or in the early alpha of our new interface.
Terminal-Bench 2.0 is an agent evaluation benchmark for terminal use maintained by the Laude Institute. Anthropic model scores use the Claude Code harness and OpenAI model scores use the Simple Codex harness. Our Cursor score was computed using the official Harbor evaluation framework (the designated harness for Terminal-Bench 2.0) with default benchmark settings. We ran 5 iterations per model-agent pair and report the average. More details on the benchmark can be found at the official Terminal Bench website. For other models besides Composer 2, we took the max score between the official leaderboard score and the score recorded running in our infrastructure. ↩Tokens per second (TPS) for all models are from a snapshot of Cursor traffic on March 18th, 2026. Token sizing for Composer and GPT models are similar. Anthropic tokens are ~15% smaller and the TPS number is normalized to reflect that. Similarly, output token price for non-Anthropic models was scaled to match the same ~15% change. Speed may vary depending on provider capacity and improvements over time. ↩
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み