階躍 Step 3.5 Flash シリーズ新登場!全 Step Plan ユーザーが体験可能に!
阶跃星辰が既存のStep 3.5 Flashモデルを最適化し、Agentワークフロー向けに低コスト・高速な「low think mode」を追加した新バージョン「Step 3.5 Flash 2603」を全プランユーザーに公開した。
キーポイント
「low think mode」の新規実装とコスト削減効果
複雑な推論を不要なタスクに適用せず、トークン消費を最大56%削減しながら出力効率を向上させる新モードを追加。
Agentおよびコーディングワークフローの最適化
高頻度・低複雑度のAgentタスク向けに訓練を最適化し、エラー自動修正機能や処理速度の大幅向上を実現。
OpenAI/Anthropic互換APIの提供と即座の利用開始
既存の開発者向けAPI仕様に準拠した設定例を公開し、Step Planユーザーはモデル名の変更だけで即時利用可能。
影響分析・編集コメントを表示
影響分析
本リリースは、LLMの「性能競争」から「運用効率とコスト最適化」へのシフトを象徴する。特にエージェント開発が本格化する中で、推論コストを制御しつつ実用性を維持できる「low think mode」の採用は、企業級AIアプリケーションの普及を後押しする。開発者は既存のAPI互換性を活かして低リスクで移行でき、業界全体のAgent最適化トレンドに貢献する。
編集コメント
既存のAPI互換性を維持しつつ推論コストを制御できるのは、実務開発者にとって大きなメリットだ。今後は同様の「推論効率化」アプローチが業界標準となり、エージェント開発のハードルが一層下がるだろう。
階躍 Step 3.5 Flash シリーズ新モデル登場!全Step Planユーザーが今すぐ体験可能!
原创 阶跃星辰 2026-04-02 13:46 北京
image
より高速に、より使いやすく、よりAgent-nativeに
階躍星辰の最新モデル「Step 3.5 Flash 2603」が、正式にリリースされました。全てのStep Planユーザーにご利用いただけます。ぜひお試しください!
このモデルはStep 3.5 Flashの最適化版であり、高い応答速度と低コストという優位性を引き継ぎつつ、以下の体験向上を実現しました。
新たに「low think mode」を追加し、関連するシナリオでのトークン消費をさらに削減、出力効率を向上させます。
CodingフレームワークとAgentフレームワーク向けに最適化された学習を行い、対応する体験、安定性、トークン効率を高めています。
当社のテストによると、Step 3.5 Flash 2603は、デフォルトの推論モード(high)では、推論スコアはほぼ同等を維持しつつ、トークン消費が14%低減されました。「low think mode」(低推論モード)に切り替えると、トークン消費は56%も削減されます。
当社は、OpenClawユーザーがAIを利用する方法が独特であることに気づきました。特にAgentシナリオでは、頻度が高いものの複雑さは高くないタスクが大量に存在します。賢明なユーザーはすでに「必要に応じて使い分け」を行っています。複雑な部分には大型モデルを、中間ステップや高頻度タスクには軽量モデルを使用するのです。あらゆるリクエストに「深く考えさせる」必要はありません。
この観察に基づき、当社は元来、高速性で知られるStep 3.5 Flashの基盤をさらに発展させ、推論効率と柔軟性を向上させました。「速さの上にさらなる速さ」を実現し、知性を犠牲にすることはありませんでした。
初期テストユーザーからのフィードバックがこれを裏付けています。
知性がむしろ向上し、複雑なタスクを処理する際には、単にエラーを指摘するだけでなく、自らエラーを修正するようになりました。
あるAgentエコシステムパートナーによるモデル評価では、Step 3.5 Flashは高頻度Agentシナリオにおいて速度優位性が顕著で、総所要時間が他の評価対象モデルの半分に留まりました。
今すぐ使う
Step 3.5 Flash 2603は、全てのStep Planユーザーにご利用いただけます。
Step Planをご契約後、通常の方法でこのモデルをお使いいただけます。モデルを「step-3.5-flash-2603」に切り替えるだけです。以下に、OpenAI Chat Completions APIとAnthropic Messages APIを使用して思考強度を設定する例を示します。
openai-style
{
"model": "step-3.5-flash-2603",
"messages": [
{
"role": "system",
"content": "You are a helpful assistant. Be concise, accurate, and structured."
},
{
"role": "user",
"content": "请解释为什么企业级 AI 应用里,延迟、稳定性和成本往往比单次回答的极限能力更重要。"
}
],
"temperature": 0,
"max_tokens": 250000,
"reasoning_effort": "low"
}anthropic-style
{
"model": "step-3.5-flash-2603",
"max_tokens": 250000,
"thinking": {
"type": "enabled",
"budget_tokens": 10000
},
"output_config": {
"effort": "low"
},
"messages": [
{
"role": "user",
"content": "请简单介绍一下阶跃星辰。"
}
]
}
ぜひ、Step 3.5 Flash 2603をたくさんお試しください👇🏻
platform.stepfun.com/step-plan/
また、以下のQRコードをスキャンして当社の開発者コミュニティにご参加いただき、公式スタッフや他の開発者と交流することもできます。
WeChatで開く
原文を表示
原创 阶跃星辰 2026-04-02 13:46 北京
image
更快、更好用、更加 Agent-native
阶跃星辰最新模型 Step 3.5 Flash 2603,现已上线。面向所有 Step Plan 用户开放,欢迎体验!
这款模型是 Step 3.5 Flash 的优化版本,在延续高响应速度与低成本优势的基础上,带来以下体验提升:
新增 low think mode,可进一步降低相关场景下的 token 消耗并提升输出效率。
针对 Coding 框架与 Agent 框架进行优化训练,提升相应体验、稳定性和 token 效率。
从我们的测试来看,Step 3.5 Flash 2603 在默认推理模式(high)下,推理分数基本持平,token 消耗降低了 14%;切换到 low think mode(低推理模式)后,token 消耗则降低了 56%。
我们发现,OpenClaw 用户使用 AI 的方式与众不同——尤其在 Agent 场景中,大量任务频率高但复杂度并不高。聪明的用户已经在做“按需分配”:复杂环节用重型模型,中间步骤和高频任务用轻量模型。没必要让每一个请求都去“深度思考”。
基于这一观察,我们在原本就以快见长的 Step 3.5 Flash 基础上,进一步提升了推理效率与灵活性——做到“快上加快”,且没有以牺牲智力为代价。
早期测试用户的反馈印证了这一点:
智能程度反而提高了,处理复杂任务时会主动修复报错,而非只是提示错误。
在某 Agent 生态伙伴的模型评测中,Step 3.5 Flash 在高频 Agent 场景中速度优势明显,总耗时仅为其他参评模型的一半。
马上使用
Step 3.5 Flash 2603 已向所有 Step Plan 用户开放。
在订阅 Step Plan 后,您可以按照正常的方式使用这款模型,只需要切换模型为step-3.5-flash-2603。以下是使用OpenAI Chat Completions API 和 Anthropic Messages API 配置思考强度的示例。
openai-style
{
"model": "step-3.5-flash-2603",
"messages": [
{
"role": "system",
"content": "You are a helpful assistant. Be concise, accurate, and structured."
},
{
"role": "user",
"content": "请解释为什么企业级 AI 应用里,延迟、稳定性和成本往往比单次回答的极限能力更重要。"
}
],
"temperature": 0,
"max_tokens": 250000,
"reasoning_effort": "low"
}anthropic-style
{
"model": "step-3.5-flash-2603",
"max_tokens": 250000,
"thinking": {
"type": "enabled",
"budget_tokens": 10000
},
"output_config": {
"effort": "low"
},
"messages": [
{
"role": "user",
"content": "请简单介绍一下阶跃星辰。"
}
]
}
欢迎大家多多体验 Step 3.5 Flash 2603👇🏻
platform.stepfun.com/step-plan/
也可扫描以下二维码加入我们的开发者社区,与官方小伙伴及更多开发者交流~
跳转微信打开
関連記事
LLM 研究論文:2026 年 1 月から 5 月のリスト
Sebastian Raschka が、2026 年上半期(1 月〜5 月)に注目すべき大規模言語モデル関連の研究論文を選定し、一覧として公開した。
[AINews] 今日特に大きな出来事はありませんでした
Latent Space が運営するニュースレター「AINews」が、6月4日から5日にかけてのAI業界動向を12件のRedditスレッドや544件のTwitter投稿から選別して紹介しました。記事ではRL環境ガイドの推奨や、DeepSeek v4 Pro向けの最適化に関するリモートポッドの更新について言及しています。
[AINews] 今日は何も大きな出来事はありませんでした
Anthropic が RSI の兆候を示し、OpenAI の ChatGPT が月間アクティブユーザー数で 10 億人を突破。SpaceX AI は IPO について説明しているが、最も重要なのは AIE WF のチケット確保とイベント参加である。