AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
阶跃星辰·2026年4月2日 14:46·約3分で読める

階躍 Step 3.5 Flash シリーズ新登場!全 Step Plan ユーザーが体験可能に!

#LLM#エージェント最適化#推論コスト削減#API互換#階跃星辰
TL;DR

阶跃星辰が既存のStep 3.5 Flashモデルを最適化し、Agentワークフロー向けに低コスト・高速な「low think mode」を追加した新バージョン「Step 3.5 Flash 2603」を全プランユーザーに公開した。

AI深層分析2026年4月2日 21:41
3
注目/ 5段階
深度40%
3
関連度30%
4
実用性20%
3
革新性10%
2

キーポイント

1

「low think mode」の新規実装とコスト削減効果

複雑な推論を不要なタスクに適用せず、トークン消費を最大56%削減しながら出力効率を向上させる新モードを追加。

2

Agentおよびコーディングワークフローの最適化

高頻度・低複雑度のAgentタスク向けに訓練を最適化し、エラー自動修正機能や処理速度の大幅向上を実現。

3

OpenAI/Anthropic互換APIの提供と即座の利用開始

既存の開発者向けAPI仕様に準拠した設定例を公開し、Step Planユーザーはモデル名の変更だけで即時利用可能。

影響分析・編集コメントを表示

影響分析

本リリースは、LLMの「性能競争」から「運用効率とコスト最適化」へのシフトを象徴する。特にエージェント開発が本格化する中で、推論コストを制御しつつ実用性を維持できる「low think mode」の採用は、企業級AIアプリケーションの普及を後押しする。開発者は既存のAPI互換性を活かして低リスクで移行でき、業界全体のAgent最適化トレンドに貢献する。

編集コメント

既存のAPI互換性を維持しつつ推論コストを制御できるのは、実務開発者にとって大きなメリットだ。今後は同様の「推論効率化」アプローチが業界標準となり、エージェント開発のハードルが一層下がるだろう。

階躍 Step 3.5 Flash シリーズ新モデル登場!全Step Planユーザーが今すぐ体験可能!

原创 阶跃星辰 2026-04-02 13:46 北京

imageimage

より高速に、より使いやすく、よりAgent-nativeに

階躍星辰の最新モデル「Step 3.5 Flash 2603」が、正式にリリースされました。全てのStep Planユーザーにご利用いただけます。ぜひお試しください!

このモデルはStep 3.5 Flashの最適化版であり、高い応答速度と低コストという優位性を引き継ぎつつ、以下の体験向上を実現しました。

新たに「low think mode」を追加し、関連するシナリオでのトークン消費をさらに削減、出力効率を向上させます。

CodingフレームワークとAgentフレームワーク向けに最適化された学習を行い、対応する体験、安定性、トークン効率を高めています。

当社のテストによると、Step 3.5 Flash 2603は、デフォルトの推論モード(high)では、推論スコアはほぼ同等を維持しつつ、トークン消費が14%低減されました。「low think mode」(低推論モード)に切り替えると、トークン消費は56%も削減されます。

当社は、OpenClawユーザーがAIを利用する方法が独特であることに気づきました。特にAgentシナリオでは、頻度が高いものの複雑さは高くないタスクが大量に存在します。賢明なユーザーはすでに「必要に応じて使い分け」を行っています。複雑な部分には大型モデルを、中間ステップや高頻度タスクには軽量モデルを使用するのです。あらゆるリクエストに「深く考えさせる」必要はありません。

この観察に基づき、当社は元来、高速性で知られるStep 3.5 Flashの基盤をさらに発展させ、推論効率と柔軟性を向上させました。「速さの上にさらなる速さ」を実現し、知性を犠牲にすることはありませんでした。

初期テストユーザーからのフィードバックがこれを裏付けています。

知性がむしろ向上し、複雑なタスクを処理する際には、単にエラーを指摘するだけでなく、自らエラーを修正するようになりました。

あるAgentエコシステムパートナーによるモデル評価では、Step 3.5 Flashは高頻度Agentシナリオにおいて速度優位性が顕著で、総所要時間が他の評価対象モデルの半分に留まりました。

今すぐ使う

Step 3.5 Flash 2603は、全てのStep Planユーザーにご利用いただけます。

Step Planをご契約後、通常の方法でこのモデルをお使いいただけます。モデルを「step-3.5-flash-2603」に切り替えるだけです。以下に、OpenAI Chat Completions APIとAnthropic Messages APIを使用して思考強度を設定する例を示します。

openai-style

{

"model": "step-3.5-flash-2603",

"messages": [

{

"role": "system",

"content": "You are a helpful assistant. Be concise, accurate, and structured."

},

{

"role": "user",

"content": "请解释为什么企业级 AI 应用里,延迟、稳定性和成本往往比单次回答的极限能力更重要。"

}

],

"temperature": 0,

"max_tokens": 250000,

"reasoning_effort": "low"

}anthropic-style

{

"model": "step-3.5-flash-2603",

"max_tokens": 250000,

"thinking": {

"type": "enabled",

"budget_tokens": 10000

},

"output_config": {

"effort": "low"

},

"messages": [

{

"role": "user",

"content": "请简单介绍一下阶跃星辰。"

}

]

}

ぜひ、Step 3.5 Flash 2603をたくさんお試しください👇🏻

platform.stepfun.com/step-plan/

また、以下のQRコードをスキャンして当社の開発者コミュニティにご参加いただき、公式スタッフや他の開発者と交流することもできます。

image
image

WeChatで開く

原文を表示

原创 阶跃星辰 2026-04-02 13:46 北京

imageimage

更快、更好用、更加 Agent-native

阶跃星辰最新模型 Step 3.5 Flash 2603,现已上线。面向所有 Step Plan 用户开放,欢迎体验!

这款模型是 Step 3.5 Flash 的优化版本,在延续高响应速度与低成本优势的基础上,带来以下体验提升:

新增 low think mode,可进一步降低相关场景下的 token 消耗并提升输出效率。

针对 Coding 框架与 Agent 框架进行优化训练,提升相应体验、稳定性和 token 效率。

从我们的测试来看,Step 3.5 Flash 2603 在默认推理模式(high)下,推理分数基本持平,token 消耗降低了 14%;切换到 low think mode(低推理模式)后,token 消耗则降低了 56%。

我们发现,OpenClaw 用户使用 AI 的方式与众不同——尤其在 Agent 场景中,大量任务频率高但复杂度并不高。聪明的用户已经在做“按需分配”:复杂环节用重型模型,中间步骤和高频任务用轻量模型。没必要让每一个请求都去“深度思考”。

基于这一观察,我们在原本就以快见长的 Step 3.5 Flash 基础上,进一步提升了推理效率与灵活性——做到“快上加快”,且没有以牺牲智力为代价。

早期测试用户的反馈印证了这一点:

智能程度反而提高了,处理复杂任务时会主动修复报错,而非只是提示错误。

在某 Agent 生态伙伴的模型评测中,Step 3.5 Flash 在高频 Agent 场景中速度优势明显,总耗时仅为其他参评模型的一半。

马上使用

Step 3.5 Flash 2603 已向所有 Step Plan 用户开放。

在订阅 Step Plan 后,您可以按照正常的方式使用这款模型,只需要切换模型为step-3.5-flash-2603。以下是使用OpenAI Chat Completions API 和 Anthropic Messages API 配置思考强度的示例。

openai-style

{

  "model": "step-3.5-flash-2603",

  "messages": [

    {

      "role": "system",

      "content": "You are a helpful assistant. Be concise, accurate, and structured."

    },

    {

      "role": "user",

      "content": "请解释为什么企业级 AI 应用里,延迟、稳定性和成本往往比单次回答的极限能力更重要。"

    }

  ],

  "temperature": 0,

  "max_tokens": 250000,

  "reasoning_effort": "low"

}anthropic-style

{

  "model": "step-3.5-flash-2603",

  "max_tokens": 250000,

  "thinking": {

    "type": "enabled",

    "budget_tokens": 10000

  },

  "output_config": {

    "effort": "low"

  },

  "messages": [

    {

      "role": "user",

      "content": "请简单介绍一下阶跃星辰。"

    }

  ]

}

欢迎大家多多体验 Step 3.5 Flash 2603👇🏻

platform.stepfun.com/step-plan/

也可扫描以下二维码加入我们的开发者社区,与官方小伙伴及更多开发者交流~

image
image

跳转微信打开

この記事をシェア

関連記事

Sebastian Raschka★42026年6月6日 20:16

LLM 研究論文:2026 年 1 月から 5 月のリスト

Sebastian Raschka が、2026 年上半期(1 月〜5 月)に注目すべき大規模言語モデル関連の研究論文を選定し、一覧として公開した。

Latent Space★42026年6月6日 13:34

[AINews] 今日特に大きな出来事はありませんでした

Latent Space が運営するニュースレター「AINews」が、6月4日から5日にかけてのAI業界動向を12件のRedditスレッドや544件のTwitter投稿から選別して紹介しました。記事ではRL環境ガイドの推奨や、DeepSeek v4 Pro向けの最適化に関するリモートポッドの更新について言及しています。

Latent Space★42026年6月5日 15:44

[AINews] 今日は何も大きな出来事はありませんでした

Anthropic が RSI の兆候を示し、OpenAI の ChatGPT が月間アクティブユーザー数で 10 億人を突破。SpaceX AI は IPO について説明しているが、最も重要なのは AIE WF のチケット確保とイベント参加である。

ニュース一覧に戻る元記事を読む