Amazon BedrockでAmazon Nova 1からAmazon Nova 2への移行
AWSはAmazon Bedrock上でNova 1からNova 2 Liteへの移行ガイドを公開し、コンテキストウィンドウの拡大や推論機能の強化など技術的な改善と具体的なAPI変更手順を提示している。
キーポイント
コンテキストウィンドウの大幅拡大
30万トークンから100万トークンへ拡張され、長文ドキュメントの単一リクエスト処理やインコンテキスト学習が強化される。
推論・エージェント機能の統合
Extended Thinking、組み込みWeb検索、コードインタープリタにより、複雑な推論とツール使用ベンチマークの性能が向上する。
階層別移行パスの明確化
Lite、Pro、Premierそれぞれの既存モデルに対応する最適なNova 2 Liteへの移行戦略とAPI変更手順が提供されている。
実装コストの最小化
Converse APIを活用したコード例と移行チェックリストにより、既存アプリケーションへの組み込みが容易になる。
Nova 2 LiteのAPI呼び出しと推論設定
`converse` APIでモデルを呼び出し、`inferenceConfig`により最大トークン数や温度パラメータを指定可能。
Extended thinking機能のデフォルト動作
複雑な問題に対する多段階推論を可能にするが、速度とコストの最適化のためデフォルトは無効。
推論努力レベルの制御
`reasoningConfig`パラメータでLowなどの推論レベルを設定でき、タスクの複雑さに応じて推論深度を調整可能。
影響分析・編集コメントを表示
影響分析
AWSの公式移行ガイドは、既存のNovaユーザーが低コストで高性能モデルへ移行できる道筋を示すことで、クラウドAI利用のハードルを下げている。特に100万トークンコンテキストと推論機能の統合は、エンタープライズ向けドキュメント分析やエージェント開発の標準プロセスを再定義する可能性がある。
編集コメント
公式ブログでは具体的なAPIコード例と移行チェックリストが提供されており、実務レベルでの適用可能性は高い。ただし、ProやPremierユーザーがLiteへ移行する場合は価格と品質のトレードオフを事前にベンチマークで検証する必要がある。
Amazon Bedrock で Amazon Nova 1 モデルを実行中の方であれば、コンテキストウィンドウサイズを拡大したり、推論能力を深化させたり、ウェブ検索やコード実行のための外部ツールを統合したりしたいと考えているかもしれません。Amazon Nova 2 モデルはこれらの制約に対処しつつ、推論、エージェント AI、および ツール使用 ベンチマークにおけるパフォーマンスを向上させます。
Amazon Nova 2 Lite は、問題特定、解決策の完全性、論理的整合性の各ベンチマークでより高いスコアを獲得しながら、大量ワークロードに対する高速な応答時間を維持します。カスタマーサポート自動化、ドキュメント処理、またはエージェント AI アプリケーションに Nova 1 Lite を使用している場合、Nova 2 Lite への移行により、精度とスループットにおいて測定可能な向上が見られるでしょう。本記事では、一般利用が可能で本番環境での使用が準備されている Nova 2 Lite への移行に焦点を当てます。Nova 2 はコンテキストウィンドウを 100 万トークンまで拡張し、より豊かな文脈内学習をサポートするとともに、単一のリクエストでより長いドキュメントの処理を可能にします。また、拡張思考機能、組み込みウェブグラウンディング、およびコードインタープリタへのアクセスも得られます。これらの機能により、最小限のコード変更で既存アプリケーションを強化できます。
本記事では、Amazon Bedrock 上で Nova 1 から Nova 2 への移行方法について解説します。モデルのマッピング、API の変更点、Converse API を使用したコード例、新機能の構成に関するガイダンス、およびユースケースの概要を取り上げます。最後に、移行計画と実行を支援するためのチェックリストを紹介して締めくくります。
移行パス
Nova 1 モデルに対する推奨される移行パスは以下の通りです。Pro および Premier への移行においては、ワークロード上の品質を確認するために拡張思考機能を有効にして評価を行うことをお勧めします。
- Amazon Nova 1 Lite を実行中の方には、移行パスはシンプルです。Nova 2 Lite は直接的なアップグレードであり、入力モダリティ(テキスト、画像、動画)を維持しつつ、拡張思考機能、組み込みツール、そして 300K トークンから 1M トークンへ拡大されたコンテキストウィンドウを追加しています。
- Amazon Nova 1 Pro を実行中の方には、Nova 2 Lite へのアップグレードをお勧めします。これはティアの変更のように見えるかもしれませんが、Nova 2 Lite は競争力のある価格パフォーマンスで推論能力を向上させています。Nova 2 Lite の拡張思考機能と 1M トークンのコンテキストウィンドウを組み合わせることで、以前は Nova 1 Pro のより大きなモデルサイズが必要だったワークロードを処理できるようになります。
- Amazon Nova Premier を実行中の方には、特にエージェント型やツール使用のワークロードにおいて Nova 2 Lite への移行を検討してください。Amazon Nova 2 Technical Report に記載されている通り、Nova 2 Lite はマルチステップ問題解決において Premier を上回り、コストは約 7 分の 1、推論速度は最大 5 倍高速です。拡張思考機能を有効化した Nova 2 Lite でも Premier よりも安価で高速であるため、品質要件を満たすか確認するために、推論の努力レベル全体にわたって評価を行うことをお勧めします。
ユースケースと顧客事例
Nova 2 Lite は re:Invent 2025 で発売されて以来、さまざまなユースケースで利用可能です。Nova 2 Lite は、価格、パフォーマンス、速度の組み合わせを必要とする高スループットアプリケーションの実行に特に優れています。顧客が本番環境で Nova 2 Lite を導入した一般的なユースケースには以下が含まれます:
自然言語処理 (NLP) タスク
Nova 2 Lite は、単純なテキスト予測から論理に基づく推奨まで、多様な自然言語処理 (Natural Language Processing: NLP) タスクに使用されます。Nova 2 モデルは要約、分類、検索ベースのユースケースにおいて卓越した性能を発揮します。Nova 2 Lite の MMLU Pro でのスコアは 80.9%、IF-Bench では 70.8% を記録しており、これらは同等の他モデルと比較しても高い数値です。また、Nova 2 Lite は低遅延を目的として設計されており、多くの NLP タスクで典型的であるような迅速な応答が必要なアプリケーションに適しています。
Siemens のグローバル検索は Nova 2 Lite を実行しており、以前の大型言語モデル (Large Language Model: LLM) ソリューションと比較して、検索速度が 300% 向上し、コストを 70% 削減しました。詳細なケーススタディは AWS ケーススタディ ページでご確認いただけます。
インテリジェントドキュメント処理 (IDP)
推論機能を備えた Nova 2 モデルは、単なるテキスト抽出を超えて文書の真の意味理解を実現することで、IDP(インテリジェント・ドキュメント・プロセッシング)を強化します。これらのモデルは、契約書、請求書、フォーム、レポートなどの非構造化および準構造化コンテンツを処理し、情報がどこに出現しているかだけでなく、文脈において何を意味するのかを判断できます。推論機能により、関連する情報をセクションやページ、表全体で結びつけ、レイアウトや言語のバリエーションに対応し、欠落または暗黙的な詳細を推測することが可能となり、ドキュメント処理をより堅牢かつスケーラブルにします。推論は以下の 4 つの点で価値を追加します。(1) 文脈の理解:例えば、開始日と終了日がどちらも類似したタイムスタンプとして表示されていても、それらを区別する。(2) ページ間での関連付けと推論:例えば、請求書の明細項目を合計額や税金に関連付け、計算を検証する(テキストが判読不能な場合でも小さな穴を埋める)。(3) バリエーションの正規化:「支払金額」、「未払い残高」、「総未払額」を同じ概念として扱う。(4) 検証、異常検知、Q&A などのより賢いアクションの実行:税計算の不整合をフラグ付けしたり、関連セクションから自動更新条項を特定したりする。推論は IDP を文書を理解し検証できる、よりスマートで人間に近いシステムへと変え、より正確な自動化、手動レビューの削減、新しいオントロジーへの迅速な適応を可能にします。
マルチステップ・エージェントワークフロー
Nova 2 Lite は、特に複数のツールがワークフローに含まれる場合において、Nova 1 モデルと比較してツール呼び出し機能に顕著な改善を示しています。全体的に、Nova 2 ファミリーは、洗練されたツール使用と計画能力を備えた複雑な多段階エージェントワークフローの完了において卓越した性能を発揮します。Nova 2 Lite は、τ2-bench Telecom(τ2-bench Telecom)の評価において、76.0% のスコアを獲得し、同等モデルよりも高い成績を収めています。推論機能を有効にした多段階エージェントユースケースのテストをお勧めしますが、その際はまず推論設定を「Low」に設定し、必要に応じて順次引き上げる形で行ってください。
Nova 2 Lite は、Trellix がセキュリティアラートトリアージタスクの自動化を継続し、脅威検出、分析、分類の分野においてセキュリティチームをより効果的に支援することを可能にしました。新モデルのリリースに伴い、Trellix は信頼性の高いツール呼び出し機能(失敗なし)、脅威分類における 39% の精度向上、技術分析を含む 3.4 倍の詳細なレスポンスを実現しました。Trellix の CTO がこのソリューションを解説する動画 をご覧ください。
AWS Transform は、複雑なインフラシステムとコードベースの近代化のために数十種類のツールを使用するマルチエージェント・マルチユーザーシステムです。AWS Transform は、各ユーザーリクエストを複数のエージェント呼び出しおよびツール呼び出しに分解し、コスト、速度、精度のバランスを取るために複数のモデルにルーティングします。評価結果によると、Nova 2 Lite は AWS Transform におけるコード近代化のためのツール呼び出し効率を最大 60% 向上させることが示されました。
何が変わったか
Nova 2 ファミリーは、特にエージェント型 AI ワークロードにおいて、AI アプリケーションを構築する方法を広げる機能を導入しました。
開発者による制御付きの拡張思考機能
Nova 2 Lite は、回答する前に複雑な問題を推論処理できます。推論の深さは、reasoningConfig パラメータ(推論設定パラメータ)を通じて、低・中・高の努力レベルから選択して制御可能です。
ネイティブツール使用機能と組み込みウェブグラウンディング、コードインタプリタ
Nova 2 Lite はツール使用を目的として設計されており、MCP サーバー(モデルコントロールプロトコルサーバー)や並列ツールチェーンのサポートに対応しています。また、引用付きでリアルタイム情報を取得できる組み込みの ウェブグラウンディング と、Python コードを直接実行するための コードインタプリタ を備えています。
大規模入力に対応した拡張コンテキスト
コンテキストウィンドウ(文脈保持領域)が 30 万トークンから 100 万トークンに拡大し、最大出力トーク数も 1 万トークンから 6 万 5 千トークンに増加しました。これらの拡張により、単一のリクエストでより大規模なドキュメントやコードベース、長い多段階ワークフローを処理できるようになりました。
以下の表は、Nova 1 モデルと Nova 2 Lite の技術仕様を要約したものです:
| 仕様 | Nova 1 Lite | Nova 1 Pro | Nova 2 Lite |
|---|---|---|---|
| コンテキストウィンドウ | 300K | 300K | 1M |
| 最大出力トーク数 | 10K | 10K | 65K |
入力モダリティ
テキスト、画像、動画
テキスト、画像、動画
テキスト、画像、動画
拡張思考機能
なし
なし
あり
組み込みツール
なし
なし
あり
カスタマイズ
あり(Nova Forge 含む)
あり(Nova Forge 含む)
あり(Nova Forge 含む)
パフォーマンスと価格
Artificial Analysis による独立したベンチマークによると、Nova 2 Lite は同等モデル群における知能スコアで平均を上回り、特に高速であることが示されています。これにより、スループットが重要な大量処理ワークロードに非常に適しています。エージェント特化型のベンチマークでは、Nova 2 Lite はツール使用(Tau2 Telecom)において良好なパフォーマンスを示します。モデルが多段階計画を確実に実行する必要があるエージェント向けワークロードでは、指示の厳密な遵守が極めて重要です。詳細なベンチマーク手法および追加結果については、Amazon Nova 2 技術報告書 を参照してください。
Nova 2 ファミリーの価格は、各ティア内で競争力のある水準を維持しつつも、拡張された機能を反映した設定となっています。
モデル | 入力(1M トークンあたり) | 出力(1M トークンあたり)
---|---|---
Nova 1 Lite | $0.06 | $0.24
Nova 1 Pro | $0.80 | $3.20
Nova 2 Lite | $0.30 | $2.50
Nova 2 Lite の価格設定は、同クラスの類似モデルと比較して競争力があります。公式発表および詳細については、Amazon Nova 2 発売記事をご覧ください。
API 変更とコード更新
Nova 2 Lite を参照するようモデル ID を更新してください。これは、グローバル・クロスリージョン推論システム (CRIS: Global Cross-Region Inference System)、US CRIS、EU CRIS、JP CRIS エンドポイントを通じて利用可能です。米国リージョンからアクセスする場合は us. プレフィックス(例:us.amazon.nova-2-lite-v1:0)を、米国以外からアクセスする場合は global. プレフィックス(例:global.amazon.nova-2-lite-v1:0)を使用してください。基盤となる API 構造は変更されていないため、モデル ID の更新と、有効化したい新機能のみに対応すれば、既存の統合は最小限の変更で動作します。
破壊的変更: maxReasoningEffort を high に設定した場合、maxTokens、temperature、topP、または topK は使用できません。これらのパラメータを含むリクエストを高努力推論 (reasoning) で実行するとエラーが返されます。これを解決するには、リクエストから inferenceConfig ブロック全体を削除してください。
新機能と変更のない動作
以下の表は、Nova 1 と Nova 2 の間の新機能と変更のない動作を要約したものです:
| カテゴリ | 変更内容 | 詳細 |
|---|
| 新規 | 拡張思考 (Extended thinking) | additionalModelRequestFields 内の reasoningConfig を使用して推論を有効化できます。3 つの努力レベルをサポートします:low、medium、high。
新機能
レスポンスタイプに推論コンテンツを追加
推論機能が有効になっている場合、レスポンスには reasoningContent フィールドが含まれます。コンテンツは [REDACTED] として表示されますが、推論トークンは課金対象となります。
新機能
ビルトインツール
Web グラウンディング(Web grounding)とコードインタープリター(code interpreter)は、外部連携なしで利用可能です。
新機能
出力容量の拡大
最大出力トークン数が 10K から 65,536 に増加しました。
新機能
コンテキストウィンドウの拡張
Nova 2 Lite は 1M トークンをサポートします(Nova 1 Lite の 300K からアップグレード)。
変更なし
topK パラメータの設定場所
topK は引き続き additionalModelRequestFields を経由して渡され、inferenceConfig には含まれません。
変更なし
ドキュメントサポート
ドキュメント入力は依然として Converse API のみ対応です(Invoke API ではサポートされていません)。
変更なし
タイムアウト設定
Boto3 のデフォルト読み込みタイムアウトは 60 秒ですが、拡張思考を伴うリクエストでは最大 60 分かかる場合があります。SDK クライアントで read_timeout=3600 を設定してください。
新しい機能の設定
このセクションでは、基本的な移行手順、拡張思考(extended thinking)の設定方法、および Web グラウンディングやコードインタープリターなどのビルトインツールの使用方法について説明します。
基本移行 – モデル ID の更新
拡張思考を必要としないアプリケーションの場合、移行は非常に簡単です。モデル ID を更新するだけで、既存のコードがそのまま動作します:
import boto3
bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')Nova 1
modelId='us.amazon.nova-lite-v1:0'
Nova 2
response = bedrock.converse(
modelId='us.amazon.nova-2-lite-v1:0',
system=[{'text': 'You are a helpful assistant'}],
messages=[
{
'role': 'user',
'content': [{'text': 'Explain cloud computing in simple terms.'}]
}
],
inferenceConfig={
'maxTokens': 1024,
'temperature': 0.7,
'topP': 0.9
}
)
print(response['output']['message']['content'][0]['text'])
Extended thinking
Extended thinking allows Nova 2 model to reason through complex problems before generating responses. This capability is disabled by default to optimize for speed and cost on simple queries. When your workload requires multi-step reasoning, you can enable it through the reasoningConfig parameter.
Configuring reasoning effort levels
Nova 2 Lite provides three effort levels that control how much reasoning the model performs:
Low effort (maxReasoningEffort: "low") is recommended for tasks with added complexity that benefit from structu
原文を表示
If you’re running Amazon Nova 1 models on Amazon Bedrock, you might be looking to expand your context window size, deepen reasoning capabilities, or integrate external tools for web search and code execution. Amazon Nova 2 models address these constraints while improving performance on reasoning, agentic AI, and tool use benchmarks.
Amazon Nova 2 Lite achieves higher scores across problem identification, solution completeness, and logical coherence benchmarks, while maintaining fast response times for high-volume workloads. If you’re using Nova 1 Lite for customer support automation, document processing, or agentic AI applications, you will likely see measurable gains in accuracy and throughput upon migrating to Nova 2 Lite. This post focuses on migration to Nova 2 Lite, which is generally available and ready for production use. Nova 2 expands the context window to one million tokens, which supports richer in-context learning and allows for processing longer documents in a single request. You also gain access to extended thinking, built-in web grounding, and a code interpreter. These features can enhance your existing applications with minimal code changes.
In this post, you will learn how to migrate from Nova 1 to Nova 2 on Amazon Bedrock. We cover model mapping, API changes, code examples using the Converse API, guidance on configuring new capabilities, and a summary of use cases. We conclude with a migration checklist to help you plan and execute your transition.
Migration paths
The following are recommended migration paths for the Nova 1 models. For Pro and Premier migrations, evaluate with extended thinking enabled to verify quality on your workloads.
- If you’re running Amazon Nova 1 Lite, the migration path is straightforward: Nova 2 Lite is a direct upgrade that maintains the same input modalities (text, image, and video) while adding extended thinking, built-in tools, and a context window that expands from 300K to 1M tokens.
- If you’re running Amazon Nova 1 Pro, we recommend upgrading to Nova 2 Lite. While this might seem like a tier change, Nova 2 Lite delivers improved reasoning capabilities at competitive price-performance. The extended thinking feature in Nova 2 Lite, combined with its 1M token context window, enables it to handle workloads that previously required Nova 1 Pro’s larger model size.
- If you’re running Amazon Nova Premier, consider migrating to Nova 2 Lite, especially for agentic and tool use workloads. As documented in the Amazon Nova 2 Technical Report, Nova 2 Lite surpasses Premier in multi-step problem-solving at 7x lower cost and up to 5x faster inference. Because Nova 2 Lite with extended thinking enabled is still cheaper and faster than Premier, we recommend evaluating across reasoning effort levels to verify that it meets your quality requirements.
Use cases and customer stories
Since Nova 2 Lite launched at re:Invent 2025, you can use the model for a variety of use cases. Nova 2 Lite excels at driving high throughput applications that require a combination of price, performance, and speed. Common use cases that customers have deployed Nova 2 Lite in production include:
Natural Language Processing (NLP) tasks
Nova 2 Lite is used for a wide variety of NLP tasks, from simple text predictors to logic-based recommendations. The Nova 2 models excel at summarization, classification, and search based use cases. Nova 2 Lite scores 80.9% on MMLU Pro and 70.8% on IF-Bench (with both higher than some comparable models). Nova 2 Lite is also designed for low latency, making it suitable for applications requiring rapid responses, as is typical with most NLP tasks.
Siemens global search runs on Nova 2 Lite, providing a 300% improvement in search speed and 70% cost reductions compared to their prior large language model (LLM) solution. The full case study can be found on the AWS case studies page.
Intelligent Document Processing (IDP)
Nova 2 models with reasoning enhance IDP by moving beyond basic text extraction to true semantic understanding of documents. They can process unstructured and semistructured content such as contracts, invoices, forms, and reports, and determine what information means in context, not only where it appears. Reasoning enables these models to link related information across sections, pages, and tables, handle variations in layout and language, and infer missing or implicit details, making document processing more robust and scalable. Reasoning adds value by (1) understanding context. For example, distinguishing a contract’s start date from an end date even if both appear as similar timestamps. (2) linking and inferring across pages. For example, tying invoice line items to totals/taxes and checking the math (even filling small gaps when text is unreadable). (3) normalizing variation—treating “amount payable,” “balance due,” and “total outstanding” as the same concept. (4) enabling smarter actions like validation, anomaly detection, and Q&A—flagging mismatched tax calculations or identifying auto-renewal clauses from related sections. Reasoning turns IDP into a smarter, more human-like system that understands and validates documents, enabling more accurate automation, less manual review, and faster adaptation to new ontology.
Multi-step agentic workflows
Nova 2 Lite shows considerable improvement over the Nova 1 models in tool calling capabilities, especially if multiple tools are part of the workflow. Overall, the Nova 2 family excels at completing complex, multi-step agentic workflows with sophisticated tool use and planning capabilities. Nova 2 Lite scores higher than comparable models in τ2-bench Telecom, at 76.0%. We recommend testing multi-step agentic use cases with reasoning on, starting with reasoning set to “Low” and then working upwards, if required.
Nova 2 Lite has empowered Trellix to continue to automate its security alert triage tasks and better empower security teams, in the areas of threat detection, analysis, and classification. With the release of the new model, Trellix saw more reliable tool calling capabilities with no failures, a 39% accuracy boost in threat classification, and 3.4x more detailed responses with technical analysis. Watch Trellix’s CTO explain the solution in this video.
AWS Transform is a multi-agent, multiuser system that uses dozens of tools to modernize complex infrastructure systems and code bases. AWS Transform breaks down each user request into a number of agent and tool calls that are routed to a mixture of models to balance cost, speed, and accuracy. Evaluations showed that Nova 2 Lite improves tool calling efficiency for code modernization in AWS Transform by up to 60%.
What’s changed
The Nova 2 family introduces capabilities that expand how you can build AI applications, particularly for agentic AI workloads.
Extended thinking with developer controls
Nova 2 Lite can reason through complex problems before responding. You control the depth of reasoning through the reasoningConfig parameter with low, medium, or high effort levels.
Native tool use and built-in web grounding and code interpreter
Nova 2 Lite is designed for tool use, including support for MCP servers and parallel tool chaining. It also includes built-in web grounding for real-time information with citations and a code interpreter for executing Python code directly.
Extended context for large-scale inputs
The context window expands from 300K to 1M tokens, and maximum output tokens increase from 10K to 65K. With these increases, you can process larger documents, code bases, and longer multi-turn workflows in a single request.
The following table summarizes the technical specifications across Nova 1 models and Nova 2 Lite:
Specification
Nova 1 Lite
Nova 1 Pro
Nova 2 Lite
Context Window
300K
300K
1M
Max Output Tokens
10K
10K
65K
Input Modalities
Text, image, video
Text, image, video
Text, image, video
Extended Thinking
No
No
Yes
Built-in Tools
No
No
Yes
Customization
Yes (incl. Nova Forge)
Yes (incl. Nova Forge)
Yes (incl. Nova Forge)
Performance and pricing
Independent benchmarks from Artificial Analysis show that Nova 2 Lite scores above average on intelligence among comparable models and is notably fast, making it well-suited for high-volume workloads where throughput matters. On agentic-specific benchmarks, Nova 2 Lite performs well on Tool Use (Tau2 Telecom). Strong instruction following is critical for agentic workloads where the model must reliably execute multi-step plans. For detailed benchmark methodology and additional results, see the Amazon Nova 2 Technical Report.
Pricing for the Nova 2 family reflects the expanded capabilities while remaining competitive within their respective tiers.
Model
Input (per 1M tokens)
Output (per 1M tokens)
Nova 1 Lite
$0.06
$0.24
Nova 1 Pro
$0.80
$3.20
Nova 2 Lite
$0.30
$2.50
For Nova 2 Lite, pricing is competitive against similar models in its class. For the full announcement and additional details, see the Amazon Nova 2 launch post.
API changes and code updates
Update your model ID to reference Nova 2 Lite, which is available through Global Cross-Region Inference System (CRIS), US CRIS, EU CRIS, and JP CRIS endpoints. When accessing models from a US region, use the us. prefix (for example, us.amazon.nova-2-lite-v1:0); when accessing from outside the US, use the global. prefix (for example, global.amazon.nova-2-lite-v1:0). The underlying API structure remains consistent, so existing integrations will work with minimal changes beyond the model ID and any new features that you choose to enable.
Breaking change: When maxReasoningEffort is set to high, you cannot use maxTokens, temperature, topP, or topK. Requests that include these parameters with high effort reasoning will return an error. To resolve this, remove the inferenceConfig block entirely from your request.
New features and unchanged behaviors
The following table summarizes new features and unchanged behaviors between Nova 1 and Nova 2:
Category
Change
Details
New
Extended thinking
Enable reasoning using reasoningConfig in additionalModelRequestFields. Supports three effort levels: low, medium, and high.
New
Reasoning content in responses
Responses include a reasoningContent field when reasoning is enabled. Content displays as [REDACTED] but reasoning tokens are billed.
New
Built-in tools
Web grounding and code interpreter are available without external integrations.
New
Increased output capacity
Maximum output tokens increased from 10K to 65,536.
New
Expanded context window
Nova 2 Lite supports 1M tokens (up from 300K in Nova 1 Lite).
Unchanged
topK parameter location
topK is still passed through additionalModelRequestFields, not inferenceConfig.
Unchanged
Document support
Document input is still Converse API only (not supported in Invoke API).
Unchanged
Timeout configuration
Boto3’s default read timeout is 60 seconds, but extended thinking requests can take up to 60 minutes. Configure read_timeout=3600 in your SDK client.
Configuring new capabilities
This section covers the basic migration steps, extended thinking configuration, and how to use built-in tools like web grounding and code interpreter.
Basic migration – update the model ID
For applications that do not require extended thinking, the migration is straightforward. Update the model ID and your existing code will work:
import boto3
bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')
# Nova 1
# modelId='us.amazon.nova-lite-v1:0'
# Nova 2
response = bedrock.converse(
modelId='us.amazon.nova-2-lite-v1:0',
system=[{'text': 'You are a helpful assistant'}],
messages=[
{
'role': 'user',
'content': [{'text': 'Explain cloud computing in simple terms.'}]
}
],
inferenceConfig={
'maxTokens': 1024,
'temperature': 0.7,
'topP': 0.9
}
)
print(response['output']['message']['content'][0]['text'])Extended thinking
Extended thinking allows Nova 2 model to reason through complex problems before generating responses. This capability is disabled by default to optimize for speed and cost on simple queries. When your workload requires multi-step reasoning, you can enable it through the reasoningConfig parameter.
Configuring reasoning effort levels
Nova 2 Lite provides three effort levels that control how much reasoning the model performs:
Low effort (maxReasoningEffort: "low") is recommended for tasks with added complexity that benefit from structu
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み