インドでAmazon Bedrock経由でAnthropic Claudeモデルにグローバルなクロスリージョン推論でアクセス可能に
AWSはAmazon BedrockのGlobal cross-Region inference機能を通じて、インドの顧客がAnthropicの最新Claudeモデル(Opus 4.6、Sonnet 4.6、Haiku 4.5)にアクセスできるようにし、大規模トークンコンテキストウィンドウと高度なエージェント機能を提供することで、生成AIアプリケーションのスケーラビリティと信頼性を向上させた。
キーポイント
インド市場向けClaudeモデルの提供開始
Amazon BedrockがGlobal cross-Region inferenceを通じて、インドのap-south-1(ムンバイ)およびap-south-2(ハイデラバード)リージョンの顧客向けにAnthropicのClaude Opus 4.6、Claude Sonnet 4.6、Claude Haiku 4.5モデルを提供開始した。
Global cross-Region inferenceの機能強化
複数のAWSリージョンにまたがる推論処理をシームレスに分散させることで、スループット向上、負荷時の応答性・信頼性確保、運用複雑性の低減を実現する。
技術的特徴と実用性
100万トークンの大規模コンテキストウィンドウと高度なエージェント機能を備え、大規模データセットと複雑なワークフローの高速処理を可能にする。
事業的意義と市場展開
インドにおける生成AIインフラの強化と、企業の大規模生成AIアプリケーション構築・運用の促進を目的とした戦略的展開である。
Global CRISによるクロスリージョン推論
インド(ムンバイ)リージョンからGlobal CRISモデルIDを使用して、他のリージョンでホストされているClaude Opus 4.6モデルにアクセスできる。
Converse APIの簡易インタラクション
Bedrockのconverse APIを使用して、メッセージ配列とモデルIDを指定するだけでClaudeモデルと対話できる。
トークン使用量の取得
応答にはトークン使用量情報が含まれており、入力トークン、出力トークン、合計トークンを確認できる。
影響分析・編集コメントを表示
影響分析
この発表は、AWSがインドという重要な成長市場において生成AIインフラの整備を加速させ、企業の本番環境での大規模AIワークロード運用を支援する戦略的動きを示している。Global cross-Region inferenceの導入により、地域を超えたリソース活用が可能となり、生成AIアプリケーションの性能と可用性が向上することで、企業のAI導入障壁が低減されることが期待される。
編集コメント
AWSの地域別戦略展開として注目されるニュース。インド市場への本格的な生成AIインフラ提供は、同地域のAIエコシステム形成に影響を与える可能性がある。技術的には既存機能の拡張だが、市場アクセス面での意義は大きい。
生成 AI の推論の採用と実装は、組織が生産環境で大規模に AI 機能を活用する運用ワークロードを構築していることで増加しています。顧客が生成 AI アプリケーションの大規模化を実現できるよう支援するため、Amazon Bedrock は クロスリージョン推論 (CRIS) プロファイル を提供しています。CRIS(Cross-Region Inference)は、組織が複数の AWS リージョン に推論処理をシームレスに分散させるために使用できる強力な機能です。この機能により、大規模構築時にスループットを向上させられ、また過負荷時でも生成 AI アプリケーションの応答性と信頼性を維持できます。
Amazon Bedrock のグローバル・クロスリージョン推論(Global cross-Region inference)およびインドにおける Anthropic Claude モデルの提供を開始できることを嬉しく思います。Amazon Bedrock では、現在、インドで事業を展開する顧客向けに、Anthropic の Claude Opus 4.6、Claude Sonnet 4.6、そして Claude Haiku 4.5 を、Amazon Bedrock グローバル・クロスリージョン推論(CRIS)を通じて利用可能にしています。これらの最先端モデルは、100 万トークンという広大なコンテキストウィンドウと高度なエージェント機能を備えており、アプリケーションが膨大なデータセットや複雑なワークフローを、かつてない速度と知能で処理することを可能にします。今回のリリースにより、ap-south-1(ムンバイ)および ap-south-2(ハイデラバード)を利用する顧客は、Amazon Bedrock 上で Anthropic の最新 Claude モデルにアクセスできながら、グローバルな推論容量の恩恵を受け、Amazon Bedrock が管理する高可用性の推論環境を活用できます。グローバル CRIS を利用することで、顧客は推論ワークロードをシームレスにスケールし、レジリエンスを向上させ、運用上の複雑さを削減することが可能です。本記事では、インドにおける Claude モデルに対して Amazon Bedrock のグローバル・クロスリージョン推論をどのように使用するかをご案内します。各 Claude モデルバリアントの機能と、生成 AI アプリケーションの構築をすぐに開始できるよう、コード例を用いた始め方について詳しく解説いたします。
グローバル・クロスリージョン推論のコア機能
グローバル・クロスリージョン推論は、商用 AWS リージョン(AWS GovCloud (US) リージョンおよび中国リージョン以外のリージョン)を含む世界中の推論キャパシティにわたって計算リソースを活用することで、組織が予期せぬトラフィックの急増を管理できるよう支援します。このセクションでは、グローバル・クロスリージョン推論機能の仕組みと、その機能を支える技術的メカニズムについて解説します。
推論プロファイルの理解
グローバル・クロスリージョン推論は、推論プロファイルを通じて提供されます。推論プロファイルは、以下の2 つの主要な概念に基づいて動作します:
- ソースリージョン – API リクエストが送信されるリージョン
- 宛先リージョン – Amazon Bedrock が推論のためにリクエストをルーティングするリージョン
Anthropic モデルを利用するには、Amazon Bedrock は標準でグローバル推論プロファイルを提供しています。例えば:
- Opus 4.6:
- Sonnet 4.6:
- Opus 4.5:
- Sonnet 4.5:
- Haiku 4.5:
BOM (ap-south-1) および HYD (ap-south-2) を利用するインドの顧客の場合、それぞれのソースおよび宛先は以下のようになります:
- ソース -> デスティネーション
BOM (ap-south-1) -> AWS コマーシャルリージョン
HYD (ap-south-2) -> AWS コマーシャルリージョン
地理的クロスリージョン推論とグローバルクロスリージョン推論のどちらを選択するかに関する考慮事項については、Amazon Bedrock ユーザーガイドの Choosing between Geographic and Global cross-Region inference をご覧ください。
グローバルクロスリージョン推論の実装
本日現在、以下のモデルに対してグローバル CRIS (Global Cross-Region Inference: グローバルクロスリージョン推論) を実装することができます。
名称
モデル
推論プロファイル ID
推論処理デスティネーションリージョン
Global Anthropic Claude Opus 4.6
Claude Opus 4.6
global.anthropic.claude-opus-4-6-v1
コマーシャル AWS リージョン
Global Anthropic Claude Sonnet 4.6
Claude Sonnet 4.6
global.anthropic.claude-sonnet-4-6
コマーシャル AWS リージョン
Global Anthropic Claude Haiku 4.5
Claude Haiku 4.5
global.anthropic.claude-haiku-4-5-20251001-v1:0
コマーシャル AWS リージョン
Global Claude Sonnet 4.5
Claude Sonnet 4.5
global.anthropic.claude-sonnet-4-5-20250929-v1:0
コマーシャル AWS リージョン
GLOBAL Anthropic Claude Opus 4.5
Claude Opus 4.5
global.anthropic.claude-opus-4-5-20251101-v1:0
コマーシャル AWS リージョン
例えば、Anthropic の Claude Opus 4.5 でグローバル・クロスリージョン推論を利用するには、以下の主要な手順を完了する必要があります:
- グローバル推論プロファイル ID を使用する – Amazon Bedrock への API コールを行う際は、リージョン固有のモデル ID ではなく、グローバルな Anthropic の Claude Opus 4.5 推論プロファイル ID (global.anthropic.claude-opus-4-5-20251101-v1:0) を指定してください。これは、InvokeModel、InvokeModelWithResponseStream、Converse、および ConverseStream API で動作します。
- IAM 権限を設定する – ユーザーにグローバル・クロスリージョン推論を有効化するには、ロールに対して AWS Identity and Access Management (IAM: アイアム) ポリシーの 3 つの部分からなるポリシーを適用する必要があります。詳細については、「グローバル・クロスリージョン推論用の IAM ポリシーの設定」をご覧ください。
インドの需要ピークシーズンにおけるグローバル・クロスリージョン推論
インドの企業は、トラフィックが集中する期間に特有の課題に直面します。ディワリのショッピング急増、ドゥッセラーの EC 売上急伸、イードの祝祭、クリスマスの行事、納税期限、クリケット大会、顧客エンゲージメントが劇的に高まる祭りシーズンなどです。グローバル・クロスリージョン推論は、インドのお客様に、これらの需要急増を劣化なく処理するために必要なスループット弾力性を提供します。このようなピーク期間中、EC プラットフォーム、フィンテックアプリケーション、カスタマーサービスチャットボットでは、通常時の 3〜5 倍のトラフィックが発生します。グローバル CRIS (Global Cross-Region Inference: グローバル・クロスリージョン推論) を使用すれば、アプリケーションは自動的に AWS コマーシャルリージョン全体にわたる推論キャパシティにアクセスし、以下をサポートします
- お祭りによるショッピングのピーク時でもサービスが中断されない – ディワリ、イード、クリスマス、地域のお祭りなどの期間に、何百万人もの顧客が AI 搭載型製品推奨やカスタマーサポートと同時にやり取りする場合でも対応可能
- 税務申告シーズンにおけるシームレスな処理 – 7 月から 9 月の税務申告期間中に発生する文書分析、フォーム処理、コンプライアンス関連の問い合わせの急増を処理
- お祭りキャンペーンのスケーラビリティ – 容量計画のオーバーヘッドなしで、お祭りの時期に AI ドライブ型のマーケティングキャンペーンを展開可能
- 文化的・スポーツイベント中の事業継続性 – クリケット大会、選挙期間中、および大規模なエンゲージメントの急増を招くその他のイベント中もパフォーマンスを維持
リクエストをグローバルにルーティングすることで、インドの顧客は大幅に拡大された容量プールへのアクセスを得ることができ、地域ごとの 1 分間あたりのトークン数 (TPM: Tokens Per Minute) の制限から、グローバル規模のスループットへと転換します。これは、ビジネスが最も必要とする際に生成 AI アプリケーションが応答性と信頼性を維持することを意味し、手動によるマルチリージョンのオーケストレーションにおける運用複雑さや、顧客に直面するスロットリングエラーのリスクを回避できます。
Amazon Bedrock でのグローバル・クロスリージョン推論 (Global cross-Region inference) を開始するためのステップバイステップガイド:
グローバル・クロスリージョン対応モデルの推論には 2 つのアプローチがあります。これら 2 つのアプローチについて、詳しく解説します。
アプローチ 1: AWS コンソール上のグローバル CRIS モデルを Amazon Bedrock プレイグラウンドを使用して推論する – アジア太平洋(ムンバイ)リージョン
AWS Bedrock プレイグラウンド は、異なる構成パラメータを使用してさまざまなモデルを実験するためのビジュアルインターフェースを提供します。アプリケーションに統合する前にプロンプトを experimentation することで、異なるモデルをテストおよび比較するためにプレイグラウンドを使用できます。
プレイグラウンドの使用を開始するには、以下の手順を実行してください:
- AWS コンソールにログインし、リージョンをアジアパシフィック(ムンバイ)リージョンに選択します。
- Amazon Bedrock コンソールへ移動します。
- 左側のナビゲーションメニューで「Infer」を選択し、「Inference profiles」をクリックします。
- グローバル推論プロファイルは、キーワード「global」から始まります。
- グローバル CRIS を介してモデルを呼び出すためのモデル ID は、システム定義済み推論プロファイルテーブルの対応する「Inference profile ID」列から取得できます。本ブログ記事執筆時点では、Anthropic Claude Opus 4.6、Claude Sonnet 4.6、Claude Haiku 4.5、およびその他のファウンデーションモデルがサポートされています。
- モデル名(例:Global Anthropic Claude Opus 4.6)を選択し、モデル詳細が表示される画面へ移動します。
- 前工程で選択したモデルの推論プロファイル概要を確認します。チャット/テキストプレイグラウンドで推論を実行するには、コンソール内の「Open In Playground」ボタンをクリックしてください。
- Amazon Bedrock のチャット/テキストプレイグラウンドでいくつかのプロンプトを試すことで、モデルの推論を開始できます。
アプローチ 2:プログラムによるグローバル・クロスリージョン推論モデルの活用
グローバルモデルをプログラムから呼び出すには、リアルタイムリクエストには InvokeModel および Converse API を、ストリーミングワークロードには InvokeModelWithResponseStream および ConverseStream API を使用できます。これらの呼び出し API を実証する完全なソースコードは、GitHub リポジトリ aws-samples/sample-amazon-bedrock-global-cris で利用可能です。
Converse API を使用したグローバル・クロスリージョン推論による Anthropic Claude モデルの呼び出し
Converse API を用いて、グローバル.anthropic.claude-opus-4-6-v1 モデルにおけるグローバル・クロスリージョン推論の実装について解説します。統一されたインターフェースを備えた会話型アプリケーションには、Converse API の利用をお勧めします。
import boto3
インド地域(ムンバイ)用の Bedrock クライアントを初期化
bedrock = boto3.client("bedrock-runtime", region_name="ap-south-1")
Claude Opus 4.6 のグローバル CRIS モデル ID
MODEL_ID = "global.anthropic.claude-opus-4-6-v1"
try:
print("Global CRIS を介して Claude Opus 4.6 を呼び出し中...")
簡略化された対話のための Converse API の使用
response = bedrock.converse(
messages=[
{
"role": "user",
"content": [{"text": "クラウドコンピューティングを2文で説明してください。"}],
}
],
modelId=MODEL_ID,
)
# 応答の抽出と表示
response_text = response["output"]["message"]["content"][0]["text"]
print("Response:", response_text)
# トークン使用情報の表示
usage = response.get("usage", {})
print("Tokens used:", usage)
if usage:
print(f"Input tokens: {usage.get('inputTokens', 'N/A')}")
print(f"Output tokens: {usage.get('outputTokens', 'N/A')}")
print(f"Total tokens: {usage.get('totalTokens', 'N/A')}")
except Exception as e:
print(f"Error: {e}")
print("Please check your AWS credentials and region configuration.")
異なる API タイプを使用して、グローバル・クロスリージョン推論(Global Cross-Region Inference)で Anthropic Claude モデルを呼び出すためのコードサンプル
グローバル CRIS モデルに対する InvokeModel、InvokeModelWithResponseStream、Converse および ConverseStream API のコードサンプルは、以下を参照してください:
モデル名
推論プロファイル ID
呼び出し API
GitHub サンプルコード
Global Anthropic Claude Opus 4.6
global.anthropic.claude-opus-4-6-v1
Converse (対話)
ConverseStream (ストリーミング対話)
InvokeModel (モデル呼び出し)
InvokeModelWithResponseStream (レスポンスストリーミング付きモデル呼び出し)
Global Anthropic Claude Sonnet 4.6 (グローバル アンソロピック クロード ソネット 4.6)
global.anthropic.claude-sonnet-4-6
Converse (対話)
<td style="paddi
原文を表示
The adoption and implementation of generative AI inference has increased with organizations building more operational workloads that use AI capabilities in production at scale. To help customers achieve the scale of their generative AI applications, Amazon Bedrock offers cross-Region inference (CRIS) profiles. CRIS is a powerful feature that organizations can use to seamlessly distribute inference processing across multiple AWS Regions. This capability helps you get higher throughput while you’re building at scale and helps keep your generative AI applications responsive and reliable even under heavy load.
We are excited to introduce Global cross-Region inference for Amazon Bedrock and bring Anthropic Claude models in India. Amazon Bedrock now offers Anthropic’s Claude Opus 4.6, Claude Sonnet 4.6, and Claude Haiku 4.5 through Amazon Bedrock Global cross-Region inference (CRIS) for customers operating in India. These frontier models deliver a massive 1-million token context window and advanced agentic capabilities, allowing your applications to process vast datasets and complex workflows with unprecedented speed and intelligence. With this launch, customers using ap-south-1 (Mumbai) and ap-south-2 (Hyderabad) can access Anthropic’s latest Claude models on Amazon Bedrock while benefiting from global inference capacity and highly available inference managed by Amazon Bedrock. With global CRIS, customers can scale inference workloads seamlessly, improve resiliency, and reduce operational complexity. In this post, you will discover how to use Amazon Bedrock’s Global cross-Region Inference for Claude models in India. We will guide you through the capabilities of each Claude model variant and how to get started with a code example to help you start building generative AI applications immediately.
Core functionality of Global cross-Region inference
Global cross-Region inference helps organizations manage unplanned traffic bursts by using compute resources across inference capacity across *commercial AWS Regions (Regions other than the AWS GovCloud (US) Regions and the China Regions)* globally. This section explores how the Global cross-Region inference feature works and the technical mechanisms that power its functionality.
Understanding inference profiles
Global cross-Region inference is offered through Inference profiles. Inference profiles operate on two key concepts:
- Source Region – The Region from which the API request is made
- Destination Region – A Region to which Amazon Bedrock can route the request for inference
To use Anthropic models, Amazon Bedrock offers out of the box Global Inference profiles. For example:
- Opus 4.6:
- Sonnet 4.6:
- Opus 4.5:
- Sonnet 4.5:
- Haiku 4.5:
For customers in India using BOM (ap-south-1) and HYD (ap-south-2), the respective source and destinations would be as follows:
- Source -> Destination
BOM (ap-south-1) -> AWS commercial Regions
- HYD (ap-south-2) -> AWS commercial Regions
For information about considerations for choosing between Geographic and Global cross-Region inference, see Choosing between Geographic and Global cross-Region inference on the Amazon Bedrock User Guide.
Implementing global cross-Region inference
As of today, you can implement global CRIS for the following models.
Name
Model
Inference profile ID
Inference Processing Destination Regions
Global Anthropic Claude Opus 4.6
Claude Opus 4.6
global.anthropic.claude-opus-4-6-v1
Commercial AWS Regions
Global Anthropic Claude Sonnet 4.6
Claude Sonnet 4.6
global.anthropic.claude-sonnet-4-6
Commercial AWS Regions
Global Anthropic Claude Haiku 4.5
Claude Haiku 4.5
global.anthropic.claude-haiku-4-5-20251001-v1:0
Commercial AWS Regions
Global Claude Sonnet 4.5
Claude Sonnet 4.5
global.anthropic.claude-sonnet-4-5-20250929-v1:0
Commercial AWS Regions
GLOBAL Anthropic Claude Opus 4.5
Claude Opus 4.5
global.anthropic.claude-opus-4-5-20251101-v1:0
Commercial AWS Regions
For example, to use Global cross-Region inference with Anthropic’s Claude Opus 4.5, you should complete the following key steps:
- Use the global inference profile ID – When making API calls to Amazon Bedrock, specify the global Anthropic’s Claude Opus 4.5 inference profile ID (global.anthropic.claude-opus-4-5-20251101-v1:0) instead of a Region-specific model ID. This works with InvokeModel, InvokeModelWithResponseStream, and Converse and ConverseStream APIs.
- Configure IAM permissions – To enable Global cross-Region inference for your users, you must apply a three-part AWS Identity and Access Management policy to the role. For more information, see Configuring IAM policy for global cross-Region inference.
Global cross-Region inference for India’s peak demand seasons
Indian enterprises face unique challenges during high-traffic periods. Diwali shopping surges, Dussehra ecommerce spikes, Eid celebrations, Christmas festivities, tax filing deadlines, cricket tournaments, and festival seasons when customer engagement peaks dramatically. Global cross-Region inference provides customers in India with the throughput elasticity needed to handle these demand surges without degradation.During such peak periods ecommerce platforms, fintech applications, and customer service chatbots experience 3-5x the normal traffic. With Global CRIS, your applications automatically access inference capacity across AWS Commercial Regions, helping with
- Uninterrupted service during festival shopping peaks – When millions of customers simultaneously interact with AI-powered product recommendations and customer support, for example, during Diwali, Eid, Christmas, and regional celebrations
- Seamless tax season processing – Handles the surge in document analysis, form processing, and compliance queries during the July-September tax filing periods
- Festival campaign scalability – Deploys AI-driven marketing campaigns during festivals without capacity planning overhead
- Business continuity during cultural and sporting events – Maintains performance during cricket tournaments, election periods, and other events that drive massive engagement spikes
By routing requests globally, customers in India gain access to a significantly larger capacity pool—transforming from Regional Tokens per Minute (TPM) limits to global-scale throughput. This means that your generative AI applications remain responsive and reliable when your business needs them most, without the operational complexity of manual multi-Region orchestration or the risk of customer-facing throttling errors.
Step by step guidance for getting started with inferencing with Global cross-Region inference on Amazon Bedrock:
There are two approaches to infer the Global cross-Region supported models. Let’s understand these approaches in detail.
Approach 1: Inferencing on global CRIS models on AWS Console with Amazon Bedrock playgrounds – Asia Pacific (Mumbai) Region
The Amazon Bedrock playgrounds provide a visual interface to experiment on different models by using different configuration parameters. You can use playgrounds to test and compare different models by experimenting with prompts before integrating them into your application.
To get started using playgrounds, complete the following steps:
- Log in to the AWS Console and select region as Asia Pacific (Mumbai) Region.
- Navigate to Amazon Bedrock console
- On the side navigation menu for Infer, select Inference profiles.
- Global inference profiles will start with the keyword global.
- The model ID to invoke models via global CRIS is obtained via the corresponding Inference profile ID column from the System-defined inference profiles table. At the time of writing this blog post, it supports Anthropic Claude Opus 4.6, Claude Sonnet 4.6, Claude Haiku 4.5, and other foundation models.
- Select the Name of the model for example, Global Anthropic Claude Opus 4.6 and navigate to the screen where you will be shown the model details.
- Review the Inference profile overview of the chosen model from previous step. To perform inference in Chat/Text playground, choose Open In Playground button in the console.
- You can start inferencing the model on Amazon Bedrock chat / text playground, by trying out some prompts
Approach 2: Inferencing global cross-Region inference models programmatically
To invoke the global models programmatically, one can use InvokeModel, ConverseAPI for real-time requests, and InvokeModelWithResponseStream and ConverseStreamAPI for streaming workloads. The full source code demonstrating these invocation APIs is available at the GitHub repository aws-samples/sample-amazon-bedrock-global-cris.
Invoke Anthropic Claude model with global cross-Region inference using Converse API
Let’s understand the implementation of global cross-Region inference on global.anthropic.claude-opus-4-6-v1 model using Converse API. We recommend the Converse API for conversational applications with a unified interface.
import boto3
# Initialize Bedrock client for India region (Mumbai)
bedrock = boto3.client("bedrock-runtime", region_name="ap-south-1")
# Global CRIS model ID for Claude Opus 4.6
MODEL_ID = "global.anthropic.claude-opus-4-6-v1"
try:
print("Invoking Claude Opus 4.6 via Global CRIS...")
# Use Converse API for simplified interaction
response = bedrock.converse(
messages=[
{
"role": "user",
"content": [{"text": "Explain cloud computing in 2 sentences."}],
}
],
modelId=MODEL_ID,
)
# Extract and display response
response_text = response["output"]["message"]["content"][0]["text"]
print("Response:", response_text)
# Display token usage information
usage = response.get("usage", {})
print("Tokens used:", usage)
if usage:
print(f"Input tokens: {usage.get('inputTokens', 'N/A')}")
print(f"Output tokens: {usage.get('outputTokens', 'N/A')}")
print(f"Total tokens: {usage.get('totalTokens', 'N/A')}")
except Exception as e:
print(f"Error: {e}")
print("Please check your AWS credentials and region configuration.")Code samples to invoke the Anthropic Claude model with global cross-Region inference with different API types
The code samples for InvokeModel, InvokeModelWithResponseStream, and Converse and ConverseStream APIs for Global CRIS models can be referenced as follows:
Model name
Inference profile ID
Invocation API
GitHub sample code
Global Anthropic Claude Opus 4.6
global.anthropic.claude-opus-4-6-v1
Converse
ConverseStream
InvokeModel
InvokeModelWithResponseStream
Global Anthropic Claude Sonnet 4.6
global.anthropic.claude-sonnet-4-6
Converse
<td style="paddi
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み