2025年で最も閲覧されたブログ記事トップ10
Amazon Science は 2025 年の注目記事として、時系列予測の革新である Chronos-2 の発表や量子チップ Ocelot の開発など、AI と計算科学における重要な進展を総括した。
キーポイント
時系列予測の基盤モデル進化:Chronos-2
従来の単一変数予測から脱却し、任意の時系列タスクをゼロショットで処理できる「Chronos-2」が発表され、Hugging Face でのダウンロード数は過去 6 億回を超えている。
多変量・共変量対応による予測精度向上
複数の時系列を同時に予測する機能や、天候や販促スケジュールなどの外部要因(共変量)を取り込むことで、クラウド運用や小売需要予測など実社会での応用範囲が拡大した。
グループアテンション機構による冷戦開始対応
時系列間およびグループ間の複雑な相互作用を捉える「グループアテンション」を採用し、歴史的データが少ない場合でも高精度な予測を可能にする技術的革新が実現された。
量子コンピューティングの進展:Ocelot チップ
2025 年の注目点として、特定の計算タスクにおいて指数関数的な高速化を実現する可能性がある「Ocelot」量子チップの開発発表が含まれている。
Ocelot量子チップの革新的なエラー訂正
「猫量子ビット」に基づくボソニック量子エラー訂正を採用し、従来の数千倍の物理量子ビットを必要とするアプローチに対し、9つの量子ビットで同等のエラー訂正を実現しました。
アジェンティックAIにおけるエージェント間通信
人間との対話には自然言語を使用しつつ、エージェント同士の効率的な情報共有にはニューラルネットワークのネイティブ言語である「埋め込みベクトル」を活用する未来が提案されています。
Mitra: 合成データによる表計算モデルの革新
Amazon の研究者が開発した Mitra は、現実世界のデータ不足を補うため、構造的因果モデルや木ベース手法を用いた合成データで事前学習された表計算ファウンデーションモデルです。
影響分析・編集コメントを表示
影響分析
この記事は、時系列分析の分野が単なる統計的推測から、汎用的な深層学習基盤モデルへと移行した決定的な転換点を示しています。特に、外部要因を統合できる多変量予測機能の実装は、クラウドインフラ管理やサプライチェーン最適化など、大規模システムにおける意思決定の質と速度を根本的に向上させる可能性があります。また、量子チップの開発発表は、計算科学のフロンティア拡大に対する Amazon の継続的な投資意欲を示しており、長期的な技術競争力の強化が期待されます。
編集コメント
2025 年の技術動向を象徴する記事であり、時系列予測の文脈における「基盤モデル」の実用化が現実のものとなったことを示す重要な指標です。
2025年に最も閲覧されたブログ記事トップ10
量子コンピューティングの飛躍的進歩やロボティクスの基盤モデルから、Amazon Auroraの進化、エージェントAIの進展まで、2025年に読者の注目を集めた記事をご紹介します。
シェア シェア リンクをコピー
Chronos-2の紹介:単変量予測から汎用予測へ
時系列予測は、単一時系列から外挿する従来の統計的手法を超え、基盤モデルの登場によって変革を遂げています。Hugging Faceから6億回以上ダウンロードされた初代Chronosモデルの成功を基に、Amazonの研究者はChronos-2を紹介します。これは、インコンテキスト学習(ICL)を通じて任意の予測タスクをゼロショットで処理するように設計されています。
Chronos-2の完全なパイプライン。入力時系列(ターゲットと共変量)は、まずロバストなスケーリング方式で正規化され、その後、時間インデックスとマスクメタ特徴が追加されます。得られたシーケンスは重複しないパッチに分割され、残差ネットワークを介して高次元埋め込みにマッピングされます。コアのトランスフォーマースタックはこれらのパッチ埋め込みを処理し、入力でマスクされた将来のパッチに対応するマルチパッチ分位点出力を生成します。各トランスフォーマーブロックは、時間注意層とグループ注意層を交互に実行します。時間注意層は単一時系列内のパッチ間で情報を集約し、グループ注意層は各パッチインデックスにおいてグループ内の全系列間で情報を集約します。図は、それぞれ既知の共変量を1つ持つ2つの多変量時系列を示しており、対応するグループが青と赤で強調されています。この例は説明のみを目的としており、Chronos-2は任意の数のターゲットとオプションの共変量をサポートします。
単変量予測のみをサポートした前身モデルとは異なり、Chronos-2は複数の共進化する時系列を共同で予測(多変量予測)し、プロモーションスケジュールや気象条件などの外部要因を組み込む(共変量を考慮した予測)ことができます。例えば、クラウド運用チームはCPU使用率、メモリ消費量、ストレージI/Oをまとめて予測でき、小売業者は需要予測時に計画されたプロモーションを考慮に入れることができます。このモデルのグループ注意メカニズムにより、変数間の複雑な相互作用を捉えることが可能になり、利用可能な履歴データが限られるコールドスタートシナリオで特に価値があります。
Amazon、Ocelot量子チップを発表
量子コンピューティングは長らく、特定の問題に対して指数関数的に高速な計算を約束してきましたが、量子デバイスの環境ノイズに対する極度の感度が実用的な応用を制限してきました。Amazon Web Servicesの新しいOcelotチップは、この課題に取り組む上での画期的進展を表しています。Ocelotは、シュレーディンガーの有名な思考実験にちなんで名付けられた「猫量子ビット」に基づく、ボソン量子誤り訂正を使用します。
Ocelot論理量子ビットメモリチップを構成する一対のシリコンマイクロチップ。
従来の量子誤り訂正手法では、使用可能な誤り率を達成するために論理量子ビットあたり数千の物理量子ビットが必要であり、膨大なリソースオーバーヘッドが生じていました。Ocelotの革新的なアーキテクチャは、ビット反転誤りを物理レベルで指数的に抑制しつつ、単純な反復符号を使用して位相反転誤りを訂正します。このアプローチにより、ビット反転時間は約1秒に近づき(従来の超伝導量子ビットの1000倍以上長い)、誤り訂正に十分な位相反転時間を維持します。その結果、距離5の誤り訂正符号は合計わずか9量子ビットで実現され、同等の表面符号実装に必要な49量子ビットと対照的です。
エージェントAIの科学的フロンティア
エージェントAIシステムが概念から現実へと移行するにつれて、これらのシステムがどのように情報を共有し、戦略的に相互作用すべきかについての根本的な科学的疑問が生じています。Amazon Scholarのマイケル・カーンズは、ユーザーに代わって自律的に行動できるAIエージェントの開発を形作るいくつかの研究フロンティアを探求します。
興味深い疑問の一つは、エージェント同士がどのような言語を話すかです。エージェントは人間と自然言語で通信しなければなりませんが、エージェント間通信は、ニューラルネットワークのネイティブな「言語」である埋め込み(意味が表現空間内のベクトルとして表現される)の方がより効率的かもしれません。今日のウェブサイトが複数の人間の言語でコンテンツを提供しているように、コンテンツが標準化された埋め込みに事前翻訳される「エージェント的ウェブ」が見られるかもしれません。
この例では、赤、緑、青の点は、3人(アリス、ボブ、クリス)が食事をしたレストランの3次元埋め込みです。(対照的に、実世界の埋め込みは数百次元を持つかもしれません。)各輝く点はクラスターの1つの中心を表し、その値は対応する人物のレストラン選好を要約しています。AIエージェントは、テキストではなく、このようなベクトル表現を使用してお互いに情報を共有することができます。
コンテキスト共有は別の課題を提示します。エージェントは、ワーキングメモリを共有する利点とプライバシーの懸念のバランスを取らなければなりません。あなたの旅行代理店がホテル予約サービスと交渉するとき、あなたの選好についてどの程度のコンテキストを共有すべきか、また、どの程度の財務情報を保留すべきでしょうか。
Mitra:表形式基盤モデルを強化する混合合成事前分布
大規模言語モデルが多様なテキストコーパスで訓練される方法に着想を得て、Amazonの研究者は、合成データセットのみで事前学習された表形式基盤モデルであるMitraを開発しました。これは直感に反するように思えるかもしれませんが、実世界の表形式データはしばしば限定的で不均一であるため、広範な可能なデータ分布をカバーする多様なパターンをシミュレートする方がより実用的です。
Mitraの背後にある重要な洞察は、合成事前分布の品質がモデルの汎化性能を決定するということです。効果的な事前分布は、実タスクで良好なパフォーマンスをもたらし、過学習を防ぐための多様性を示し、他では見られない独自のパターンを提供します。Mitraの訓練混合には、因果依存関係のグラフと確率的方程式を組み合わせた構造的因果モデル、および勾配ブースティング、ランダムフォレスト、決定木などの人気のある木ベースの手法が含まれています。
Mitraフレームワークの概要。構造的因果モデルや木ベースモデルを含む合成データ事前分布の混合で表形式基盤モデル(TFM)を事前学習します。各データセットはサポートセットとクエリセットに分割されます。Mitraは、行と列にわたる2次元注意と、行単位の1次元注意の両方をサポートします。推論時には、モデルは実データセットからのサンプル例を条件とし、勾配更新なしでインコンテキスト学習(ICL)を使用してクエリラベルを予測します。
AutoGluon 1.4の一部としてリリースされたMitraは、インコンテキスト学習を通じて最先端のパフォーマンスを示しています。適度な数の例を条件とすることで、勾配更新やタスク固有の訓練を必要とせずに、新しいデータセットのラベルを予測することができます。
データベース革新の10年:Amazon Auroraの物語
Amazon Auroraが2015年にローンチされたとき、それはM
原文を表示
The 10 most viewed blog posts of 2025
From quantum computing breakthroughs and foundation models for robotics to the evolution of Amazon Aurora and advances in agentic AI, these are the posts that captured readers' attention in 2025.
Share Share Copy link
Introducing Chronos-2: From univariate to universal forecasting Time series forecasting has undergone a transformation with the emergence of foundation models, moving beyond traditional statistical methods that extrapolate from single time series. Building on the success of the original Chronos models — which have been downloaded over 600 million times from Hugging Face — Amazon researchers introduce Chronos-2, designed to handle arbitrary forecasting tasks in a zero-shot manner through in-context learning (ICL).
The complete Chronos-2 pipeline. Input time series (targets and covariates) are first normalized using a robust scaling scheme, after which a time index and mask meta features are added. The resulting sequences are split into non-overlapping patches and mapped to high-dimensional embeddings via a residual network. The core transformer stack operates on these patch embeddings and produces multi-patch quantile outputs corresponding to the future patches masked out in the input. Each transformer block alternates between time and group attention layers: the time attention layer aggregates information across patches within a single time series, while the group attention layer aggregates information across all series within a group at each patch index. The figure illustrates two multivariate time series with one known covariate each, with corresponding groups highlighted in blue and red. This example is for illustration purposes only; Chronos-2 supports arbitrary numbers of targets and optional covariates.
Unlike its predecessors, which supported only univariate forecasting, Chronos-2 can jointly predict multiple coevolving time series (multivariate forecasting) and incorporate external factors like promotional schedules or weather conditions (covariate-informed forecasting). For example, cloud operations teams can forecast CPU usage, memory consumption, and storage I/O together, while retailers can factor in planned promotions when predicting demand. The model's group attention mechanism enables it to capture complex interactions between variables, making it particularly valuable for cold-start scenarios where limited historical data is available.
Amazon announces Ocelot quantum chip Quantum computing has long promised exponentially faster computation for certain problems, but quantum devices’ extreme sensitivity to environmental noise has limited practical applications. Amazon Web Services' new Ocelot chip represents a breakthrough in addressing this challenge. Ocelot uses bosonic quantum error correction based on "cat qubits", named after Schrödinger's famous thought experiment.
The pair of silicon microchips that compose the Ocelot logical-qubit memory chip.
Traditional quantum error correction methods require thousands of physical qubits per logical qubit to achieve usable error rates, creating an enormous resource overhead. Ocelot's innovative architecture exponentially suppresses bit-flip errors at the physical level while using a simple repetition code to correct phase-flip errors. This approach achieves bit-flip times approaching one second — more than a thousand times longer than conventional superconducting qubits — while maintaining phase-flip times sufficient for error correction. The result is a distance-5 error-correcting code requiring only nine qubits total, versus 49 qubits for equivalent surface code implementations.
Scientific frontiers of agentic AI As agentic AI systems move from concept to reality, fundamental scientific questions emerge about how these systems should share information and interact strategically. Amazon Scholar Michael Kearns explores several research frontiers that will shape the development of AI agents capable of acting autonomously on users' behalf.
One intriguing question is what language agents will speak to each other. While agents must communicate with humans in natural language, agent-to-agent communication might be more efficient in the native "language" of neural networks: embeddings, where meanings are represented as vectors in a representational space. Just as websites today offer content in multiple human languages, we may see an "agentic Web" where content is pretranslated into standardized embeddings.
In this example, the red, green, and blue points are three-dimensional embeddings of restaurants at which three people (Alice, Bob, and Chris) have eaten. (A real-world embedding, by contrast, might have hundreds of dimensions.) Each glowing point represents the center of one of the clusters, and its values summarize the restaurant preferences of the corresponding person. AI agents could use such vector representations, rather than text, to share information with each other.
Context sharing presents another challenge: agents must balance the benefits of sharing working memory with privacy concerns. When your travel agent negotiates with a hotel booking service, how much context about your preferences should it share — and how much financial information should it withhold?
Mitra: Mixed synthetic priors for enhancing tabular foundation models Inspired by how large language models are trained on diverse text corpora, Amazon researchers developed Mitra, a tabular foundation model pretrained entirely on synthetic datasets. While this may seem counterintuitive, real-world tabular data is often limited and heterogeneous, making it more practical to simulate diverse patterns that cover a wide range of possible data distributions.
The key insight behind Mitra is that the quality of synthetic priors determines how well the model generalizes. Effective priors yield good performance on real tasks, exhibit diversity to prevent overfitting, and offer unique patterns not found elsewhere. Mitra's training mixture includes structural causal models — which combine graphs of causal dependencies with probabilistic equations — and popular tree-based methods like gradient boosting, random forests, and decision trees.
Overview of the Mitra framework. We pretrain tabular foundation models (TFMs) on a mixture of synthetic data priors, including structural causal models and tree-based models. Each dataset is split into support and query sets. Mitra supports both 2-D attention across rows and columns and 1-D row-wise attention. At inference, the model conditions on support examples from real datasets to predict query labels using in-context learning (ICL) without gradient updates.
Released as part of AutoGluon 1.4, Mitra demonstrates state-of-the-art performance through in-context learning: it can predict labels for new datasets when conditioned on a moderate number of examples, without requiring gradient updates or task-specific training.
A decade of database innovation: The Amazon Aurora story When Amazon Aurora launched in 2015, it promised to combine the cost effectiveness of MySQL with the performance of high-end commercial databases. The key innovation was decoupling computation from storage, a departure from traditional database architectures.
By moving durability concerns to a separate, purpose-built storage service and offloading caching and logging layers to a scale-out, self-healing system, Aurora addressed the central constraint in cloud computing: the network. This service-oriented architecture protects databases from performance variance and failures while enabling independent scaling of performance, availability, and durability.
In their 2017 paper, Amazon researchers describe the architecture of Amazon Aurora.
Over the past decade, Aurora has continued to evolve. Aurora Serverless, introduced in 2018, brought on-demand autoscaling that lets customers adjust computational capacity based on workload needs, using sophisticated resource management techniques including oversubscription, reactive control, and distributed decision making. As of May 2025, all Aurora offerings are now serverless: customers no longer need to choose specific server types or worry about underlying hardware, patching, or backups.
Lightweight LLM for converting text to structured data Converting unstructured or poorly structured data into clean, schema-compliant records is a critical task across domains from healthcare to e-commerce. While large language models can perform this task when prompted with schema specifications, this approach has drawbacks: high costs at scale, complex prompts, and limitations on the complexity of the schemas.
In a pair of recent papers, Amazon researchers introduced SoLM (the structured-object language model), a lightweight specialized model trained to generate objects in specific schemas using a novel self-supervised denoising method. Rather than training SoLM on clean examples, the researchers take existing structured records, introduce artificial noise, and train the model to recover the original forms. By making the noise increasingly aggressive — even completely removing structure or randomly shuffling tokens — the researchers enhance the model’s quality and teach it to operate on completely unstructured input.
A key innovation is confidence-aware substructure beam search (CABS), which applies beam search at the level of key-value pairs rather than individual tokens, using a separately trained confidence model to predict each pair's probability. This approach dramatically improves accuracy while mitigating hallucination risks.
Using generative AI to do multimodal information retrieval Traditional embedding-based information retrieval compares a query vector to every possible response vector in a database, a time-consuming process as datasets grow. Amazon's GENIUS (generative universal multimodal search) model takes a different approach: instead of comparing vectors, it uses input queries to directly generate ID codes for data items.
With embedding-based retrieval (a), a text embedding must be compared to every possible image embedding, or vice versa. With generative retrieval (b and c), by contrast, a retrieval model generates a single ID for each query. With GENIUS (c), the first digit of the ID code indicates the modality of the output.
Presented at CVPR 2025, GENIUS is a multimodal model whose inputs and outputs can be any combination of images, texts, or image-text pairs. Two key innovations enable GENIUS's performance. The first is semantic quantization, where IDs are generated piecemeal, with each new ID segment focusing in more precisely on the target data item's location in the representational space. The second is query augmentation, which generates additional
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み