#クラウドインフラ のAIニュース
76件の記事
信頼性の欠陥:Coinbase のグローバル取引サービスに自動化されたゾーンフェイルオーバーがない
Gergely が執筆した記事で、5 月 7 日の夜に Coinbase の取引が約 10 時間停止し、自動化されたゾーンフェイルオーバー機能の欠如が原因だったと指摘している。
カスタム OIDC トークン聴衆のサポート開始
Vercel は、OIDC 発行者にカスタム聴衆(audience)の指定機能を追加しました。これにより、デプロイメントが特定の第三者プロバイダ向けにトークンを要求できるようになり、サービス間認証のセキュリティが向上します。
Amazon、AIチップ販売でNvidiaに直接挑戦する方針
Amazonは自社開発のAIチップを販売することで、市場を支配するNvidiaに対してより直接的な競争を仕掛ける計画である。
AI 企業が公開市場へ急ぐ中、誰が同行するのか?
TechCrunch AI は、人工知能企業の上場競争が激化する中で、投資家や関連業界がどのような影響を受けるかについて分析している。
Lovable、Google Cloud と複数年契約を締結し利用量を5倍に拡大へ
AI アプリ開発プラットフォーム「Lovable」が Google Cloud と複数年契約を結び、クラウド利用量を5倍に増やす方針であることを関係者が明らかにした。
機械のためにインターネットが再構築されている
TechCrunch AI は、AI や機械が効率的にアクセス・処理できるよう、現在のインターネットインフラを根本から再設計する動きについて報じています。
Amazonにとって朗報、Snowflake が AWS と AI CPU チップ向けに 60 億ドルの契約を締結
データウェアハウス企業 Snowflake は、AWS と AI 処理用 CPU チップに関する 60 億ドル規模の提携契約を正式に締結した。これにより Amazon のクラウド事業が強化される見込みである。
Google Cloud、豪州の取引ファンドのインフラを削除
Google Cloud は豪州の1240億ドル規模のファンドからデータを誤って削除したが、サードパーティ製のバックアップにより被害は免れた。同社CEOが責任を認め、地域複製機能でも削除を防げなかったことを認めた。
コードオレンジ:小規模障害対策完了によりクラウドフレアネットワークが強化
クラウドフレアは過去2四半期にわたり「コードオレンジ」と呼ぶ内部プロジェクトを通じてインフラの耐障害性とセキュリティを向上させる取り組みを行い、11月18日の障害回避に必要な作業を完了した。
マイクロソフトとオープンエイトの新たな提携契約の内容解説
マイクロソフトとオープンエイトは、長年の複雑な関係を経て今週、新たな提携契約を結ぶことで合意しました。両社は経営陣の対立やインフラをめぐる不満など過去の緊張関係を乗り越え、AI 分野での協力体制を再構築します。
シャットダウン、停電、紛争:2026年第1四半期のインターネット障害レビュー
2026年第1四半期、ウガンダやイランで政府主導のインターネット遮断が顕著だった。キューバでは電力網崩壊による障害も発生し、ウクライナでは軍事行動が接続を妨害した。
OpenAI、マイクロソフトとの独占提携を終了
OpenAIはマイクロソフトと改定契約を結び、Azure以外のクラウドでも製品を提供可能になった。2032年までマイクロソフトはOpenAIの知財利用権を保持するが、他社クラウドへの展開が可能となった。
マイクロソフトとOpenAIの著名なAGI協定が終了
マイクロソフトはOpenAIとの長期契約を変更し、人工知能の汎用化(AGI)に関する条項を正式に削除した。OpenAIは引き続きマイクロソフトの主要なクラウドパートナーであり、製品は優先的に提供される。
GitHub ActionsのOIDCトークンにおけるsubjectクレームの不変化
GitHubは、新規リポジトリのOIDCトークンsubjectクレームに変更不可能な識別子を追加し、クラウド連携セキュリティを強化した。これによりリポジトリ名再利用時のなりすましリスクを解消する。
オーストリアのアルプスに初データセンター:Googleが投資
Googleはオーストリア・クロンストルフに初のデータセンターを開設し、100人の直接雇用を生み出すと発表した。
Google Cloud、Nvidia対抗の新型AIチップ2つを発表
Googleは従来比で高速・低価格な新型TPU2つを公開した。ただし、当面はクラウド事業においてNvidia製チップも併用する。
Google Cloud Next 2026で披露された注目のスタートアップ企業
Googleは年次カンファレンス「Google Cloud Next 2026」で、多数のAIスタートアップ企業を展示し、自社クラウドの利用促進を図った。
アンストロピック、アマゾンから50億ドルの投資を受け、同社のチップ購入に充てる
アマゾンはAIスタートアップのアンストロピックに対し、追加で50億ドルを出資した。これにより、同社は最大5ギガワットのAIチップを購入し、人気AIモデル「Claude」の学習と運用を支援する。
AnthropicとAmazon、最大5ギガワットの新たなコンピュート供給で提携を拡大
AnthropicとAmazonは、最大5ギガワットの新たな計算資源(コンピュート)供給で提携を拡大する。
Cloudflare Email Service:パブリックベータ版開始、エージェント対応準備完了
CloudflareがEmail Serviceのパブリックベータ版を開始した。同サービスは、アプリケーションやAIエージェントが誰でも持つメールアドレスを通じて、カスタムチャットアプリ不要で双方向通信を可能にする。
Solid Queueのパフォーマンス特性に関する検証と考察
ゲームサービス事業本部の三軒家氏が、Ruby on RailsプロダクトのジョブキューシステムをSolid Queueに移行するプロジェクトを推進し、負荷試験で1000 job/sのスループットを安定処理できる性能を確認した。
Amazon SageMaker HyperPodで推論を実行するためのベストプラクティス
Amazon SageMaker HyperPodは、生成AI推論のための基盤モデルをデプロイ・スケーリングする際の課題(インフラ構築の複雑さ、予測不能なトラフィック、GPUリソース管理の負荷)に対処するベストプラクティスを提供する。
異常アラートが一般提供開始
Observability Plus利用チームは、アプリケーションで異常が検出されるとアラートを受け取り、予期せぬ動作を迅速に特定・調査・解決できるようになる。
信頼性向上のためのSLI/SLO活用vol.1 - SLI/SLOフレームワークおよびサービス稼働状況確認ツール「LINE Status」開発記
LINEのSREチームが、サービス信頼性向上のためにSLI/SLOフレームワークを導入し、サービス稼働状況確認ツール「LINE Status」を開発したことを報告している。
2026年度 新卒研修「サイバーエージェントのデータベース活用事例とパフォーマンス調査入門」
サイバーエージェントのService Reliability Groupが、2026年度新卒研修で自社のデータベース活用事例とパフォーマンス調査の基礎を紹介する。
エージェントウィークへようこそ
Cloudflareが「エージェントウィーク」を開始し、AI時代に対応したインターネットとクラウドの構築に取り組むことを発表した。同社は、現在のインターネットとクラウドがAI時代に適していないと指摘している。
GitHub Copilot Pro+の新制限導入とOpus 4.6 Fastの廃止について
GitHubは、Copilot Pro+の高負荷使用によるインフラ負担を軽減するため、新たな利用制限を導入し、Opus 4.6 Fastモデルを廃止する。これにより、全ユーザーに高速で信頼性の高いサービス提供を目指す。
Actionsワークフローの再実行は50回に制限
GitHubは、システム負荷軽減のため、Actionsワークフローの再実行回数を50回に制限した。この制限を超えるとチェックスイートが失敗する。
異常アラート設定が利用可能に
Vercelが、アプリケーションの異常な急増やエラーを監視するための詳細なアラート設定機能を提供し、プロジェクトやメトリクス、HTTPステータスコードなどをカスタマイズできるようになった。
CloudflareがEmDashを発表:WordPressの後継を目指すTypeScript CMS
Cloudflareは、サーバーレスで開発者向けのアーキテクチャを採用したオープンソースCMS「EmDash」をプレビュー公開した。WordPressからの移行パスやAI機能を備え、WordPressの「精神的な後継」と位置付けている。
GitHub可用性レポート:2026年3月
GitHubは2026年3月に4件の障害を経験し、3月3日には約1時間半にわたりgithub.com、API、GitHub Actionsなどのサービスで最大40%のリクエスト失敗が発生した。
Anthropic、インフラ問題解決のためマイクロソフトのAzure AI責任者を採用
Anthropicは、マイクロソフトの上級幹部であるEric Boydを新たなインフラ責任者として採用した。Bloombergが報じた。
GitHub Actionsのカスタムランナーイメージが一般提供開始
GitHubが、ホスト型ランナー向けのカスタムイメージの一般提供を発表した。チームはGitHub承認のベースイメージを使用し、ワークフロー要件に合った仮想マシンイメージを構築できるようになる。
Claude Managed Agents:生産環境への導入を10倍高速化
Anthropic社がClaude Managed Agentsを発表し、AIエージェントの開発・デプロイを従来より10倍高速化するサービスを提供する。
Cloudflare、完全な耐量子セキュリティを2029年までに実現を目指す
Cloudflareは、量子コンピュータ時代のセキュリティ対策である「耐量子暗号」への移行を加速しており、2029年までに認証を含む完全な耐量子セキュリティの実現を目標としている。同社は2019年から準備を開始し、2022年には全ウェブサイトとAPIで耐量子暗号化を有効化した。
企業が大規模にCloudflareを管理できる「Organizations」構築の方法
Cloudflareが、大規模企業向けに複数アカウントや数千ユーザーを一元管理できる「Organizations」機能を構築した。
Pococha開発環境をEKS上で再設計:ブランチ単位の開発とPull Request単位の検証 [DeNAインフラSRE]
DeNAのインフラSREチームが、Pocochaの開発環境をAmazon EC2からAmazon EKSへ移行し、ブランチ単位の開発とPull Request単位の検証を可能にするコンテナベースの環境を構築した。
Copilotクラウドエージェントの組織ランナー制御
GitHubは、Copilotクラウドエージェントのランナー設定をリポジトリレベルから組織レベルに拡張し、チームが大規模ランナーやセルフホストランナーを一貫して適用できるようにした。
マイクロソフト、シンガポールにAI分野で55億ドルを投資
マイクロソフトがシンガポールに55億ドルをAIインフラとスキル育成に投資し、世界的な主権AI投資を拡大する。
オラクル、大規模AIインフラ投資のため数千人の従業員を解雇と報道
オラクルは大規模なAIデータセンター構築の資金調達のため数千人の従業員を削減している。株価が25%下落し負債が増加する中、同社はOpenAIからの4550億ドル注文を含む保証収入に期待しているが、実際の資金化は不確実である。
プログラマブルフロー保護の導入:Magic Transit顧客向けカスタムDDoS軽減ロジック
Cloudflareが、Magic Transit顧客向けにカスタムDDoS軽減ロジックを実装・展開できる「Programmable Flow Protection」をベータ版で提供開始した。UDPベースの独自プロトコル向けに高精度な軽減を可能にする。
Axiosパッケージの侵害と対応措置
Vercelが、2026年3月31日に発見されたサプライチェーン攻撃でaxios npmパッケージが侵害されたと報告した。Vercelは対策を実施し、プラットフォームを保護した。npmレジストリは侵害バージョンを削除し、安全なaxios@1.14.0を最新版に設定した。
「ピック・アンド・ミックス」カスタムリージョン:Cloudflareが詳細なデータ所在地制御を導入
Cloudflareがカスタムリージョンを発表し、顧客が国や地域ごとにデータセンターを選択してデータ処理場所を細かく定義できるようにした。これにより、TLS終端やアプリケーション層処理を選択した地理的範囲内に留め、コンプライアンスと制御を確保できる。
プレゼンテーション:セキュリティとアーキテクチャ:一方を裏切ることは両方を破壊すること
Shana Dacres-Lawrenceが、セキュリティとアーキテクチャの複雑な関係を説明し、物理的・感情的・信頼の3種類の「裏切り」がシステム全体の障害につながると指摘した。CrowdStrikeやChange Healthcareなどの実例を基に、オープンなコミュニケーションや自動化などの5つの防御戦略を共有した。
AWS S3がアカウント・リージョナル名前空間を導入、18年間続いたグローバルバケット名衝突を解消
AWSがS3にアカウント・リージョナル名前空間を導入し、18年間IaC自動化を妨げていたグローバルバケット名衝突問題を解決した。新しい命名形式と関連機能により、混乱した代理人攻撃も防止する。
マイクロソフト、オラクルとOpenAIが残したテキサスのデータセンターを取得
マイクロソフトが、オラクルとOpenAIが当初建設したテキサス州アビリーンのデータセンターをリース契約したとブルームバーグが報じた。
ジェネレーション13の内側:これまでで最も強力なサーバーの構築方法
Cloudflareは、Rustベースのコアリクエスト処理層「FL2」への移行を完了し、ソフトウェアスタックの刷新に合わせてサーバーハードウェアを刷新した。同社は192コアのAMD EPYC™ Turin 9965プロセッサを搭載した「Gen 13」サーバーを設計し、ネットワークとソフトウェアスタックの進化する需要に対応するための性能と効率性を向上させた。
Microsoft、AKSにDRA対応のNVIDIA vGPUサポートを追加
MicrosoftのAzure Kubernetes Serviceチームが、AKSでDynamic Resource Allocation(DRA)とNVIDIA vGPU技術を連携させる詳細ガイドを公開した。この更新により、AIやメディア処理における共有GPU利用の制御性と効率性が向上する。
イラン戦争が複数のAWSデータセンターを損傷、マルチAZの前提に疑問
イランのドローン攻撃がUAEとバーレーンのAWSデータセンター3施設を損傷し、複数サービスに障害を発生させた。同一リージョン内の複数施設が影響を受け、地政学的紛争がクラウド基盤とマルチAZ構成に与える影響が議論されている。
オープンインターネットを守る:イタリアの「海賊版対策シールド」罰金に対する当社の控訴理由
Cloudflareは、大規模権利者保護を目的としたイタリアの規制「Piracy Shield」がインターネットの基本構造を脅かすとして、罰金処分に対する法的措置を継続している。