メインコンテンツへスキップ

#高可用性 のAIニュース

6件の記事

イラン戦争が複数のAWSデータセンターを損傷、マルチAZの前提に疑問

イランのドローン攻撃がUAEとバーレーンのAWSデータセンター3施設を損傷し、複数サービスに障害を発生させた。同一リージョン内の複数施設が影響を受け、地政学的紛争がクラウド基盤とマルチAZ構成に与える影響が議論されている。

InfoQ·3月18日·★★★★

QCon London 2026: 3つのクラウドで同時に稼働させる方法とその限界

Form3は英国の銀行決済を3つのクラウドで同時に実行している。同社エンジニアはカスタムKubernetesオペレーターやクロスクラウドDNS技術を構築したが、米国では東/西フェイルオーバーが求められ、三重アクティブマルチクラウドは需要がなかった。

InfoQ·3月17日

分から秒へ:UberがコンセンサスアーキテクチャでMySQLクラスターの稼働時間を向上

UberはMySQL Group Replicationを基にしたコンセンサス駆動アーキテクチャでMySQLフリートを再設計し、クラスターのフェイルオーバー時間を分から秒に短縮した。リーダー選出と障害検出をデータベース層に移行することで、可用性を向上させ、外部オーケストレーションを簡素化し、数千の本番クラスター全体の一貫性を強化した。

InfoQ·3月11日

GitHub Enterprise Serverの高可用性のための検索アーキテクチャ再構築

GitHubチームは、GitHub Enterprise Serverの検索機能を中核部分として、高可用性と耐久性を向上させるアーキテクチャを再構築した。

GitHub Blog·3月4日

ecdysisによる古いコードの脱皮:CloudflareのRustサービスにおける優雅な再起動

ecdysisはRustライブラリで、ネットワークサービスのダウンタイムゼロアップグレードを実現。Cloudflareで5年間使用後、オープンソース化。

Cloudflare Blog·2月13日·★★★★

大規模AWS障害の原因は何か?

Gergely氏が、Signal、Slack、Zoomなどのサービス停止を引き起こしたAWS大規模障害の原因について、エンジニア視点で分析している。

Pragmatic Engineer·10月24日·★★★★