#クラウドインフラ のAIニュース

76件の記事

AWS上での分散推論の導入:llm-dを活用

llm-dチームは、エージェントAIワークフローにおける推論プロセスの課題を解決するため、AWS上で分散推論を導入した。これにより、複雑な推論チェーンによる計算負荷の増大と可変需要に対応し、ユーザー体験の向上を目指す。

AWS Machine Learning Blog·3月17日·★★★★

Amazon Bedrockの推論ワークロード向け新CloudWatchメトリクスでTTFTと推定クォータ消費量の可視性を向上

AWSはAmazon BedrockでTTFT(初回トークン時間)と推定クォータ消費量のCloudWatchメトリクスを追加し、生成AIワークロードの推論パフォーマンスとリソース消費の可視性を向上させた。

AWS Machine Learning Blog·3月13日

VercelがDNSプロバイダーとしてDomain Connectをサポート

VercelがDNSプロバイダーとしてDomain Connectをサポートし、外部サービスがVercelドメインを設定できるようになった。これにより、チームはワンクリックでドメイン設定が可能になり、設定時間の短縮やミスの減少が期待できる。

Vercel Blog·3月12日

GitHub可用性レポート:2026年2月

GitHubは2026年2月に6件のインシデントが発生し、サービスパフォーマンスが低下したと報告した。同社は影響を認識し、根本原因と回復策をブログで公開し、システムの回復力向上に向けた投資を進めている。

GitHub Blog·3月12日

Together AIでリアルタイム音声エージェントを構築

Together AIは、STT、LLM、TTSを一体化したインフラを提供し、DeepgramやCartesiaとのネイティブ連携により、500ms未満の低遅延でリアルタイム音声エージェントの実装を可能にする。

Together AI Blog·3月12日·★★★★

GitHubの最近の可用性問題への対応

GitHubは過去数週間、複数サービスに影響する重大な可用性・パフォーマンス問題を経験した。同社は自社の可用性基準を満たせず、ユーザーのワークフローに影響を与えたことを認め、責任を取ると表明している。

GitHub Blog·3月12日

インドでAmazon Bedrock経由でAnthropic Claudeモデルにグローバルなクロスリージョン推論でアクセス可能に

Amazonが、インドの顧客がAmazon Bedrockを通じてAnthropicのClaudeモデルをグローバルなクロスリージョン推論で利用できるようにした。これにより、生成AIアプリケーションの大規模運用が容易になる。

AWS Machine Learning Blog·3月10日·★★★★

Netflix、400の本番クラスターでRDS PostgreSQLからAurora PostgreSQLへの移行を自動化

Netflixのエンジニアが、約400のRDS PostgreSQLクラスターをAuroraに移行する内部自動化プラットフォームを開発した。このプラットフォームはレプリケーション、CDC処理、制御された切り替え、ロールバックを調整し、サービスチームにセルフサービス移行ワークフローを提供することで、ダウンタイムと運用リスクを削減した。

InfoQ·3月10日·★★★★

Vercel AI Gatewayでタイムアウトをカスタマイズし、自動フェイルオーバーを高速化

Vercel AI Gatewayが推論プロバイダーごとのタイムアウト設定を導入し、プロバイダーのデフォルト設定よりも高速なフェイルオーバーを実現した。設定したタイムアウト内に応答がない場合、Gatewayはリクエストを中止し、次の利用可能なプロバイダーに切り替える。

Vercel Blog·3月5日

アマゾン、スペインのAIインフラ強化にさらに210億ドルを投資

アマゾンはスペインのAIインフラ強化に210億ドルを追加投資し、同国へのコミットメントを拡大している。

AI Business·3月4日·★★★★

Fastlyがメトリクス基盤をGKEに移行し精度を改善した事例

Fastlyはメトリクス基盤をGKEに移行し、精度を改善した。同社はこの移行により、システムの信頼性と監視能力を向上させた。

CyberAgent Developers Blog·3月4日

Copilotコーディングエージェントのネットワーク構成変更が実施

Microsoftが2026年2月27日、Copilotコーディングエージェントのネットワーク構成を変更した。この変更は、セルフホストランナーやAzureプライベートネットワークを使用するチームに影響し、サブスクリプションベースのネットワークルーティングを適用する。

GitHub Changelog·3月3日

イランによるドバイへのミサイル攻撃でアマゾンのデータセンターが炎上

イランのミサイル攻撃によりアラブ首長国連邦のアマゾンデータセンターが炎上し、AWSの約60サービスが停止し、UAEとバーレーンのウェブトラフィックに影響を与えている。

404 Media·3月3日·★★★★

MetaがGoogleのTPUを数十億ドルでレンタル契約、NVIDIAのAIチップ支配に直接挑戦

Metaは自社のAIモデルを訓練するため、GoogleのAIチップ(TPU)を数十億ドル規模でレンタルする契約を結んだ。この取引はNVIDIAのAIチップ市場における支配的地位への直接的な挑戦となる。

The Decoder·2月28日·★★★★

OpenAIが史上最大級のプライベート資金調達で1100億ドルを調達

OpenAIが史上最大級のプライベート資金調達で1100億ドルを調達した。アマゾンが500億ドル、NVIDIAとソフトバンクが各300億ドルを出資し、評価額は7300億ドルとなった。

TechCrunch AI·2月27日·★★★★★

macOS 26がGitHubホストランナーで一般提供開始

GitHubがmacOS 26ランナーイメージをGitHub Actionsで一般提供開始した。Apple SiliconとIntel両方に対応し、最新のmacOSとXcodeツールでアプリのビルド・テスト環境を提供する。

GitHub Changelog·2月27日

マイクロソフト、スペースXのスターリンクとグローバル接続で提携

マイクロソフトが、自社のクラウドサービスとスペースXのスターリンク衛星ネットワークを組み合わせるプロジェクトを発表した。

AI Business·2月26日

AmebaブログにおけるDynamoDBからMySQLへのストレージ移行の取り組み

AmebaブログがDynamoDBからMySQLへのデータベース移行を実施し、その過程と技術的課題について解説しています。

CyberAgent Developers Blog·2月25日

2026年2月20日のCloudflareサービス障害

2026年2月20日、Cloudflareがサービス障害を発生。BYOIP利用者の一部でBGP経由のインターネット接続が切断された。

Cloudflare Blog·2月21日

Amazon SageMaker AI 2025年振り返り第1部:柔軟なトレーニングプランと推論ワークロードのコストパフォーマンス向上

Amazonは2025年にSageMaker AIの基盤インフラを容量・コストパフォーマンス・可観測性・使いやすさの4分野で改善し、第1部では柔軟なトレーニングプランの導入と推論ワークロードのコストパフォーマンス向上を発表した。

AWS Machine Learning Blog·2月21日·★★★★

CloudflareのACME検証ロジックにおける脆弱性の緩和策

セキュリティ研究者グループFearsOffが2025年10月13日にCloudflareのACME検証ロジックの脆弱性を発見・報告し、特定のACME関連パスでWAF機能が無効化される問題をCloudflareがバグ報奨プログラムを通じて検証・対応した。

Cloudflare Blog·1月19日

【年末大掃除】開発環境VMの再構築 - apt・brew・asdf・Dockerを使い分けたパッケージ管理

開発者が開発環境用仮想マシンを再構築し、apt・Homebrew・asdf・Dockerなどのパッケージ管理ツールを使い分けて、gcloud・Docker・Go・kubectl・poetryなどのツールを効率的にインストールする方法を紹介している。

ABEJA Tech Blog·12月21日

パルス:Cloudflareの最新障害がグローバル設定変更の危険性を再証明

Cloudflareの大規模障害が、即時適用されたグローバル設定変更により発生。同様の問題が2週間前にも起きており、設定管理の重要性を示す。

Pragmatic Engineer·12月19日·★★★★

Nanochatのオーケストレーション:モデルのデプロイ

RunPodが、訓練済みのAIモデルを高速で信頼性の高いエンドポイントとしてデプロイする方法を解説する。Dagsterによるオーケストレーションと自動更新を組み合わせたガイドを提供する。

Dagster Blog·12月16日

HEROZ ASKを支えるインフラ技術(第2回)

HEROZ ASK開発チームが、Microsoft Azureを中心としたクラウドインフラの技術情報収集方法と開発環境構築について解説している。

HEROZ Tech Blog·6月18日

HEROZ ASKを支えるインフラ技術

HEROZ ASK開発チームが、自社製品の開発で活用しているインフラ技術を紹介し、日本マイクロソフトの『Azure OpenAI Service リファレンスアーキテクチャ』への賛同パートナーとしての取り組みや『Azure AI Hub』の活用について説明している。

HEROZ Tech Blog·2月26日