#スケーラビリティ のAIニュース
15件の記事
セキュリティインサイトのスケーリング:グローバルスキャン能力を10倍に向上させた方法
クラウドフレアは、アカウントやDNSレコードのリスク検出頻度が低く、設定ミスが最大2週間放置される課題に対し、自動スキャンの仕組みを強化し、グローバルスキャン能力を10倍に増強した。
スーパースター AI 研究者の経済学(12 分間の読了)
最先端研究所のスーパースター研究者は、平均的な AI 博士後期課程修了者より 100 倍以上の報酬を得ており、数量よりも質が重要である。彼らの貢献は数十億人のユーザーにスケールするため、他者ができない価値を生むなら高額な報酬を支払う価値がある。
ポッドキャスト:安定・安全・スケーラブルなプラットフォームの構築:マシュー・リスト氏との対談
マイケル・スティーフェル氏はマシュー・リスト氏と対談し、プラットフォーム構築を語った。基盤は安定・安全・スケーラブルである必要があり、未知のリソース競合による破綻を防ぐ拡張が課題だと指摘した。
Etsy、1000シャード・425TBのMySQLシャーディングアーキテクチャをVitessに移行
Etsyのエンジニアリングチームは、長年運用してきたMySQLシャーディング基盤をVitessに移行した。内部システムからVitessのvindexesを使用してシャードルーティングを移行し、データの再シャーディングや未シャーディングテーブルのシャーディングを可能にした。
Pinterest、自動メモリ再試行によりSparkのOOM障害を96%削減
Pinterest Engineeringは、監視性の向上、設定調整、自動メモリ再試行を導入し、Apache Sparkのメモリ不足障害を96%削減した。段階的導入とダッシュボードにより、データパイプラインが安定化し、手動介入と運用負荷が軽減された。
プレゼンテーション: DuolingoのKubernetesへの移行
Franka Passing氏が、Duolingoの500以上のバックエンドサービスをKubernetesに移行したアーキテクチャ変更について説明している。GitOpsへの移行、IPv6のみのポッドへの移行、環境を分離する「セルラーアーキテクチャ」の採用を解説した。
100以上のサービスを停止させずにデータベースシーケンスを大規模に置き換える
Saumya Tyagiが、多数のサービスに影響を与えずにデータベースシーケンスを大規模に置き換える方法について説明している。
NVIDIAと共にAIグリッドを構築:あらゆる場所で知能をオーケストレートする
NVIDIAは、AIネイティブサービスがAIインフラの新たなボトルネックを露呈していると指摘し、数百万のユーザー・エージェント・デバイスが知能へのアクセスを求める中で、AIグリッド構築による課題解決を提案している。
GitHubの最近の可用性問題への対応
GitHubは過去数週間、複数サービスに影響する重大な可用性・パフォーマンス問題を経験した。同社は自社の可用性基準を満たせず、ユーザーのワークフローに影響を与えたことを認め、責任を取ると表明している。
Read-Copy-Update (RCU): ロックフリー性能の秘訣
ソフトウェアエンジニアが、Read-Copy-Update (RCU) 技術を用いて、読み込み負荷の高いワークロードで110%以上の性能向上を実現した。
Vercelにおける無限スケーリングリダイレクト
Vercelは、大量のリダイレクト処理における遅延とコスト問題を解決する新機能を発表した。同社は、従来の最大2,000件のルーティングルール制限を超えるスケーラブルなリダイレクト処理システムを導入した。
同時接続数30万超のチャットサービスのメッセージ配信基盤をRedis Pub/SubからRedis Streamsに移行した事例
大規模チャットサービスで、30万同時接続を処理するメッセージ配信基盤をRedis Pub/SubからRedis Streamsに移行した技術事例。
実際にスケールするデータプラットフォームの構築方法
著者が、ビジネスに合わせてスケールするデータプラットフォームを事前に設計すべきだと主張している。
LLMを活用したAmazon商品リストの改善
Amazonが大規模言語モデル(LLM)を活用し、商品カタログの正確性・信頼性・一貫性を大規模に向上させている。
MCPによるコード実行:より効率的なエージェントの構築
直接的なツール呼び出しは定義と結果ごとにコンテキストを消費する。代わりにコードを書いてツールを呼び出すことで、エージェントはより効率的にスケールする。MCPを用いたその仕組みを説明する。