#スケーラビリティのAIニュース

15件の記事

セキュリティインサイトのスケーリング：グローバルスキャン能力を10倍に向上させた方法

クラウドフレアは、アカウントやDNSレコードのリスク検出頻度が低く、設定ミスが最大2週間放置される課題に対し、自動スキャンの仕組みを強化し、グローバルスキャン能力を10倍に増強した。

スーパースター AI 研究者の経済学（12 分間の読了）

最先端研究所のスーパースター研究者は、平均的な AI 博士後期課程修了者より 100 倍以上の報酬を得ており、数量よりも質が重要である。彼らの貢献は数十億人のユーザーにスケールするため、他者ができない価値を生むなら高額な報酬を支払う価値がある。

TLDR AI·5月14日·★★★★

ポッドキャスト：安定・安全・スケーラブルなプラットフォームの構築：マシュー・リスト氏との対談

マイケル・スティーフェル氏はマシュー・リスト氏と対談し、プラットフォーム構築を語った。基盤は安定・安全・スケーラブルである必要があり、未知のリソース競合による破綻を防ぐ拡張が課題だと指摘した。

InfoQ·4月20日

Etsy、1000シャード・425TBのMySQLシャーディングアーキテクチャをVitessに移行

Etsyのエンジニアリングチームは、長年運用してきたMySQLシャーディング基盤をVitessに移行した。内部システムからVitessのvindexesを使用してシャードルーティングを移行し、データの再シャーディングや未シャーディングテーブルのシャーディングを可能にした。

InfoQ·4月11日

Pinterest、自動メモリ再試行によりSparkのOOM障害を96%削減

Pinterest Engineeringは、監視性の向上、設定調整、自動メモリ再試行を導入し、Apache Sparkのメモリ不足障害を96%削減した。段階的導入とダッシュボードにより、データパイプラインが安定化し、手動介入と運用負荷が軽減された。

InfoQ·4月6日

プレゼンテーション: DuolingoのKubernetesへの移行

Franka Passing氏が、Duolingoの500以上のバックエンドサービスをKubernetesに移行したアーキテクチャ変更について説明している。GitOpsへの移行、IPv6のみのポッドへの移行、環境を分離する「セルラーアーキテクチャ」の採用を解説した。

InfoQ·4月6日

100以上のサービスを停止させずにデータベースシーケンスを大規模に置き換える

Saumya Tyagiが、多数のサービスに影響を与えずにデータベースシーケンスを大規模に置き換える方法について説明している。

InfoQ·4月3日

NVIDIAと共にAIグリッドを構築：あらゆる場所で知能をオーケストレートする

NVIDIAは、AIネイティブサービスがAIインフラの新たなボトルネックを露呈していると指摘し、数百万のユーザー・エージェント・デバイスが知能へのアクセスを求める中で、AIグリッド構築による課題解決を提案している。

NVIDIA Developer Blog·3月18日·★★★★

GitHubの最近の可用性問題への対応

GitHubは過去数週間、複数サービスに影響する重大な可用性・パフォーマンス問題を経験した。同社は自社の可用性基準を満たせず、ユーザーのワークフローに影響を与えたことを認め、責任を取ると表明している。

GitHub Blog·3月12日

Read-Copy-Update (RCU): ロックフリー性能の秘訣

ソフトウェアエンジニアが、Read-Copy-Update (RCU) 技術を用いて、読み込み負荷の高いワークロードで110%以上の性能向上を実現した。

InfoQ·3月6日

Vercelにおける無限スケーリングリダイレクト

Vercelは、大量のリダイレクト処理における遅延とコスト問題を解決する新機能を発表した。同社は、従来の最大2,000件のルーティングルール制限を超えるスケーラブルなリダイレクト処理システムを導入した。

Vercel Blog·3月3日

同時接続数30万超のチャットサービスのメッセージ配信基盤をRedis Pub/SubからRedis Streamsに移行した事例

大規模チャットサービスで、30万同時接続を処理するメッセージ配信基盤をRedis Pub/SubからRedis Streamsに移行した技術事例。

LY Corp Tech Blog·2月25日

実際にスケールするデータプラットフォームの構築方法

著者が、ビジネスに合わせてスケールするデータプラットフォームを事前に設計すべきだと主張している。

Dagster Blog·12月22日

LLMを活用したAmazon商品リストの改善

Amazonが大規模言語モデル（LLM）を活用し、商品カタログの正確性・信頼性・一貫性を大規模に向上させている。

Amazon Science·11月29日·★★★★

MCPによるコード実行：より効率的なエージェントの構築

直接的なツール呼び出しは定義と結果ごとにコンテキストを消費する。代わりにコードを書いてツールを呼び出すことで、エージェントはより効率的にスケールする。MCPを用いたその仕組みを説明する。

Anthropic Engineering·11月4日·★★★★

#スケーラビリティ のAIニュース