AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
Cloudflare Blog·2026年4月20日 22:00·約16分で読める

エージェント型クラウドの構築:Agents Week 2026で発表した全内容

#AIエージェント#サーバーレスコンピューティング#Cloudflare Workers#Agentic Cloud#エージェント型ワークロード
TL;DR

CloudflareはAgents Week 2026にて、AIエージェントの大規模並列実行に対応する「Cloud 2.0」基盤として、Git互換ストレージと永続隔離環境を発表した。

AI深層分析2026年4月20日 23:00
4
重要/ 5段階
深度40%
4
関連度30%
5
実用性20%
3
革新性10%
3

キーポイント

1

エージェント特化型コンピューティング基盤

従来の「1アプリ対多数ユーザー」モデルではエージェントの並列実行スケールに追いつかず、OSレベルから軽量アイソレートまで柔軟なCompute環境を提供する。

2

Git互換バージョン管理ストレージ「Artifacts」

エージェントと開発者がコードやデータを管理するための、テスリオン規模のリポジトリ作成とフォークが可能なGit互換ストレージを公開。

3

永続隔離環境「Sandboxes」のGA化

シェル、ファイルシステム、バックグラウンドプロセスを備えたエージェント専用の永続的・隔離された実行環境を提供し、セキュリティとアイデンティティを統合。

4

エージェント向けWebインフラへの移行

エージェントがインターネットトラフィックの主要部分を占める未来に向け、既存のWorkersプラットフォームを基盤とした「Cloud 2.0」へ移行するロードマップを示す。

5

AIエージェント用サンドボックスとセキュアな出口制御

Cloudflare Sandboxesにより、エージェントに要求に応じて起動し状態を保持する永続・隔離環境を提供。Outbound Workersを用いて資格情報を漏洩させずに動的なセキュリティポリシーを適用できるゼロトラスト出口プロキシを実現。

6

Dynamic Workers用Durable ObjectsとスケーラブルなWorkflows

Durable Object FacetsによりAI生成アプリに個別のSQLiteデータベースを割り当て、状態保持コードの実行を可能に。Workflows制御プレーンを再設計し、5万並列処理と高作成レートに対応してバックグラウンドエージェントのスケールを実現。

7

エージェントセキュリティとプライベートネットワーク基盤

Cloudflare Meshでエージェントのプライベートネットワークアクセスを安全に提供。RFC 9728準拠のManaged OAuth、非人間IDの保護機能、スケーラブルなMCP導入アーキテクチャを公開し、セキュリティをデフォルトとする運用基盤を整備。

影響分析・編集コメントを表示

影響分析

この発表は、AIエージェントの実用化において計算リソースのスケールとセキュリティがボトルネックとなる課題に対し、主要クラウド事業者が既存基盤をエージェント向けに再設計する動きを加速させる。開発者はエージェントのデプロイコストと運用負荷を大幅に削減できる一方、基盤ベンダーへの依存度が高まるため、マルチクラウド戦略やデータポータビリティの重要性がさらに高まる。

編集コメント

既存のサーバーレス基盤をエージェント向けに再構築する戦略は、次期クラウド競争の標準規格を定義する上で重要だが、ベンダーロックインリスクへの注意が必要だ。

今日をもって、エージェント(agents)の時代に専念した革新週間「Agents Week」初回が終了しました。このタイミングでこれ以上ないほど適切でした:過去1年で、エージェントは人々の働き方を急速に変化させました。コーディングエージェントは開発者のプロダクトリリースを過去最高速度で支援し、サポートエージェントはチケットの処理をエンドツーエンドで完結させます。リサーチエージェントは数分で数百の情報源にわたる仮説を検証します。そして人々は単一のエージェントを実行するだけでなく、複数のエージェントを並列で、かつ24時間体制で稼働させています。

CloudflareのCTOであるDane KnechtとVP of ProductのRita KozlovがAgents Week歓迎投稿で指摘した通り、エージェントの可能性のある規模は桁違いです:世界の知識労働者(knowledge workers)の一部でもそれぞれ数個のエージェントを並列で実行すれば、数千万の同時セッションに対応するコンピューティング容量(compute capacity)が必要になります。クラウドが構築された基盤である「1つのアプリケーションで多数のユーザーをサービスする」モデル(one-app-serves-many-users model)ではこれに対応できません。しかし、まさに開発者や企業がやりたいのはこれです:エージェントを構築し、ユーザーにデプロイし、大規模に実行すること。

そこに至るには、全体スタック(entire stack)の問題を解決する必要があります。エージェントには、フルオペレーティングシステム(full operating systems)から軽量アイソレート(lightweight isolates)までスケーリングするコンピューティングが必要です。実行方法にセキュリティとアイデンティティ(security and identity)が組み込まれている必要があります。エージェントツールボックス(agent toolbox)、つまり実際の作業を行うための適切なモデル、ツール、コンテキストが必要です。エージェントが生成するすべてのコードには、午後のプロトタイプから本番環境のアプリケーションへの明確な移行パスが必要です。最後に、エージェントがインターネットトラフィックの増加分を牽引するにつれて、ウェブ自体が進化するアジェンティックウェブ(agentic web)に対応するために適応する必要があります。結果として、8年前にWorkersで立ち上げたコンテナーレス・サーバーレスコンピューティングプラットフォーム(containerless, serverless compute platform)は、この瞬間のためにすでに用意されていたことがわかりました。それ以来、私たちはそれを完全なプラットフォームへと成長させ、今週はまさにその問題を中心に構成された、エージェント向けに設計された次のプリミティブ(primitives)の波をリリースしました。

私たちがここにいる理由は、Cloud 2.0、つまりアジェンティッククラウド(agentic cloud)を創出するためです。エージェントが主要なワークロード(primary workload)となる世界のために設計されたインフラストラクチャ。

今週発表したすべての一覧です——何も見逃してほしくありません。

コンピューティング(Compute)

始まりはコンピューティングです。エージェントには実行場所、そして彼らが書いたコードを保存・実行する場所が必要です。すべてのエージェントが同じものを必要とするわけではありません:パッケージのインストールやターミナルコマンドの実行にはフルオペレーティングシステムを必要とするものもありますが、大半はミリ秒で起動し数百万規模までスケーリングする軽量なものを必要とします。今週、私たちはそれらを実行するための環境をリリースするとともに、エージェント向けの新しいGit互換ワークスペース(Git-compatible workspace)も提供しました:

発表

概要

Artifacts:Gitと連携するバージョン管理ストレージ(Versioned storage that speaks Git)

エージェント、開発者、自動化ツールのためのコードとデータの保管場所を提供します。私たちはちょうど今、エージェント向けに構築されたGit互換のバージョン管理ストレージ(Git-compatible versioned storage)「Artifacts」をリリースしました。数千万のリポジトリを作成し、任意のリモートからフォークし、GitクライアントにURLを引き渡してください。

エージェントはSandboxes GAで自分自身のコンピュータを持つ

Cloudflare Sandboxesは、AIエージェント(AI agents)に永続的で分離された環境を提供します。シェル、ファイルシステム、バックグラウンドプロセスを備えた実際のコンピュータであり、オンデマンドで起動し、中断した場所から正確に処理を再開します。

Dynamic, identity-aware, and secure: Sandboxes向けの出口制御(egress controls)

Sandboxes向けのOutbound Workers for Sandboxesは、AIエージェント(AI agents)用のプログラム可能なゼロトラスト出口プロキシ(zero-trust egress proxy)を提供します。これにより、開発者は機密トークンを信頼できないコードに公開することなく、資格情報を注入し動的なセキュリティポリシーを適用できます。

Durable Objects in Dynamic Workers: Give each AI-generated app its own database

Durable Object Facetsにより、Dynamic Workersは独自の分離されたSQLiteデータベース(SQLite databases)を備えたDurable Objectsをインスタンス化できます。これにより、開発者はオンザフライで生成された永続的で状態を保持するコードを実行するプラットフォームを構築できます。

Rearchitecting the Workflows control plane for the agentic era

Cloudflare Workflowsは、複数ステップのアプリケーション向けの永続実行エンジンであり、再設計されたコントロールプレーン(control plane)により50,000の同時実行数と300の作成レート制限をサポートするようになり、永続的なバックグラウンドエージェントの使用ケースに対応するためのスケーリングを支援します。

imageimage

Security

エージェント(AI agents)とそのコードの実行は課題の半分です。エージェントはプライベートネットワークに接続し、内部サービスにアクセスし、ユーザーに代わって自律的なアクションを実行します。組織内の誰もが独自のエージェントを起動できる場合、セキュリティは後回しにできません。デフォルトで組み込まれている必要があります。今週、その実現を容易にするツールを公開しました。

発表

まとめ

Secure private networking for everyone: users, nodes, agents, Workers — introducing Cloudflare Mesh

Cloudflare Meshは、ユーザー、ノード、自律型AIエージェント(autonomous AI agents)向けの安全でプライベートなネットワークアクセスを提供します。Workers VPCとの統合により、開発者は手動トンネルを設定することなく、エージェントにプライベートデータベースやAPIへのスコープ付きアクセス(scoped access)を付与できるようになりました。

Managed OAuth for Access: make internal apps agent-ready in one click

Cloudflare Access向けのManaged OAuth for Cloudflare Accessは、AIエージェント(AI agents)が内部アプリケーションを安全に操作できるよう支援します。RFC 9728を採用することで、エージェントは安全でないサービスアカウントを使用せずに、ユーザーに代わって認証できます。

Securing non-human identities: automated revocation, OAuth, and scoped permissions

Cloudflareは、スキャン可能なAPIトークン(scannable API tokens)、強化されたOAuthの可視性、およびリソーススコープ付き権限(resource-scoped permissions)のGA(一般提供)を導入します。これらのツールは、開発者が真の最小権限アーキテクチャ(least-privilege architecture)を実装し、資格情報の漏洩から保護するのを支援します。

Scaling MCP adoption: our reference architecture for enterprise MCP deployments

Access、AI Gateway(AI Gateway)、MCPサーバーポータルを使用してMCP(Model Context Protocol)をガバナンスするCloudflareの社内戦略を紹介します。また、トークンコストを削減するためのCode Modeを公開し、Cloudflare GatewayでのShadow MCP検出に関する新しいルールも推奨します。

image
image

エージェントツールボックス(Agent Toolbox)

高度なエージェントには、思考と記憶、コミュニケーション、視覚化の能力が必要です。つまり、適切なモデルで駆動し、タスクに応じて最適なツールとコンテキストにアクセスできる状態にあることを意味します。今週、私たちは実際に作業を遂行するエージェントへと変貌させる基本機能(primitives)——推論(inference)、検索(search)、メモリ(memory)、音声(voice)、メール(email)、ブラウザ——を提供しました。

お知らせ(Announcement)

概要(Summary)

プロジェクト・シンク(Project Think):Cloudflare上で次世代のAIエージェントを構築する

次世代版Agents SDKのプレビューを発表します——思考し、行動し、永続化するAIエージェント向けの、軽量な基本機能(primitives)から標準機能充実のプラットフォーム(batteries-included platform)まで。

エージェントに音声を追加する

Agents SDK用の実験的な音声パイプライン(voice pipeline)により、WebSocketsを介したリアルタイムの音声対話が可能になりました。開発者は、サーバーサイドコードわずか約30行で、連続した音声テキスト変換(STT)とテキスト音声変換(TTS)を備えたエージェントを構築できるようになりました。

Cloudflare Email Service:パブリックベータ(public beta)版リリース。エージェント対応完了

エージェントはマルチチャネル(multi-channel)化しています。つまり、ユーザーがすでに利用しているあらゆる場所——メールボックスを含む——でエージェントを利用可能にするということです。Cloudflare Email Serviceは、その実現を容易にするインフラストラクチャ層(infrastructure layer)とともにパブリックベータ版へ移行しました:エージェントからネイティブにメールの送信、受信、処理を行います。

CloudflareのAIプラットフォーム:エージェント向けに設計された推論層(inference layer)

開発者が14以上のプロバイダーからモデルを呼び出せるよう、Cloudflareをエージェント向けの統一された推論層(inference layer)へと構築しています。新機能には、サードパーティ製モデルの実行用Workersバインディング(Workers binding)と、マルチモーダルモデル(multimodal models)を追加した拡張カタログが含まれます。

超大規模言語モデル(extra-large language models)の運用基盤の構築

Cloudflareのインフラ上で高速な大規模言語モデル(LLM)を動作させるため、カスタムテクノロジースタック(technology stack)を構築しました。本稿では、高性能なAI推論(inference)を誰もがアクセス可能にするために必要な技術的なトレードオフ(engineering trade-offs)と技術的最適化について解説します。

Unweight:品質を損なうことなくLLMを22%圧縮した方法

Cloudflareのネットワーク全体で大規模なLLMを動作させるには、GPUメモリ帯域幅(GPU memory bandwidth)の扱いをより賢く、効率的に行う必要があります。そのため、推論時損失圧縮システム(lossless inference-time compression system)であるUnweightを開発しました。これによりモデルのメモリフットプリント(model footprint)を最大22%削減し、これまでになく高速で低コストな推論(inference)を実現しています。

記憶するエージェント:Agent Memoryの紹介

Cloudflare Agent Memoryは、AIエージェントに永続メモリ(persistent memory)を提供するマネージドサービスです。重要な情報を記憶し、不要な情報を忘却し、時間とともに賢くなっていくことを可能にします。

AI検索(AI Search):エージェント向けの検索基本機能(search primitive)

AI検索(AI Search)は、エージェント向けの検索基本機能(search primitive)です。インスタンスを動的に作成し、ファイルをアップロードし、複合検索(hybrid retrieval)と関連性ブースティング(relevance boosting)を用いてインスタンス間で検索できます。検索インスタンスを作成し、アップロードして、検索するだけです。

ブラウザ実行(Browser Run):エージェントにブラウザを

Browser RenderingはBrowser Runに名称変更され、Live View(ライブビュー)、Human in the Loop(ヒューマンインザループ)、CDPアクセス(Chrome DevTools Protocolアクセス)、セッション記録機能が追加され、AIエージェントの並行処理制限(コンカレンシーリミッツ)が4倍に引き上げられました。

imageimage

Prototype to production(プロトタイプから本番環境へ)

優れたインフラストラクチャは、使いやすさも兼ね備えているものです。開発者やそのエージェントがすでに作業を行っている場所——ターミナル、エディタ、プロンプト内——で私たちが出会い、コンテキストスイッチング(コンテキストスイッチ)なしでCloudflareプラットフォーム全体にアクセスできるようにします。

発表事項

まとめ

全Cloudflareプラットフォーム向けのCLI構築

Cloudflareプラットフォーム全体で一貫性を確保するために設計された新しい統合CLI(コマンドラインインターフェース)「cf」と、ローカルデータのデバッグ用ツール「Local Explorer」をご紹介します。これらのツールは、開発者やAIエージェントが約3,000のAPI操作と連携する方法を簡素化します。

Agent Leeの導入:Cloudflareスタックへの新しいインターフェース

Agent Leeはダッシュボード内エージェントであり、Cloudflareのインターフェースを手動でのタブ切り替えから単一のプロンプト操作へ移行させます。サンドボックス化されたTypeScript(サンドボックス型TypeScript)を使用して、実務に即した技術的な協力者としてスタックのトラブルシューティングと管理を支援します。

Flagshipの導入:AI時代のために構築されたフィーチャーフラッグ

第三者プロバイダーのレイテンシーを排除するためにCloudflareのグローバルネットワーク上に構築されたネイティブなフィーチャーフラッグ(機能フラグ)サービス「Flagship」をご紹介します。KV(Key-Valueストレージ)とDurable Objects(永続オブジェクト)を使用することで、Flagshipはサブミリ秒単位のフラッグ評価を可能にします。

PlanetScaleとWorkersでPostgreSQLおよびMySQLデータベースを展開

Cloudflare経由でPlanetScaleのPostgreSQL(Postgres)およびMySQLデータベースを展開し、Cloudflare Workers(ワーカーズ)と接続する方法をご覧ください。

構築場所どこでもドメイン登録:Cloudflare Registrar APIがベータ版として公開

Cloudflare Registrar API(登録機関API)がベータ版として公開されました。開発者やAIエージェントは、エディタ、ターミナル、またはエージェントから直接、コスト価格でドメインの検索、利用可否の確認、登録を行うことができます。ワークフローを離れる必要はありません。

imageimage

Agentic Web(エージェント型ウェブ)

エージェントがオンラインで増加するにつれ、それらは依然として人間のために構築されたインターネットを閲覧しています。既存のウェブサイトには、ボットがコンテンツにアクセスできる範囲を制御し、エージェント向けにパッケージ化・提示する方法、そしてこの移行への準備度を測定するための新しいツールが必要です。

発表事項

まとめ

Agent Readinessスコアの導入。あなたのサイトはエージェント対応済みですか?

Agent Readinessスコア(エージェント準備度スコア)は、サイトオーナーが自身のウェブサイトがAIエージェントをどの程度サポートできているかを理解するのに役立ちます。ここでは新しい規格を探求し、Radar(レーダー)のデータを共有するとともに、Cloudflareのドキュメントをウェブ上で最もエージェントフレンドリーなものにした詳細について説明します。

AIトレーニング用のリダイレクトで正規コンテンツ(カノニカルコンテンツ)を強制

ソフトディレクティブ(Soft directives)は、クローラーが非推奨コンテンツを取り込むのを防ぎません。Cloudflareの「AI Training用リダイレクト(Redirects for AI Training)」を利用すれば、誰でもワンクリックのトグル操作で、認証済みクローラーを正規ページ(canonical pages)へリダイレクトできます。オリジン側の変更は不要です。

Agents Week:ネットワークパフォーマンスの更新

リクエスト処理レイヤーをFL2(Rustベースのアーキテクチャ)へ移行したことで、Cloudflareのパフォーマンス優位性は世界トップネットワークの60%に達しました。私たちはリアルユーザー測定(Real User Measurements)とTCP接続トリメアン(trimeans)を活用し、データがインターネット上の実際のユーザー体験を正確に反映していることを保証しています。

エージェントウェブ(agentic web)に対応する共有辞書圧縮

共有圧縮辞書(shared compression dictionaries)のサポートについてプレビューをご覧いただき、ページ読み込み時間の改善方法をご説明します。また、ベータ版を自分で試せる時期についても公開いたします。

imageimage

That’s a wrap(ここまでです)

Agents Week 2026は終了しますが、エージェントクラウド(agentic cloud)の構築はまさに始まったばかりです。今週リリースしたすべての機能——コンピューティング(compute)やセキュリティ、エージェントツールボックス(agent toolbox)、そしてエージェントウェブ(agentic web)に至るまで——が基盤となります。私たちはこの基盤の上に引き続き構築を進め、次なるものを構築するために必要なすべてを提供し続けます。

また、本日から明日にかけてブログ記事を複数公開し、このストーリーを続けていきますので、ブログで最新情報をお見逃しなく。

今週発表した機能のいずれかを使って構築を進めている場合は、ぜひその報告をお聞かせください。XやDiscordでお気軽にご連絡いただくか、開発者向けドキュメントをご覧ください。

imageimage

原文を表示

Today marks the end of our first Agents Week, an innovation week dedicated entirely to the age of agents. It couldn’t have been more timely: over the past year, agents have swiftly changed how people work. Coding agents are helping developers ship faster than ever. Support agents resolve tickets end-to-end. Research agents validate hypotheses across hundreds of sources in minutes. And people aren't just running one agent: they're running several in parallel and around the clock.

As Cloudflare's CTO Dane Knecht and VP of Product Rita Kozlov noted in our welcome to Agents Week post, the potential scale of agents is staggering: If even a fraction of the world's knowledge workers each run a few agents in parallel, you need compute capacity for tens of millions of simultaneous sessions. The one-app-serves-many-users model the cloud was built on doesn't work for that. But that's exactly what developers and businesses want to do: build agents, deploy them to users, and run them at scale.

Getting there means solving problems across the entire stack. Agents need compute that scales from full operating systems to lightweight isolates. They need security and identity built into how they run.  They need an agent toolbox: the right models, tools, and context to do real work. All the code that agents generate needs a clear path from afternoon prototype to production app. And finally, as agents drive a growing share of Internet traffic, the web itself needs to adapt for the emerging agentic web. Turns out, the containerless, serverless compute platform we launched eight years ago with Workers was ready-made for this moment. Since then, we've grown it into a full platform, and this week we shipped the next wave of primitives purpose-built for agents, organized around exactly those problems.

We are here to create Cloud 2.0 — the agentic cloud. Infrastructure designed for a world where agents are a primary workload.

Here's a list of everything we announced this week — we wouldn’t want you to miss a thing.

Compute

It starts with compute. Agents need somewhere to run, and somewhere to store and run the code they write. Not all agents need the same thing: some need a full operating system to install packages and run terminal commands, most need something lightweight that starts in milliseconds and scales to millions. This week we shipped the environments to run them, as well as a new Git-compatible workspace for agents:

Announcement

Summary

Artifacts: Versioned storage that speaks Git

Give your agents, developers, and automations a home for code and data. We’ve just launched Artifacts: Git-compatible versioned storage built for agents. Create tens of millions of repos, fork from any remote, and hand off a URL to any Git client.

Agents have their own computers with Sandboxes GA

Cloudflare Sandboxes give AI agents a persistent, isolated environment: a real computer with a shell, a filesystem, and background processes that starts on demand and picks up exactly where it left off.

Dynamic, identity-aware, and secure: egress controls for Sandboxes

Outbound Workers for Sandboxes provide a programmable, zero-trust egress proxy for AI agents. This allows developers to inject credentials and enforce dynamic security policies without exposing sensitive tokens to untrusted code.

Durable Objects in Dynamic Workers: Give each AI-generated app its own database

Durable Object Facets allows Dynamic Workers to instantiate Durable Objects with their own isolated SQLite databases. This enables developers to build platforms that run persistent, stateful code generated on-the-fly.

Rearchitecting the Workflows control plane for the agentic era

Cloudflare Workflows, a durable execution engine for multi-step applications, now supports 50,000 concurrency and 300 creation rate limits through a rearchitectured control plane, helping scale to meet the use cases for durable background agents.

imageimage

Security

Running agents and their code is only half the challenge. Agents connect to private networks, access internal services, and take autonomous actions on behalf of users. When anyone in an organization can spin up their own agents, security can't be an afterthought. It has to be the default. This week, we launched the tools to make that easy.

Announcement

Summary

Secure private networking for everyone: users, nodes, agents, Workers — introducing Cloudflare Mesh

Cloudflare Mesh provides secure, private network access for users, nodes, and autonomous AI agents. By integrating with Workers VPC, developers can now grant agents scoped access to private databases and APIs without manual tunnels.

Managed OAuth for Access: make internal apps agent-ready in one click

Managed OAuth for Cloudflare Access helps AI agents securely navigate internal applications. By adopting RFC 9728, agents can authenticate on behalf of users without using insecure service accounts.

Securing non-human identities: automated revocation, OAuth, and scoped permissions

Cloudflare is introducing scannable API tokens, enhanced OAuth visibility, and GA for resource-scoped permissions. These tools help developers implement a true least-privilege architecture while protecting against credential leakage.

Scaling MCP adoption: our reference architecture for enterprise MCP deployments

We share Cloudflare's internal strategy for governing MCP using Access, AI Gateway, and MCP server portals. We also launch Code Mode to slash token costs and recommend new rules for detecting Shadow MCP in Cloudflare Gateway.

imageimage

Agent Toolbox

A capable agent needs to be able to think and remember, communicate, and see. This means being powered with the right models, with access to the right tools and the right context for their task at hand. This week we shipped the primitives — inference, search, memory, voice, email, and a browser — that turn an agent into something that actually gets work done.

Announcement

Summary

Project Think: building the next generation of AI agents on Cloudflare

Announcing a preview of the next edition of the Agents SDK — from lightweight primitives to a batteries-included platform for AI agents that think, act, and persist.

Add voice to your agent

An experimental voice pipeline for the Agents SDK enables real-time voice interactions over WebSockets. Developers can now build agents with continuous STT and TTS in just ~30 lines of server-side code.

Cloudflare Email Service: now in public beta. Ready for your agents

Agents are becoming multi-channel. That means making them available wherever your users already are — including the inbox. Cloudflare Email Service enters public beta with the infrastructure layer to make that easy: send, receive, and process email natively from your agents.

Cloudflare's AI platform: an inference layer designed for agents

We're building Cloudflare into a unified inference layer for agents, letting developers call models from 14+ providers. New features include Workers binding for running third-party models and an expanded catalog with multimodal models.

Building the foundation for running extra-large language models

We built a custom technology stack to run fast large language models on Cloudflare’s infrastructure. This post explores the engineering trade-offs and technical optimizations required to make high-performance AI inference accessible.

Unweight: how we compressed an LLM 22% without sacrificing quality

Running large LLMs across Cloudflare’s network requires us to be smarter and more efficient about GPU memory bandwidth. That’s why we developed Unweight, a lossless inference-time compression system that achieves up to a 22% model footprint reduction, so that we can deliver faster and cheaper inference than ever before.

Agents that remember: introducing Agent Memory

Cloudflare Agent Memory is a managed service that gives AI agents persistent memory, allowing them to recall what matters, forget what doesn't, and get smarter over time.

AI Search: the search primitive for your agents

AI Search is the search primitive for your agents. Create instances dynamically, upload files, and search across instances with hybrid retrieval and relevance boosting. Just create a search instance, upload, and search.

Browser Run: give your agents a browser

Browser Rendering is now Browser Run, with Live View, Human in the Loop, CDP access, session recordings, and 4x higher concurrency limits for AI agents.

imageimage

Prototype to production

The best infrastructure is also one that’s easy to use. We want to meet developers and their agents where they’re already working: in the terminal, in the editor, in a prompt, and make the full Cloudflare platform accessible without context-switching.

Announcement

Summary

Building a CLI for all of Cloudflare

We’re introducing cf, a new unified CLI designed for consistency across the Cloudflare platform, alongside Local Explorer for debugging local data. These tools simplify how developers and AI agents interact with our nearly 3,000 API operations.

Introducing Agent Lee - a new interface to the Cloudflare stack

Agent Lee is an in-dashboard agent that shifts Cloudflare’s interface from manual tab-switching to a single prompt. Using sandboxed TypeScript, it helps you troubleshoot and manage your stack as a grounded technical collaborator.

Introducing Flagship: feature flags built for the age of AI

Introducing Flagship, a native feature flag service built on Cloudflare’s global network to eliminate the latency of third-party providers. By using KV and Durable Objects, Flagship allows for sub-millisecond flag evaluation.

Deploy Postgres and MySQL databases with PlanetScale + Workers

Learn how to deploy PlanetScale Postgres and MySQL databases via Cloudflare and connect Cloudflare Workers.

Register domains wherever you build: Cloudflare Registrar API now in beta

The Cloudflare Registrar API is now in beta. Developers and AI agents can search, check availability, and register domains at cost directly from their editor, their terminal, or their agent — without leaving their workflow.

imageimage

Agentic Web

As more agents come online, they're still browsing an Internet that was built for people. Existing websites need new tools to control what bots can access their content, package and present it for agents, and measure how ready they are for this shift.

Announcement

Summary

Introducing the Agent Readiness score. Is your site agent-ready?

The Agent Readiness score can help site owners understand how well their websites support AI agents. Here we explore new standards, share Radar data, and detail how we made Cloudflare’s docs the most agent-friendly on the web.

Redirects for AI Training enforces canonical content

Soft directives don’t stop crawlers from ingesting deprecated content. Redirects for AI Training allows anybody on Cloudflare to redirect verified crawlers to canonical pages with one toggle and no origin changes.

Agents Week: Network performance update

By migrating our request handling layer to a Rust-based architecture called FL2, Cloudflare has increased its performance lead to 60% of the world’s top networks. We use real-user measurements and TCP connection trimeans to ensure our data reflects the actual experience of people on the Internet

Shared dictionary compression that keeps up with the agentic web

We give you a sneak peek of our support for shared compression dictionaries, show you how it improves page load times, and reveal when you’ll be able to try the beta yourself.

imageimage

That’s a wrap

Agents Week 2026 is ending, but the agentic cloud is just getting started. Everything we shipped this week — from compute and security to the agent toolbox and the agentic web — is the foundation. We're going to keep building on it to give you everything you need to build what's next.

We also have more blog posts coming out today and tomorrow to continue the story, so keep an eye out for the latest at our blog.

If you're building on any of what we announced this week, we want to hear about it. Come find us on X or Discord, or head to the developer documentation.

imageimage

この記事をシェア

関連記事

Cloudflare Blog★42026年5月13日 22:00

Browser Run が Cloudflare コンテナ上で稼働し、高速化とスケーラビリティが向上

開発チームは Browser Run を Cloudflare のコンテナ基盤に再構築しました。これにより、1 分間に最大 60 ブラウザを起動可能になり、並行実行数は 120 に達し、以前より 4 倍の性能向上を実現しています。また、クイックアクションの応答時間が 50% 以上短縮され、信頼性も高まりました。

TLDR AI★42026年5月13日 09:00

真のサーバーレス GPU を実現する方法(20 分読了)

Modal は、推論ワークロードの変動に対応するため、新しいレプリカの起動時間を数キログ秒から数十秒に短縮し、真のサーバーレス GPU スケーリングを実現した。

Cloudflare Blog★42026年5月1日 22:00

テナントに追従する耐久性実行を実現する「Dynamic Workflows」の発表

クラウドflare は、開発者向けプラットフォーム「Workers」において、テナントごとに動作ロジックを動的に実行できる新機能「Dynamic Workflows」を発表した。これにより、AI が実装を作成するアプリケーションや、マルチテナント SaaS の顧客ごとのビジネスロジックをランタイムで安全に処理できるようになる。

ニュース一覧に戻る元記事を読む