AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
MarkTechPost·2026年6月18日 02:22·約10分で読める

Vercel がオープンソース AI エージェントフレームワーク「Eve」をリリース:各エージェントは機能にマッピングされたファイルディレクトリとして定義される

#Open Source Framework#Agent Architecture#TypeScript#Vercel#Durable Execution
TL;DR

Vercel は、エージェントをディレクトリ構造で定義する「eve」というオープンソースフレームワークを公開し、ファイルベースのアプローチでスケーラブルな AI エージェント開発の標準化を推進した。

AI深層分析2026年6月18日 03:02
4
重要/ 5段階
深度40%
5
関連度30%
4
実用性20%
5
革新性10%
4

キーポイント

1

ファイルシステムファーストの設計思想

エージェントをディレクトリとして定義し、各ファイル(モデル、ツール、スキルなど)が機能や能力に対応する「契約」となる構造を採用している。

2

ボイラープレート不要な拡張性

ツールやスキルの追加は単にファイルを作成するだけでよく、ビルド時に自動的に検出・連携されるため、開発の重複と複雑さを排除する。

3

本番環境での実績と耐久性

Vercel 自身が百以上のエージェントを稼働させており、会話ごとのチェックポイント機能など、生産環境で必要な耐久性(Durable Execution)が標準装備されている。

4

堅牢な実行とサンドボックス化

各会話ワークフローはチェックポイントされ、クラッシュやデプロイ後も再開可能であり、生成されたコードは個別のサンドボックスで安全に実行されます。

5

人間による承認機能と統合

重要なアクションには人間の承認を要求でき、認証情報はモデルから隠蔽された状態で Slack や GitHub などの多様なチャネルやデータソースとシームレスに連携します。

6

実証済みの内部活用事例

Vercel は社内ですでに 6 つのエージェント(データ分析、営業担当、サポートなど)を運用しており、特に自律型 SDR エージェントは年間コスト約 5,000 ドルで 32 倍のリターンを生んでいます。

7

ディレクトリベースのアーキテクチャ

各エージェントがファイルのディレクトリとして表現され、フォルダごとに特定の機能がマッピングされる構造を採用しています。

影響分析・編集コメントを表示

影響分析

このフレームワークは、AI エージェント開発における「インフラの複雑さ」という課題に対し、ファイルシステムという直感的な抽象化層を提供することで解決策を示している。特に、Vercel のような大規模プラットフォームが実際に採用し実績を積んでいる点は、業界全体がファイルベースのアプローチへ移行する重要な転換点となる可能性が高い。

編集コメント

従来のコードベースの定義から、ディレクトリ構造そのものが仕様となるという発想は、開発者のメンタルモデルを劇的に変える可能性があり、エージェント開発のパラダイムシフトを示唆しています。

Vercel は、エージェントの構築、実行、スケーリングのためのオープンソースフレームワーク「eve」をリリースしました。このプロジェクトは npm パッケージとして公開され、Apache-2.0 ライセンスの下で提供されています。

エージェントを構築するとは、そのエージェントが何を行うかを定義することを意味すべきです。生産環境で動作させるために必要なすべてのインフラストラクチャ(plumbing)を組み立てることを意味してはいけません。

eve は Vercel が自社のエージェントを構築・実行するために使用するフレームワークです。Vercel の投稿によると、現在、本番環境では 100 個以上のエージェントが稼働しています。

eve とは何か?

eve は、永続的なバックエンドエージェント向けのファイルシステムファーストなフレームワークです。ディスク上のディレクトリとしてエージェントを作成します。そのディレクトリ自体が契約(コントラクト)となります。

各ファイルは、エージェントの 1 つのコンポーネントを記述します。一目で、ツリー構造を見ることで、そのエージェントが何者であり、何をすべきかがわかります。また、それがどこに存在し、いつ自律的に行動するかも示されます。

動作する最小限のエージェントは 2 つのファイルから構成されます。1 つはモデルを定義するものであり、もう 1 つは指示(インストラクション)を定義するものです。

// agent/agent.ts

import { defineAgent } from "eve";

export default defineAgent({

model: "anthropic/claude-opus-4.8",

});

モデルの指定は 1 行で済み、AI Gateway を通じてプロバイダーのフォールバックもサポートされています。instructions.md ファイルは、eve がすべてのモデル呼び出しの前に設定するシステムプロンプトとなります。

エージェントとはディレクトリである

Vercel の核となる考え方は、エージェントには特定の形状(シェイプ)があるという点です。各チームは同じニーズを満たすために、常に同じ構造を再構築していました。eve はその形状をフレームワークとして実装したものです。

ディレクトリ構成は、各機能をフォルダにマッピングします。以下が契約内容です:

パス | 役割 | フォーマット

agent.ts

実行するモデルとランタイム設定

TypeScript

instructions.md

そのエージェントとは誰か、すべてのモデル呼び出しの前に付加される

Markdown

tools/

それが何ができるか; ファイル名がツール名になる

TypeScript

skills/

それが知っていること; トピックが登場した時のみ読み込まれる

Markdown

connections/

MCP サーバーおよび OpenAPI API への安全なリンク

TypeScript

sandbox/

エージェントのサンドボックスのオプション上書き; ワークスペースファイルのシード

Directory

subagents/

委任される専門的な子エージェント

Directory

channels/

それが存在する場所、Slack や HTTP など

TypeScript

schedules/

独自に動作するタイミング、cron によるスケジュール

TypeScript

lib/

エージェント全体で共有される作成済みコード

TypeScript

ツール、スキル、チャネル、またはスケジューラーを追加するには、ファイルを追加するだけです。eve はビルド時にそれらを読み取り、自動的に接続します。登録するためのボイラープレートは不要です。

ツールとは、Zod 入力スキーマを持つ 1 つの TypeScript ファイルのことです。そのファイル名とツリー内の位置が定義となります。

Copy CodeCopiedUse a different Browser

// agent/tools/run_sql.ts

import { defineTool } from "eve/tools";

import { z } from "zod";

export default defineTool({

description: "読み取り専用の SQL クエリを実行します。",

inputSchema: z.object({ sql: z.string() }),

needsApproval: ({ toolInput }) => estimateScanGb(toolInput.sql) > 50,

async execute({ sql }) { /* ... */ },

});

パッケージに含まれるもの

Vercel は、eve を「バッテリー付き(標準機能充実)」と説明しています。このフレームワークには、6 つの生産環境対応機能が標準で用意されています:

永続的な実行:すべての会話はチェックポイント付きの永続的なワークフローです。セッションは一時停止でき、クラッシュやデプロイを生き延びて、止まった場所から再開できます。これはオープンソースの Workflow SDK を基に構築されています。

サンドボックス化された計算処理:エージェントが生成したコードは信頼できないものとして扱われます。各エージェントにはシェルコマンド、スクリプト、ファイルの読み書き専用のサンドボックスが割り当てられます。バックエンドはアダプターであり、デプロイ時は Vercel Sandbox で、ローカルでは Docker、microsandbox、または just-bash 上で実行されます。

人間による承認(Human-in-the-loop approvals):あらゆるアクションを承認必須に設定できます。エージェントはその時点で一時停止し、必要であれば無期限に待機しますが、計算リソースは消費しません。承認されると、eve は中断した場所から継続します。

安全な接続:接続とは、MCP サーバーまたは OpenAPI 互換 API を指すファイルです。eve が認証を仲介し、モデルが URL や認証情報を直接見ることはありません。ローンチ時点では、Slack、GitHub、Snowflake、Salesforce、Notion、Linear にエージェントが接続可能です。

チャネル:同じエージェントがすべてのインターフェースで機能します。HTTP API はデフォルトで有効になっており、Slack、Discord、Teams、Telegram、Twilio、GitHub、Linear が標準装備されています。一つのチャネルから別のチャネルへハンドオフすることもできます。

トレーシングと評価(evals):すべての実行は標準的な OpenTelemetry スパンを使用してトレースを生成します。これらは Braintrust、Honeycomb、Datadog、または Jaeger へエクスポートされます。評価(evals)とは、ローカルで実行するか CI に組み込むテストスイートであり、スコアリングされます。

ユースケースと実際の例

Vercel は、内部で eve を使用して稼働させている 6 つのエージェントを公開しました:

d0、データアナリスト:最も頻繁に使用される社内ツールで、月間 3 万件以上の質問に対応しています。すべての問い合わせは、質問者の権限範囲内に限定されます。

Lead Agent(自律型 SDR):新しい見込み顧客に対して自動的に働きかけ、自らフォローアップを行います。Vercel によると、年間コストは約 5,000 ドルで、その 32 倍の収益を返しており、エンジニア 1 人がパートタイムで管理しています。

Athena(営業コックピット):RevOps チームがエンジニアを介さず 6 週間で構築しました。Snowflake や Salesforce のパイプラインに関する質問に、自然言語で回答します。

Vertex(サポートエンジニア):ヘルプセンター、ドキュメント、Slack を跨ぐチケットを処理します。Vercel によると、92% のチケットを独自に解決し、残りをエスカレーションしています。

draft0(コンテンツエージェント):人間のエディターが記事を確認する前に、明らかな問題を検出するレビューパイプラインを実行します。

V(ルーティングエージェント):タスクはまず Slack の V へ送られます。V が各タスクを回答可能なエージェントに振り分けます。

インタラクティブシミュレーション

(function(){

var f = document.getElementById('eve-demo-embed-frame');

window.addEventListener('message', function(e){

if (e && e.data && e.data.type === 'eve-demo-height' && f) {

var h = parseInt(e.data.height, 10);

if (h && h > 200) { f.style.height = h + 'px'; }

}

});

})();

eve と手動構築のエージェントスタックの比較

ほとんどのチームは、新しいエージェントごとにこれらの部品を自ら組み立てています。以下の表では、その作業内容と eve が提供する機能を対比しています。

機能 | 典型的な DIY スタック | eve

---|---|---

作成 | カスタムループ、手動ツール登録 | ディレクトリ内のファイル(ビルド時に検出)

耐久性

個別の状態とリトライ処理

セッションごとのチェックポイント付き永続ワークフロー

コード実行

自己管理型コンテナまたは VM

交換可能なアダプターを介したエージェントごとのサンドボックス

承認

カスタム一時停止・再開ロジック

任意のアクションに needsApproval フィールドを追加

サーフェス

チャンネルごとに 1 つの統合

チャンネルごとに 1 つのアダプターファイル

観測性

ログから結合

組み込みの OpenTelemetry トレースと評価

デプロイ

インフラのプロビジョニング

vercel deploy、ローカルから変更なしで実行可能

この比較は Eve の文書化された機能に基づいています。他のフレームワークの詳細はバージョンや設定によって異なります。

始め方

1 つのコマンドでエージェントのスキャフォールディングを開始できます。依存関係のインストール、プロジェクトのスキャフォールディング、開発サーバーの起動が行われます。

コードをコピー コピー済み 別のブラウザを使用

npx eve@latest init my-agent

eve dev は対話型ターミナル UI を備えたローカル環境でエージェントを実行します。eve eval はテストスイートを実行します。eve build は .eve/ 配下に検証可能なアーティファクトをコンパイルします。

Eve エージェントは通常の Vercel プロジェクトであるため、vercel deploy で本番環境へ変更なしでデプロイされます。サンドボックスはコード変更なしで Vercel Sandbox に切り替わります。

主なポイント

eve は Vercel のオープンソース Apache-2.0 エージェントフレームワークで、現在はパブリックプレビュー中です。

エージェントはファイルのディレクトリであり、各フォルダーが 1 つの機能にマッピングされます。

永続実行、サンドボックス、承認、接続、チャンネル、評価はすべて組み込みで提供されます。

Vercel では Eve を使用して 100 以上のエージェントを実行しており、その中には月間 3 万件の質問を処理するデータアナリストも含まれています。

npx eve@latest init でスキャフォールドを作成し、変更を加えず vercel deploy でデプロイします。

リポジトリ、製品ページ、ドキュメント、技術詳細をチェックアウトしてください。また、Twitter でフォローすることも歓迎いたします。15 万人以上の ML サブレッドに参加することや、ニュースレターを購読することを忘れないでください。待ってください!Telegram をご利用ですか?今なら Telegram でも私たちに参加できます。

GitHub リポジトリの宣伝、Hugging Face ページ、製品リリース、ウェビナーなどのプロモーションのためにパートナーシップをご検討の場合は、ご連絡ください。

本記事「Vercel が Eve を発表:各エージェントが機能にマッピングされたファイルのディレクトリであるオープンソース AI エージェントフレームワーク」は、MarkTechPost で最初に公開されました。

原文を表示

Vercel has released eve, an open-source framework for building, running, and scaling agents. The project is published as the npm package eve, licensed under Apache-2.0.

Building an agent should mean defining what it does. It should not mean assembling all the plumbing that an agent needs to run in production.

eve is the framework Vercel builds and runs its own agents on. According to Vercel post, it runs more than a hundred agents in production today.

What is eve?

eve is a filesystem-first framework for durable backend agents. You create an agent as a directory on disk. The directory is the contract.

Each file describes one component of the agent. At a glance, the tree shows what an agent is and does. It also shows where it lives and when it acts on its own.

The smallest agent that runs is two files. One sets the model. The other sets the instructions.

Copy CodeCopiedUse a different Browser

// agent/agent.ts

import { defineAgent } from "eve";

export default defineAgent({

model: "anthropic/claude-opus-4.8",

});

The model is one line, and provider fallbacks are supported through AI Gateway. The instructions.md file becomes the system prompt that eve puts in front of every model call.

An agent is a directory

Vercel’s core idea is that agents have a shape. Every team kept rebuilding the same structure to meet the same needs. eve makes that shape into a framework.

The directory layout maps each capability to a folder. Here is the contract:

PathRoleFormat

agent.tsThe model it runs on, plus runtime configTypeScript

instructions.mdWho it is, prepended to every model callMarkdown

tools/What it can do; filename becomes the tool nameTypeScript

skills/What it knows; loaded only when the topic comes upMarkdown

connections/Secure links to MCP servers and OpenAPI APIsTypeScript

sandbox/Optional override of the agent’s sandbox; seeds workspace filesDirectory

subagents/Specialist child agents it delegates toDirectory

channels/Where it lives, like Slack or HTTPTypeScript

schedules/When it acts on its own, on a cronTypeScript

lib/Shared authored code used across the agentTypeScript

You add a tool, skill, channel, or schedule by adding a file. eve picks them up at build time and wires them in. There is no boilerplate to register them.

A tool is one TypeScript file with a Zod input schema. Its filename and place in the tree become its definition.

Copy CodeCopiedUse a different Browser

// agent/tools/run_sql.ts

import { defineTool } from "eve/tools";

import { z } from "zod";

export default defineTool({

description: "Run a read-only SQL query.",

inputSchema: z.object({ sql: z.string() }),

needsApproval: ({ toolInput }) => estimateScanGb(toolInput.sql) > 50,

async execute({ sql }) { /* ... */ },

});

What ships in the box

Vercel describes eve as ‘batteries included.’ Six production capabilities come with the framework:

Durable execution: Every conversation is a durable workflow, with each step checkpointed. A session can pause, survive a crash or a deploy, and resume where it stopped. This is built on the open-source Workflow SDK.

Sandboxed compute: Agent-generated code is treated as untrusted. Every agent gets its own sandbox for shell commands, scripts, and file reads and writes. The backend is an adapter, running on Vercel Sandbox when deployed and on Docker, microsandbox, or just-bash locally.

Human-in-the-loop approvals: Any action can be set to require approval. The agent pauses there and waits, indefinitely if needed, without consuming compute. Once approved, eve continues from where it left off.

Secure connections: A connection is a file pointing at an MCP server or an OpenAPI-compatible API. eve brokers the auth, and the model never sees the URL or credentials. At launch, agents can connect to Slack, GitHub, Snowflake, Salesforce, Notion, and Linear.

Channels: The same agent serves every surface. The HTTP API is on by default, with Slack, Discord, Teams, Telegram, Twilio, GitHub, and Linear included. One channel can hand off to another.

Tracing and evals: Every run produces a trace using standard OpenTelemetry spans. They export to Braintrust, Honeycomb, Datadog, or Jaeger. Evals are scored test suites you run locally or wire into CI.

Use cases, with real examples

Vercel published six agents it runs internally on eve:

d0, the data analyst: Its most-used internal tool, handling more than 30,000 questions a month. Every query is scoped to the asker’s own permissions.

Lead Agent, the autonomous SDR: It works every new lead and follows up on its own. Vercel says it costs about $5,000 a year and returns 32 times that, maintained part-time by one engineer.

Athena, the sales cockpit: RevOps built it in six weeks without engineers. It answers pipeline questions from Snowflake and Salesforce in plain language.

Vertex, the support engineer: It handles tickets across the help center, docs, and Slack. Vercel reports it solves 92% of tickets on its own and escalates the rest.

draft0, the content agent: It runs a review pipeline that catches glaring issues before a human editor sees the piece.

V, the routing agent: Tasks go to V in Slack first. V routes each one to the agent that can answer it.

Interactive Simulation

(function(){

var f = document.getElementById('eve-demo-embed-frame');

window.addEventListener('message', function(e){

if (e && e.data && e.data.type === 'eve-demo-height' && f) {

var h = parseInt(e.data.height, 10);

if (h && h > 200) { f.style.height = h + 'px'; }

}

});

})();

eve versus a hand-rolled agent stack

Most teams assemble these pieces themselves for each new agent. The table below maps that work against what eve provides.

CapabilityTypical DIY stackeve

AuthoringCustom loop, manual tool registrationFiles in a directory, discovered at build

DurabilityBespoke state and retry handlingCheckpointed durable workflow per session

Code executionSelf-managed container or VMPer-agent sandbox via swappable adapter

ApprovalsCustom pause-and-resume logicneedsApproval field on any action

SurfacesOne integration per channelOne adapter file per channel

ObservabilityStitched together from logsOpenTelemetry traces and evals built in

DeployProvision infrastructurevercel deploy, runs unchanged from local

The comparison reflects eve’s documented capabilities. Specifics of other frameworks vary by version and setup.

Getting started

You can scaffold and start a new agent with one command. It installs dependencies, scaffolds the project, and starts a dev server.

Copy CodeCopiedUse a different Browser

npx eve@latest init my-agent

eve dev runs the agent locally with an interactive terminal UI. eve eval runs your test suites. eve build compiles inspectable artifacts under .eve/.

Because an eve agent is an ordinary Vercel project, vercel deploy ships it to production unchanged. The sandbox swaps to Vercel Sandbox without a code change.

Key Takeaways

eve is Vercel’s open-source, Apache-2.0 agent framework, now in public preview.

An agent is a directory of files; each folder maps to one capability.

Durable execution, sandboxes, approvals, connections, channels, and evals ship built in.

Vercel runs 100+ agents on eve, including a data analyst handling 30,000 questions monthly.

Scaffold with npx eve@latest init, then deploy unchanged via vercel deploy.

Check out the Repo, Product page, Docs and Technical details. Also, feel free to follow us on Twitter and don’t forget to join our 150k+ML SubReddit and Subscribe to our Newsletter. Wait! are you on telegram? now you can join us on telegram as well.

Need to partner with us for promoting your GitHub Repo OR Hugging Face Page OR Product Release OR Webinar etc.? Connect with us

The post Vercel Releases Eve: An Open-Source AI Agent Framework Where Each Agent is a Directory of Files Mapped to Capabilities appeared first on MarkTechPost.

この記事をシェア

関連記事

Vercel Blog★42026年4月17日 03:01

耐久性のある実行のための新しいプログラミングモデル

Vercel社が、ローカル環境では簡単に実行できるコードが、障害や再起動、実際のトラフィックに対処する際に問題となる課題を解決するため、長期実行システム向けに耐久性のあるワークフローをアプリケーションコードの拡張として提供する新しいプログラミングモデル「Workflows」を発表した。

Vercel Blog★42026年6月18日 01:00

Vercel Ship 2026 レポート:エージェント向けインフラの未来を語る

Vercel は、思考するソフトウェアを含むあらゆるものをデプロイできるフルスタックプラットフォームとして、エージェント向けのインフラ構築ビジョンを発表し、ロンドンで約 2,500 人が参加したイベントを開催しました。

Vercel Blog★32026年6月16日 09:00

Vercel の Workflow SDK が TanStack Start アプリケーションをサポート

Vercel は、Workflow SDK に TanStack Start アプリケーションのサポートを追加しました。これにより、開発者は Vite と Nitro を基盤とする環境で、標準的な TypeScript を使用して永続的で再開可能なワークフローを記述できるようになります。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む