キャンバス内でエージェント作成の視覚化と対話する
Cursorはエージェントが視覚化キャンバスを作成できる新機能を発表し、データ可視化、PRレビュー、インシデント対応などの複雑なタスクをインタラクティブなインターフェースで効率化することを可能にした。
キーポイント
視覚化キャンバスの導入
CursorエージェントがReactベースのUIライブラリを使用して、テーブル、チャート、図解などのコンポーネントで構成されたインタラクティブなキャンバスを作成できるようになった。
データ可視化の高度化
従来のマークダウン表では解釈が困難だった時系列データを、複数ソースのデータを統合した単一チャートとして視覚化できるようになり、インシデント対応ダッシュボードなどで活用されている。
PRレビューの効率化
大規模な差分を論理的にグループ化し、重要な変更を優先表示するインターフェースを提供し、複雑なアルゴリズムの疑似コード表現も可能にした。
スキルによる拡張性
ユーザーが独自のスキルを作成してエージェントに教えることで、リポジトリのアーキテクチャ図生成や評価結果の分析など、様々な種類のキャンバスを作成できる。
影響分析・編集コメントを表示
影響分析
この機能は、AIエージェントと人間の協働をテキストベースから視覚的・インタラクティブな次元に引き上げ、特にデータ集約型タスクや複雑なコードレビューにおいて生産性を大幅に向上させる可能性がある。開発ツールにおけるAI統合の新たな方向性を示している。
編集コメント
AIエージェントの出力を単なるテキストから実用的な視覚化ツールに進化させた点が革新的。開発現場での実用性が高く、他のAI開発ツールにも影響を与える可能性がある。
Cursorは、情報を視覚的に表現するキャンバスを作成して応答できるようになりました。これにより、理解しにくいチャットやマークダウンファイルの長文を読む代わりに、カスタムインターフェースを探索し、対話することが可能になります。
キャンバスにより、エージェントは実世界のデータ用のダッシュボードや、リクエストに合わせてロジックと対話性を備えたカスタムインターフェースを作成できます。エージェントはこれらを用いて、PRのレビュー、新しいライブラリの学習、さらにはCursor内の他のエージェントの管理を支援します。エージェントウィンドウにおいて、キャンバスはターミナル、ブラウザ、ソース管理などの他のツールと並んで存在する永続的な成果物です。
#コンポーネントを構成要素として
Cursorは、テーブル、ボックス、ダイアグラム、チャートなどのファーストパーティコンポーネントを備えたReactベースのUIライブラリを使用してキャンバスをレンダリングします。エージェントには、差分やToDoリストなどCursor内の既存コンポーネントへのアクセスを許可し、データ視覚化のベストプラクティスに従うよう指示しています。
さまざまな種類のキャンバスを作成する方法をエージェントに教えるスキルを作成できます。例えば、Docs Canvasスキルを使うと、Cursorはリポジトリの対話式アーキテクチャ図を生成できます。
#Cursorにおけるキャンバスの活用方法
キャンバスは、データ集約型タスクに特に有用であることが分かりました。エージェントが情報をプレーンテキストよりも非線形的で理解しやすい形で配置できるためです。
#インシデント対応ダッシュボード
Cursor内のDatadog、Databricks、SentryのMCPにより、エージェントと共にオブザーバビリティデータを深く掘り下げられるようになり、私たちだけでは見逃してしまうような洞察をエージェントがしばしば発見します。キャンバス導入前は、エージェントは時系列データをマークダウンのテーブルで表現しており、解釈が難しく、視覚化には追加の手順が必要でした。
現在では、エージェントはキャンバス内に視覚化を作成でき、ローカルデバッグファイルを含む複数ソースのデータを単一のチャートに統合できます。
#PRレビューインターフェース
私たちは、これまで以上に大規模な差分をレビューしています。従来のツールはすべての変更を均等に表示するため、差分のどの部分が最も重要かを自分たちで判断しなければなりませんでした。
キャンバスを使用すると、Cursorは変更を論理的にグループ化し、レビューすべき最も重要な部分に優先順位をつけ、変更セットを探索するためのリッチなインターフェースを提供できます。複雑なアルゴリズムについては擬似コードでの表現を記述することさえ可能です。
Cursorでは、ハーネスを変更し、製品に新しいモデルをリリースする際に、評価結果の調査に多くの時間を費やしています。以前は、エンジニアがパターンを特定するためにリクエストIDを一つずつ調査する必要がありました。このプロセスを自動化するウェブアプリの構築とデプロイも検討しましたが、代わりにCursor内のスキルとして直接運用化しました。
このスキルにより、エージェントは評価内のすべてのロールアウトを読み取り、失敗をグループ化し、評価の失敗とクラスタ障害モードを調査するためのキャンバスを構築できます。これにより、以前は見えなかったハーネスのバグを特定できるようになり、最近では2つの新しいモデルをはるかに少ない労力でCursorにリリースするのに役立ちました。
#自動研究実験
クライアントのパフォーマンスに関連する複雑な最適化課題にエージェントが取り組めるよう、自動研究のアイデアを応用してきました。キャンバスにより、エージェントは実験を実行しながら研究の進捗を視覚化できるため、ユーザーは進捗状況を確認し、エージェントが現在検証中の仮説を把握できます。
#情報伝達量の増加
デザインモードや強化された音声入力などの最近の改善は、すべて情報伝達量を増やす取り組みの一環です。私たちは、人間とエージェントの協業における摩擦をなくし、プレーンテキストを超えて意図を表現しやすくしたいと考えています。
Cursor 3.1でキャンバスをお試しいただくか、ドキュメントで詳細をご覧ください。
原文を表示
Cursor can now respond by creating canvases to visually represent information. This allows you to explore and interact with custom interfaces instead of reading walls of texts in chats or markdown files that can be hard to digest.
With canvases, agents can create dashboards for real-world data as well as custom interfaces with logic and interactivity tailored to your request. Agents can use them to help you review PRs, learn new libraries, or even manage other agents in Cursor. In the Agents Window, canvases are durable artifacts that live alongside your other tools like the terminal, browser, and source control.
#Components as building blocks
Cursor renders canvases using a React-based UI library with first-party components like tables, boxes, diagrams, and charts. We gave agents access to existing components in Cursor like diffs and to-do lists, and we also instructed it to follow data visualization best practices.
You can create skills to teach agents how to create different kinds of canvases. For example, the Docs Canvas skill allows Cursor to generate an interactive architecture diagram of your repo.
#How we use canvases at Cursor
We've found canvases particularly useful for data-intensive tasks. They allow agents to arrange information in a way that's non-linear and easier to digest than plain text.
#Incident response dashboard
Datadog, Databricks, and Sentry MCPs in Cursor have enabled us to dive into observability data with agents, which often find insights that we'd miss on our own. Before canvases, the agent would represent time-series data in a markdown table, which was hard to interpret and required additional steps to visualize.
Now, the agent can create visualizations in a canvas that join data from multiple sources, including local debug files, into a single chart.
#PR review interface
We are reviewing larger diffs than ever before. Traditional tools present all changes equally, requiring us to figure out what parts of the diff are most important.
With canvases, Cursor can logically group changes together, prioritize what's most important for you to review, and present a rich interface for you to explore the change set. It can even write pseudocode representations for tricky algorithms.
At Cursor, we spend a lot of time investigating eval results as we make changes to our harness and release new models into the product. Previously, engineers had to inspect request IDs one at a time to identify patterns. We considered building and deploying a web app to automate this process, but instead, we operationalized it directly with a skill in Cursor.
The skill allows agents to read all of the rollouts in an eval, group failures, and build a canvas for investigating eval failures and cluster failure modes. This allows us to identify harness bugs that were hidden before, and recently helped us release two new models in Cursor with far less effort.
#Autoresearch experiment
We have been adapting the ideas in autoresearch to enable agents to tackle complex optimization challenges related to the performance of our clients. With canvases, the agent can visualize its research progress while running experiments, enabling the user to check on progress and see the hypothesis the agent is currently testing.
#Increasing information bandwidth
Recent improvements like Design Mode and upgraded voice input are all part of our effort to increase information bandwidth. We want to remove friction in human-agent collaboration and make it easier to express your intent beyond plain text.
Try canvases in Cursor 3.1, or learn more in our docs.
関連記事
Vite 開発元 VoidZero が Cloudflare に参画
Vite や Vitest を開発する企業「VoidZero」がクラウドプロバイダー「Cloudflare」に合流し、同社全従業員も Cloudflare の一員となる。ただし、主要プロジェクトは引き続きオープンソースとして運営される方針を示した。
Data Formulator 0.7:エンタープライズデータ分析のための AI パワー搭載システム
Microsoft Research が公開したオープンソースの「Data Formulator 0.7」は、データ接続機能やエージェントによる探索支援を統合し、企業向けデータ分析を支援する新バージョンです。
datasette-agent-charts 0.1a1 のリリース
Simon Willison が「datasette-agent-charts」のバージョン 0.1a1 を公開し、色なしカラムでの自動着色や SQL 実行権限の確認機能を追加した。