AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
TLDR AI·2026年6月8日 09:00·約5分で読める

Cursor の更新されたデザインモード(3 分読了)

#Vision-Language Model#Agent-based Development#Visual Interface#Cursor IDE
TL;DR

Cursor は、視覚的要素への直接操作や音声入力を可能にする「Design Mode」を更新し、開発者がコードを記述せずに UI 変更を指示できるフローを実現した。

AI深層分析2026年6月11日 00:08
4
重要/ 5段階
深度40%
4
関連度30%
5
実用性20%
5
革新性10%
4

キーポイント

1

文脈に即した編集機能の強化

ブラウザ上で要素をクリック、描画、または音声で指示することで、エージェントがその瞬間のページ状態とコード構造を理解し、直接修正を加えることができる。

2

多様な指示方法の提供

単一選択に加え、複数の要素を同時に指定して関係性を指示する「マルチセレクト」や、特定の領域を囲む「描画」、そして音声による説明が可能になった。

3

開発ループの短縮化

製品から離れて詳細なテキスト指示を書く手間がなくなり、視覚的な参照と修正がシームレスに繋がることで、デザイン変更のイテレーション速度が向上する。

4

内部処理の高度化

要素選択時に XPath やコンポーネント属性、Fiber ツリーのプロップスなど、複数の補完信号を文脈に追加し、エージェントの正確なターゲット認識を可能にしている。

影響分析・編集コメントを表示

影響分析

この更新は、AI エージェントによるコーディング支援の領域を「テキストベースの指示」から「視覚的・空間的な理解」へと大きく拡張する重要な転換点です。開発者が IDE の外で詳細なプロンプトを作成する手間を省き、直感的な操作で即座にコード変更を実現できるため、フロントエンド開発やプロトタイピングのワークフローが根本から変革される可能性があります。

編集コメント

テキストプロンプトに依存していた従来の AI コーディングツールから、視覚的コンテキストを直接理解・操作する「空間的 AI」への進化を示す事例であり、開発体験の民主化に大きく寄与する更新です。

チャットはエージェントと作業するための一つのインターフェースですが、UI 作業は本質的に空間的なものです。デザイナー、プロダクトマネージャー、フロントエンド開発者は、要素や領域、あるいはページのステートに指し示す注釈を通じてコミュニケーションをとることがよくあります。

本日アップデートする「デザインモード」は、あなたが目にするものとエージェントが理解するものの間の距離を縮めるための仕組みの一部です。これにより、フローを中断することなく、コンテキスト内でプロダクトを直接編集できるようになります。

Cursor ブラウザからは、任意の要素をクリックしたり、ページ上に描画したり、音声で変更内容を説明したりすることができ、Cursor は必要な文脈を取得してコードを編集します。その間、あなたは次の編集へと移ることができます。

これは、エージェントとの間でデザイン変更を反復する際により高速かつ簡単な方法です。なぜなら、指示はもはや単なる一文ではなく、選択された要素、その背後にあるコード、周囲のレイアウト、そしてページ上の視覚的な関係性を含めることができるからです。

これにより、「気づき」と「編集」の間のループがより密接になります。あなたは実行中のプロダクトから離れることなく、意図するインターフェース部分を指し示すことができ、エージェントが裏側で編集を行う間も、プロダクト自体に対して参照を続けながら作業を進めることができます。

指差して、描画して、あるいは説明する

デザインモードでは、エージェントに意図を伝えるための複数の方法を提供しています。要素を選択したり、複数の参照を追加したり、インターフェース上に描画したり、音声を使って変更内容を説明したりできます。

実行中のアプリ内の要素をクリックし、選択した要素に対してプロンプトを入力して、エージェントにコード編集を行わせてください。

変更が要素間の関係性に依存する場合、マルチセレクトは有用です。2 つのコンポーネントを参照して、一方を他方に一致させたり、重複するコンテンツを削除したり、一連のコンポーネントをまとめて調整するようにエージェントに指示できます。

複数の要素を選択し、それらがどのように一緒に変更されるべきかを記述してください。

指示がページのどの領域に適用されるかをエージェントに理解させる必要がある場合、描画機能は有用です。混雑した部分を円で囲んだり、特定の領域を四角で囲んだり、アニメーションページの一部にマークをつけたりできます。注釈はビューポートの凍結フレーム上に重ねられるため、エージェントはあなたが応答していたページの正確な状態を確認できます。

今回のリリースでは、音声を使って指示を伝えることも可能になり、ターゲット指定がより精密になり、体験も高速化されました。これにより、デザインモードでの視覚的なインタラクションが、通常の編集ループの一部であるかのような感覚になります。

変更を記述するために、音声入力と描画機能を組み合わせて使用してください。

内部では、要素を選択すると、コンテキストに 2 つの補完的なシグナルが追加されます。1 つは要素のアイデンティティ(xpath、コンポーネント、属性、計算されたスタイル、ファイバーツリーからのプロップス)であり、もう 1 つは空間的文脈のためのスクリーンショット(レイアウト、周囲の要素、および正確なページ状態)です。これにより、エージェントはソースを特定し、コードを効率的に編集するために必要な情報をすべて得ることができます。

ワークのリズムに合わせてモデルを調整する

ユーザーインターフェースを洗練させる際、通常は1 つの編集が次の編集へとつながっていきます。コンポーネントを調整し、その周囲のスペースに気づき、別のコンポーネントがどのように一致すべきかを確認します。

Design Mode(デザインモード)を使えば、気づいた瞬間にその編集を送信できます。ある要素を指差して変更を説明し、ページの別の部分へ移動し、最初の編集が完了する前に次の編集を送信することも可能です。Design Mode はマルチタスクをより容易にし、複数のサブエージェントの管理も可能にします。

このフローは、ターゲットを絞った UI 変更を迅速に行えるモデルと最も相性が良いです。Composer 2.5 は、インターフェース作業において高速かつ強力であるため、これに優れています。エージェントが完了するたびにアプリがホットリロードされ、実行中のプロダクト内で変更が表示されるのを確認しながら、インターフェースが適切になるまで続行できます。

私たちは、ソフトウェア構築の未来は、ユーザーがフロー状態(集中状態)で作業したいときに、より高レベルな抽象化と低レベルの詳細の間をシームレスに移動できるものであると考えています。Design Mode は、その実現を可能にするための制御権、自律性、そして精密な編集ツールをユーザーに提供します。

Agents Window で Design Mode をお試しください。詳しくは Browser docs をお読みいただくか、Cursor をダウンロードして始めましょう。

原文を表示

Chat is one interface for working with agents, but UI work tends to be spatial. Designers, PMs, and frontend developers often communicate through annotations that point to elements, regions, or the state of the page.

Design Mode, which we're updating today, is part of how we're shrinking the distance between what you see and what the agent understands. It lets you edit your product in context while staying in flow.

From the Cursor browser, you can click any element, draw on the page, or describe the change by voice, and Cursor gets the context it needs to edit the code while you move on to the next edit.

It is a faster, easier way to iterate on design changes with agents because the instruction is no longer just a sentence—instead it can include the selected element, the code behind it, the surrounding layout, and the visual relationships on the page.

This makes the loop between noticing and editing tighter. You can point at the part of the interface you mean without leaving the running product, then keep making references against the product itself while agents make the edits underneath.

Point, draw, or narrate the change

Design Mode provides several ways for you to convey intent to the agent. You can select an element, add multiple references, draw over the interface, or use your voice to describe the change.

Multi-select is useful when the change depends on a relationship between elements. You can reference two components and ask the agent to make one match the other, remove repeated content, or adjust a group of components together.

Drawing is useful when the agent needs to know what area of the page the instruction applies to. You can circle a crowded section, box in a region, or mark part of an animated page. The annotation sits over a frozen frame of the viewport, so the agent sees the exact page state you were responding to.

In this release, you can also narrate instructions using your voice, and we've made targeting more precise and the experience faster. Altogether, this makes visual interactions in Design Mode feel more like part of a normal editing loop.

Under the hood, picking an element adds two complementary signals into context: the element's identity (xpath, the component, attributes, computed styles, props from the fiber tree) and a screenshot for spatial context (layout, surrounding elements, and the exact page state). This gives the agent exactly what it needs to find the source and edit the code efficiently.

Matching the model to the rhythm of the work

When you are refining a user interface, one chain of edits usually leads to the next. You adjust a component, notice the spacing around it, then see how another component should match.

Design Mode lets you send those edits away as you notice them. You can point at one element, describe the change, move to another part of the page, and send another edit before the first one has finished. Design Mode allows you to multitask more easily and makes managing multiple subagents possible.

This flow works best with a model that can make targeted UI changes quickly. Composer 2.5 excels at this because it is both fast and strong at interface work. As agents finish, the app hot reloads. You see the changes appear in the running product and keep going until the interface feels right.

We believe the future of building software lets users move seamlessly between higher levels of abstraction and lower-level details while working in flow state when they want to. Design Mode provides users with the control, agency, and precision editing tools that make that possible.

Try Design Mode in the Agents Window. Read the Browser docs to learn more, or download Cursor to get started.

この記事をシェア

関連記事

TechCrunch AI★42026年6月11日 23:23

DoorDash の新 AI チャットボット、プロンプトと写真で注文可能に

配食デリバリー大手の DoorDash が、ユーザーがテキストのプロンプトや料理の写真を入力するだけで注文できる新しい AI チャットボットを発表した。

MarkTechPost★42026年6月10日 17:26

Anthropic、Claude Fable 5 と Claude Mythos 5 を発表:基盤モデルは同一だが安全策が異なり、新「Mythos クラス」 tiers 登場

Anthropic は 2026 年 6 月 9 日、能力が Opus クラスを上回る新 tiers「Mythos クラス」に属する Claude Fable 5 と Claude Mythos 5 を発表した。Fable 5 は一般利用向けに安全策を強化し、Mythos 5 は一部制限を解除した限定版として提供される。

TechCrunch AI★32026年6月9日 03:23

Apple、新しい「Siri in Camera」機能で請求書分割の煩わしさを解消

Apple は新機能「Siri in Camera」を導入し、ユーザーがカメラを通じて請求書を撮影するだけで、Siri が自動的に金額を認識し、友人との間で請求を公平に分割できるようにする機能を追加した。

今日のまとめ

AI日報で今日の重要ニュースをまとめ読み

ニュース一覧に戻る元記事を読む