SyGra Studioの紹介
SyGra Studioは、グラフィックデザインを効率的に作成・編集できる新しいソフトウェアツールです。直感的なインターフェースと高度な機能を備え、クリエイターのワークフローを向上させます。
キーポイント
SyGra 2.0.0に統合された「Studio」は、合成データ生成を視覚的・対話的に設計・実行できる環境を提供する
複数の主要LLMプロバイダー(OpenAI、Azure、Ollama、Vertex AIなど)とデータソース(Hugging Face、ServiceNowなど)を統合し、ワークフロー構築を簡素化
プロンプト編集、変数参照、実行監視、デバッグ機能を単一ペインで実現し、生成される設定ファイル(YAML/JSON)は従来のSyGraと互換性を維持
影響分析・編集コメントを表示
影響分析
合成データ生成のプロセスをコード中心からビジュアル・インタラクティブな設計へ転換し、AI開発のアクセシビリティと生産性を向上させる。特に、プロンプト調整とデータ生成のリアルタイムプレビュー機能は、反復的な開発ワークフローを効率化し、企業における大規模な合成データ活用を促進する可能性がある。
編集コメント
「コードを書かずにAIワークフローを構築」というトレンドの新たな実装例。Hugging Faceエコシステムとの緊密な連携により、研究者から企業ユーザーまで幅広い層への訴求力を高めている。
SyGra Studioの紹介:合成データ生成を視覚的・対話的に実現する新環境
SyGra 2.0.0で導入された「Studio」は、合成データの生成プロセスを、透明性が高く視覚的な作業へと変革するインタラクティブな開発環境です。従来のYAMLファイルやターミナルでの煩雑な操作を置き換え、単一の画面で直感的にワークフローを構築・実行・監視できます。
主要な特徴と機能
- 視覚的フロー構築: キャンバス上でノードをドラッグ&ドロップしてパイプラインを直接デザインできます。実行前にデータセットをプレビューし、プロンプトをインラインの変数ヒント付きで調整可能です。
- 包括的なモデル・データソース対応: OpenAI、Azure OpenAI、Ollama、Vertex AI、Bedrock、vLLM、カスタムエンドポイントなど多様なモデルをガイド付きフォームで設定・検証できます。データソースはHugging Face、ファイルシステム、ServiceNowを接続でき、実行前にサンプル行を確認可能です。
- 統合的な開発・デバッグ環境: プロンプト編集時には利用可能な状態変数が自動提案され、インラインログ、ブレークポイント、Monacoエディタによるコード編集、自動保存ドラフト機能によりデバッグを支援します。実行時はノード単位の進捗、トークン使用量、レイテンシー、コストをリアルタイムで監視でき、実行履歴は
.executions/ディレクトリに保存されます。
- 透明性と互換性: 視覚的操作の裏側では、常に対応するSyGra互換のグラフ設定とタスク実行スクリプトが自動生成されます。「コードパネル」で生成中の正確なYAML/JSONを随時確認でき、これは実際に
tasks/examples/に書き出されるものと同一です。
基本的なワークフローの例
- データソースの設定: コネクタ(例:Hugging Face)を選択し、リポジトリIDやファイルパスなどのパラメータを入力後、「プレビュー」をクリックしてサンプルデータを取得。カラム名は自動的に状態変数(例:
{prompt})となり、プロンプト内で参照可能になります。
- フローの視覚的構築: パレットから必要なノードを配置。例えば、物語生成パイプラインでは、最初のLLMノード(「ストーリー生成器」)でモデルを選択しプロンプトを記述、結果を
story_body変数に保存。次に、二つ目のLLMノード(「要約器」)を追加し、そのプロンプト内で{story_body}を参照して要約をstory_summaryに出力する、といった設計が可能です。構造化出力の切り替え、ツールの追加、再利用可能なロジックのためのLambda/サブグラフノードの組み込みもサポートされます。
- 実行と監視: レコード数やバッチサイズなどを設定後、「実行」をクリック。専用パネルでノードのステータス、トークン使用量
原文を表示
Introducing SyGra Studio Back to Articles Introducing SyGra Studio
SyGra 2.0.0 introduces Studio, an interactive environment that turns synthetic data generation into a transparent, visual craft. Instead of juggling YAML files and terminals, you compose flows directly on the canvas, preview datasets before committing, tune prompts with inline variable hints, and watch executions stream live—all from a single pane. Under the hood it’s the same platform, so everything you do visually generates the corresponding SyGra compatible graph config and task executor scripts.
Configure and validate models with guided forms (OpenAI, Azure OpenAI, Ollama, Vertex, Bedrock, vLLM, custom endpoints).
Connect Hugging Face, file-system, or ServiceNow data sources and preview rows before execution.
Configure nodes by selecting models, writing prompts (with auto-suggested variables), and defining outputs or structured schemas.
Design downstream outputs using shared state variables and Pydantic-powered mappings.
Execute flows end-to-end and review generated results instantly with node-level progress.
Debug with inline logs, breakpoints, Monaco-backed code editors, and auto-saved drafts.
Monitor per-run token cost, latency, and guardrail outcomes with execution history stored in .executions/.
Let’s walk through this experience step by step.
Step 1: Configure the data source
Open Studio, click Create Flow, and Start/End nodes appear automatically. Before adding anything else:
Choose a connector (Hugging Face, disk, or ServiceNow).
Enter parameters like repo_id, split, or file path, then click Preview to fetch sample rows.
Column names immediately become state variables (e.g., {prompt}, {genre}), so you know exactly what can be referenced inside prompts and processors.
Once validated, Studio keeps the configuration in sync and pipes those variables throughout the flow—no manual wiring or guesswork.
Step 2: Build the flow visually
Drag the blocks you need from the palette. For a story-generation pipeline:
Drop an LLM node named “Story Generator,” select a configured model (say, gpt-4o-mini), write the prompt, and store the result in story_body.
Add a second LLM node named “Story Summarizer,” reference {story_body} inside the prompt, and output to story_summary.
Toggle structured outputs, attach tools, or add Lambda/Subgraph nodes if you need reusable logic or branching behavior.
Studio’s detail panel keeps everything in context—model parameters, prompt editor, tool configuration, pre/post-process code, and even multi-LLM settings if you want parallel generations. Typing { inside a prompt surfaces every available state variable instantly.
Open the Code Panel to inspect the exact YAML/JSON Studio is generating. This is the same artifact written to tasks/examples/, so what you see is what gets committed.
Choose record counts, batch sizes, retry behavior etc.
Hit Run and watch the Execution panel stream node status, token usage, latency, and cost in real time. Detailed logs provide observability and make debugging effortless. All executions are written to .executions/runs/*.json.
After the run, download outputs, compare against prior executions, get metadata of latency and usage details.
Run the Glaive Code Assistant workflow
SyGra Studio can also execute existing workflow in the tasks. For example, in the tasks/examples/glaive_code_assistant/ workflow — it ingests the glaiveai/glaive-code-assistant-v2 dataset, drafts answers, critiques them, and loops until the critique returns “NO MORE FEEDBACK.”
Canvas layout – two LLM nodes (generate_answer and critique_answer) linked by a conditional edge that either routes back for more revisions or exits to END when the critique is satisfied.
Tunable inputs – the Run modal lets you switch dataset splits, adjust batch sizes, cap records, or tweak temperatures without touching YAML.
Observable execution – watch both nodes light up in sequence, inspect intermediate critiques, and monitor status in real time.
Generated outputs – synthetic data is generated, ready for model training, evaluation pipelines or annotation tools.
git clone https://github.com/ServiceNow/SyGra.git cd SyGra && make studio Docs: https://servicenow.github.io/SyGra/
Studio Docs: https://servicenow.github.io/SyGra/getting_started/create_task_ui/
Example config: tasks/examples/glaive_code_assistant/graph_config.yaml
SyGra Studio turns synthetic data workflows into a visual, user friendly experience. Configure once, build with confidence, run with full observability, generate the data without ever leaving the canvas.
SyGra Studio looks like a powerful platform for synthetic data generation workflows! For teams working with complex data pipelines like this, clear system documentation is essential. I've been using InfraSketch (https://www.infrasketch.net/) to document our ML infrastructure—you describe your system architecture in plain English and it generates diagrams that you can refine conversat
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み