AIニュース最前線
最新ニュースAI日報Hacker日報週報動画AIツールトレンド企業

AIニュース最前線

世界中のAI最新情報を日本語で毎時更新

最新ニュース日報トレンド企業プレミアムRSS
© 2026 ainew.jp特定商取引法に基づく表記
ニュース一覧元記事を開く
NVIDIA Developer Blog·2026年4月18日 03:59·約16分で読める

OpenClawとNVIDIA NemoClawで安全な常時稼働型ローカルAIエージェントを構築

#AIエージェント#ローカルAI#自律システム#ワークフロー自動化#NVIDIA#オープンソース
TL;DR

NVIDIAは、OpenClawとNVIDIA NemoClawを用いて、ファイル読み込みやAPI呼び出し、マルチステップワークフローを自律的に駆動する、常時稼働型のローカルAIエージェントを安全に構築する方法を開発者向けに紹介している。

AI深層分析2026年4月18日 04:40
4
重要/ 5段階
深度40%
4
関連度30%
5
実用性20%
4
革新性10%
4

キーポイント

1

AIエージェントの進化

従来のQ&Aシステムから、ファイルを読み、APIを呼び出し、マルチステップのワークフローを自律的に駆動する、常時稼働型の自律アシスタントへと進化している。

2

ローカル実行によるセキュリティ

OpenClawとNVIDIA NemoClawを組み合わせることで、データを外部に送信せず、ローカル環境で安全にAIエージェントを構築・実行できる。

3

実用的な自律ワークフロー

複数のステップからなる業務プロセスを、人間の介入を最小限に抑えながら、AIエージェントが自律的に実行・管理できるようになる。

4

NVIDIAの開発者向け提供

NVIDIAは、自社の技術スタック(NemoClaw)とオープンソースプロジェクト(OpenClaw)を組み合わせ、実用的なAIエージェント構築のための具体的な方法論とツールを開発者コミュニティに提供している。

影響分析・編集コメントを表示

影響分析

この記事は、AIエージェントの実用化における重要な一歩を示しており、特にデータセキュリティが懸念される企業環境でのAI導入に道を開く可能性がある。NVIDIAが自社プラットフォームとオープンソースを組み合わせたソリューションを提示することで、エコシステムの強化と開発者コミュニティの囲い込みを図っている。

編集コメント

NVIDIAが開発者向けに具体的な実装方法を公開することで、次世代AIエージェントの実用化をリードしようとする戦略が明確。セキュリティと実用性を両立させたローカルエージェントは、企業導入の大きな障壁を下げる可能性がある。

エージェントは、質問応答システムから、ファイルの読み取り、API呼び出し、マルチステップワークフローの駆動を行う長時間実行型の自律型アシスタントへと進化しています。しかし、適切な分離(アイソレーション)なしにコードの実行やツールの使用をエージェントに委ねることは、実際のリスクを伴います。特にデータプライバシーと制御の観点から、サードパーティ製のクラウドインフラストラクチャを使用する場合はなおさらです。

NVIDIA NemoClawは、NVIDIA OpenShellをオーケストレートしてOpenClawを実行するオープンソースのレファレンススタックです。OpenClawは、NVIDIA Nemotronなどのオープンモデルで動作するAIコーディングエージェントとメッセージングプラットフォームを接続するセルフホスト型のゲートウェイです。NemoClawは、ガイド付きのオンボーディング、ライフサイクル管理、イメージのハードニング(強化)、バージョン管理されたブループリントを追加し、モデル推論からより安全で対話的なエージェント展開までの完全なパイプラインを提供します。

このチュートリアルでは、NVIDIA DGX Spark上でのNemoClaw展開手順を解説します。ランタイム環境の構成とモデルのローカルサービングから、NemoClawスタックのインストール、Telegramへの接続によるリモートアクセスまでを順を追って説明します。最終的に、あなたのハードウェア上で動作し、任意のTelegramクライアントからアクセス可能なローカル環境のサンドボックス化された(サンドボックス化)AIアシスタントを構築できます。

ビデオ1. 自律型長時間実行エージェントのセットアップ手順

モデルとコードへのクイックリンク

以下のリソースにアクセスしてチュートリアルを進めてください:

🧠 ソフトウェアとモデル:

DGX Spark上でのNemoClaw、NVIDIA Nemotron 3 Super、Telegramのセットアップ:ローカル推論を用いたNemoClaw構築のためのエンドツーエンドガイド。

NVIDIA Build上のNVIDIA Nemotron 3 Super 120B:本チュートリアルで使用されるモデル。

🛠️ コードとドキュメント:

NVIDIA NemoClawドキュメント:構成、ポリシー、高度な展開に関する完全なリファレンス。

GitHub上のNVIDIA NemoClaw:ソースコードとコミュニティによる貢献。

NVIDIA DGX Spark:ハードウェア仕様と開発者向けリソース。

Prerequisites

完全なセットアップ手順については、DGX Spark Playbook for NemoClawをご覧ください。または、ハードウェア不要で開始することもできます。

他のデバイスを使用する場合は、ドキュメントの「代替展開」セクションに記載されているデバイスでNemoClawがテストおよび検証されています。API/VLLMの対応能力を確認してください。

セットアップを開始する前に、以下の要件を満たしていることを確認してください:

ハードウェア:最新のNVIDIAドライバーがインストールされたUbuntu 24.04 LTS上で動作するDGX Spark(GB10)システム。

Docker:バージョン28.x以降。NVIDIAコンテナランタイムが構成されていること(次のセクションで解説)。

Ollama:ローカルモデルサービングエンジンとしてインストール済み。

Telegramボットトークン:Telegramの@BotFatherを通じて作成済み(Telegram統合セクションで詳細解説)。

所要時間:アクティブなセットアップに約20〜30分、初期モデルのダウンロード(約87GB)にネットワーク帯域幅に応じて15〜30分。

以下のコマンドでシステムの準備状況を検証します:

head -n 2 /etc/os-release nvidia-smi docker info --format '{{.ServerVersion}}'

NemoClawのコンポーネント

サンドボックス化されたアシスタントを構築する前に、この環境で使用されるソフトウェアを理解することが重要です。

コンポーネント|何であるか|機能|使用時|NVIDIA NemoClaw|OrchestrationレイヤーとInstallerを備えた参照スタック|OpenClawとOpenShell、ポリシー、推論処理をインストール。|より安全なサンドボックス内で常時稼働するアシスタントを作成する最速の方法。|NVIDIA OpenShell|セキュリティランタイムおよびゲートウェイ|安全境界(サンドボックス化)を適用し、資格情報を管理し、ネットワーク/API呼び出しのプロキシを行う。|機密情報の公開や無制限のWebアクセスを許可せずにエージェントを実行する「ウォールドガーデン」が必要な場合。|OpenClaw|マルチチャネルエージェントフレームワーク|サンドボックス内で動作。チャットプラットフォーム(Slack/Discord)、メモリ、ツール統合を管理。|メッセージングアプリに接続し、永続的なメモリを持つ長期稼働型エージェントを作成する必要がある場合。|NVIDIA Nemotron 3 Super 120B|エージェント最適化LLM(120Bパラメータ)|「脳」を提供し、高度な指示追従とマルチステップ推論能力を備える。|ツールを使用し複雑なワークフローに従う必要がある本番環境グレードのアシスタント向け。|NVIDIA NIM / Ollama|推論デプロイメント|Nemotronモデルをローカルで実行。|GPUを所有し、LLMをローカルで実行したい場合。|表1. NVIDIA NemoClawスタックのアーキテクチャコンポーネント

セキュリティに関する注意:OpenShellは堅牢な分離機能を提供しますが、高度なプロンプトインジェクション(prompt injection)に対して完全な保護を提供するサンドボックスはないことを覚えておいてください。新しいツールをテストする際は、常に分離されたシステムにデプロイしてください。

それでは始めましょう。

ランタイムの設定

DGX Sparkには、適切な分離設定を備えたGPUアクセラレーション対応コンテナをサポートするためのDocker設定手順が複数必要です。まず、NVIDIAコンテナランタイム(NVIDIA container runtime)をDockerに登録することから始めます:

sudo nvidia-ctk runtime configure --runtime=docker

次に、cgroupネームスペースモード(cgroup namespace mode)をhostに設定します。この設定は、DGX Sparkがコンテナ化されたワークロード(containerized workloads)と正しく動作するために必要です:

sudo python3 -c "import json, ospath = '/etc/docker/daemon.json'd = json.load(open(path)) if os.path.exists(path) else {}d['default-cgroupns-mode'] = 'host'json.dump(d, open(path, 'w'), indent=2)"

変更を適用し、NVIDIAランタイムが正常に機能していることを確認するためにDockerを再起動します:sudo systemctl restart dockerdocker run --rm --runtime=nvidia --gpus all ubuntu nvidia-smi

出力にはGB10 GPUが表示されるはずです。以降のDockerコマンドでsudoを不要にするため、現在のユーザーをDockerグループに追加します:

sudo usermod -aG docker $USERnewgrp docker

Ollamaのインストール

Ollamaは、大規模言語モデル(large language models / LLM)をローカルで実行するための軽量なモデルサービングエンジン(model-serving engine)です。公式インストーラーを使用してインストールします:

curl -fsSL https://ollama.com/install.sh | sh

デフォルトでは、Ollamaはlocalhost上でのみリッスンします。NemoClawエージェントは独自のネットワークネームスペース(network namespace)を備えたサンドボックス内で実行されるため、ネットワーク境界を跨いでOllamaに到達する必要があります。Ollamaがすべてのインターフェースでリッスンするように設定します:

sudo mkdir -p /etc/systemd/system/ollama.service.d

printf '[Service]\nEnvironment="OLLAMA_HOST=0.0.0.0"\n' | \

sudo tee /etc/systemd/system/ollama.service.d/override.conf

sudo systemctl daemon-reload

sudo systemctl restart ollama

Ollama がすべてのインターフェースで実行され、アクセス可能であることを確認します:

curl http://0.0.0.0:11434

重要:Ollama は systemd 経由でのみ起動してください。手動で起動した Ollama プロセスは OLLAMA_HOST=0.0.0.0 の上書き設定を反映せず、NemoClaw サンドボックス(sandbox)は推論サーバー(inference server)に到達できません。

sudo systemctl restart ollama

次に、Nemotron 3 Super 120B モデルを pull します。ダウンロードサイズは約 87 GB です:

ollama pull nemotron-3-super:120b

ダウンロードが完了したら、最初のエージェント(agent)インタラクション時のコールドスタート遅延(cold-start latency)を避けるため、モデルの重み(model weights)を GPU メモリにプリロードしてください:

ollama run nemotron-3-super:120b

モデルが読み込まれてプロンプトが表示されたら、/bye でセッションを終了してください。重みはメモリにキャッシュされたままになります。モデルが利用可能であることを確認します:

ollama list

NAME ID SIZE MODIFIED

nemotron-3-super:120b 95acc78b3ffd 86 GB 2 weeks ago

NemoClaw のインストール

基盤が整ったので、単一のコマンドで NemoClaw をインストールします:

curl -fsSL https://www.nvidia.com/nemoclaw.sh | bash

インストーラーは Node.js 依存関係、OpenShell ランタイム(runtime)、および NemoClaw CLI を提供し、その後オンボーディングウィザード(onboarding wizard)を起動します。ウィザードは以下の設定項目の入力を促します:

サンドボックス名(Sandbox name):ハイフンを含む小文字の英数字の名前を指定します(例:my-assistant)。この名前は後続のコマンドすべてで使用されます。

推論プロバイダー(Inference provider):ローカルの Ollama インスタンスへ推論をルーティングするよう「Local Ollama」(オプション 7)を選択します。

モデル(Model):nemotron-3-super:120b(オプション 1)を選択します。

ポリシープリセット(Policy presets):デフォルトのポリシーを受け入れる場合は Y を押します。これらのプリセットは、サンドボックスに対するファイルシステム(filesystem)およびネットワークの制限を設定します。

Telegram 統合(Telegram integration):オンボーディングウィザードのステップ 5 で、オプションとして Telegram ボットの設定を行うことができます。

オンボーディングプロセスの終了時、インストーラーは http://127.0.0.1:18789/#token=<long-token-here> という形式のトークン付与された Web UI URL を表示します。この URL は今後のウェブダッシュボード(web dashboard)へのアクセスに必要であり、再度表示されないため記録してください。

インストール後に nemoclaw コマンドが認識されない場合は、シェル環境(shell environment)をリロードして、今後のすべてのセッションで有効にしてください:

source ~/.bashrc

セットアップの確認

サンドボックスに接続し、エージェントが推論バックエンド(inference backend)に到達できることを確認します:

nemoclaw my-assistant connect

このコマンドは、サンドボックス環境(sandboxed environment)がOllamaと通信できることを確認するモデル情報を返します。次に、エージェントを介してテストメッセージを送信してください:

openclaw agent --agent main --local -m "hello" --session-id test

設定が正しければ、NVIDIA Nemotron 3 Super が応答を生成します。120B モデルの推論(inference)には通常、応答ごとに 30〜90 秒かかることに注意してください。これはローカル推論(local inference)を実行するこの規模のモデルでは想定される動作です。

インタラクティブターミナルUI(interactive terminal UI)は、より対話的なテスト体験を提供します:

openclaw tui

完了したら、Ctrl+C を押してターミナルUIを終了してください。

ウェブUIへのアクセス

ローカルでウェブダッシュボード(web dashboard)にアクセスするには、サンドボックスを終了し、オンボーディング時に記録されたトークン付きURLを開きます:

exit

次に、ブラウザで http://127.0.0.1:18789/#token=<long-token-here> にアクセスしてください。

別のマシンからのリモートアクセス。ネットワーク経由でDGX Sparkに直接接続するのではなくアクセスする場合、追加の設定が必要です。まず、SparkのIPアドレスを特定します:

hostname -I | awk '{print $1}'

Sparkのターミナルセッションを介してポートフォワーディング(port forwarding)を開始します:

openshell forward start 18789 my-assistant --background

リモートマシンから、SparkへのSSHトンネル(SSH tunnel)を作成します:

ssh -L 18789:127.0.0.1:18789 <your-user>@<your-spark-ip>

トンネルが稼働している状態で、リモートマシンのブラウザで http://127.0.0.1:18789/#token=<long-token-here> を開きます。

注意:127.0.0.1 のみを指定してください。localhost を使用すると、「origin not allowed」エラーが発生する場合があります。

Telegramへの接続

Telegram統合(Telegram integration)により、アシスタントはローカルターミナルの範囲を超え、Telegramクライアントを備えたあらゆるデバイスからアクセス可能になります。

Telegramボットの作成

Telegramを開き、@BotFather を検索してボットを管理します。会話を開始し、/newbot コマンドを使用してください。@BotFather がボットの名前付けをガイドし、完了するとAPIトークンを提供します。このトークンは後続の設定ステップのために保存してください。

注意:NemoClawのオンボーディングウィザード中にTelegramを設定した場合は、すでにサンドボックス内でTelegramが実行されています。

オンボーディング中にTelegramを設定しなかった場合は、トークンを設定してオンボーディングウィザードを再実行してください。これにより、Telegramを組み込んでサンドボックスが再構築されます。ボットトークンはOpenShellゲートウェイに登録され、サンドボックス内には直接入力されません。

export TELEGRAM_BOT_TOKEN=<your-bot-token>nemoclaw onboard

統合の確認

Telegramを開き、ボットを見つけてメッセージを送信してください。初回接触時、OpenClawではペアリング(pairing)が必要です。ボットは以下のペアリングコードで応答します:

OpenClaw: access not configured. Your Telegram user id: <your-id> Pairing code: <CODE>

サンドボックス内からペアリングを承認します:

nemoclaw my-assistant connect openclaw pairing approve telegram <CODE>exit

Telegramで別のメッセージを送信してください。推論レイテンシーウィンドウ(inference latency window)が経過した後、ボットはNVIDIA Nemotron 3 Super によって生成された応答を返すはずです。

ここまででデプロイは完了です。AIアシスタントはNVIDIA DGX Spark上で完全に動作しており、OpenShellによってサンドボックス(sandbox)化され、120Bパラメータのオープンモデルを搭載し、Telegramを介してリモートからアクセス可能です。すべての推論(inference)はローカルで行われ、デバイスの外にデータが一切送出されることはなく、実行時(runtime)に外部サービスの依存関係もありません。

デプロイメントの参照としてどのようなコマンドがありますか?

以下のコマンドは、NemoClawデプロイメントの継続的な管理に役立ちます。

コマンド説明nemoclaw my-assistant connectサンドボックス(sandbox)内でシェルセッションを開く。nemoclaw my-assistant statusサンドボックスのステータスを表示。nemoclaw my-assistant logs --followライブサンドボックスログをストリーミング。nemoclaw list設定されたすべてのサンドボックスを一覧表示。nemoclaw start / nemoclaw stop補助サービス(Telegramブリッジなど)の開始または停止。openshell forward start 18789 my-assistant --backgroundリモートWeb UIアクセスのためのポートフォワーディング(port forwarding)を有効化。表2. NemoClawエージェント環境のオーケストレーション、監視、およびアクセス用のコマンド

クリーンなアンインストール用のコマンド

クリーンアップとアンインストールには、NemoClawが ~/.nemoclaw/source/uninstall.sh にアンインストーラーを提供しています。クリーンアップフラグの詳細や一般的な問題のトラブルシューティングについては、説明書ページを参照してください。

ポリシー承認によるエージェントアクセスの拡張

デフォルトでは、サンドボックスはエージェントのアクセスを限られた数のネットワークエンドポイント(network endpoints)に制限します。外部サービスへのアクセスが必要なタスクをエージェントに依頼した場合、

例えばWebページの取得やサードパーティAPIの呼び出しなど、OpenShellはリクエストをブロックし、エージェントはネットワークアクセスが利用できないと報告します。

実際の動作を確認するには、ホストのターミナルで1つOpenShell TUI(Terminal User Interface)を開きます:

openshell term

2つ目のターミナルでサンドボックスに接続し、会話を開始します:

openclaw tui

エージェントに「curl を使用して https://httpbin.org/get を取得する」などのタスクを依頼します。

エージェントがリクエストを試みると、OpenShellがそれをブロックし、TUIには宛先ホスト、ポート、およびリクエストを開始したバイナリ(binary)情報が表示されます。

TUIから、現在のセッションに対してリクエストを承認するか、エンドポイントをブロックしたままにするために拒否することができます。

エンドポイントを恒久的に追加したい場合は、ホストからポリシープリセット(policy preset)を使用します:

nemoclaw my-assistant policy-add

この承認フローにより、基本ポリシーの変更やサンドボックスの再起動を行わずに、エージェントがアクセスできるリソースをリアルタイムで可視化し制御することが可能になります。

はじめに

今日からNVIDIA NemoClawでの構築を始めましょう。

NVIDIAニュースを購読し、LinkedIn、X、Discord、YouTubeでNVIDIA AIをフォローして、NVIDIA NemoClawの最新情報を入手してください。

入門リソースについてはNemoClawページをご覧ください。GitHubでNemoClawを探索し、build.nvidia.comで利用可能なPlaybookを確認してください。

NVIDIAフォーラムとDiscordで、Nemotronのライブ配信、チュートリアル、開発者コミュニティに参加してください。

原文を表示

Agents are evolving from question-and-answer systems into long-running autonomous assistants that read files, call APIs, and drive multi-step workflows. However, deploying an agent to execute code and use tools without proper isolation raises real risks—especially when using third-party cloud infrastructure due to data privacy and control.

NVIDIA NemoClaw is an open-source reference stack that orchestrates NVIDIA OpenShell to run OpenClaw, a self-hosted gateway that connects messaging platforms to AI coding agents powered by open models like NVIDIA Nemotron. NemoClaw adds guided onboarding, lifecycle management, image hardening, and a versioned blueprint, providing a complete pipeline from model inference to more secure, interactive agent deployment.

This tutorial walks through a NemoClaw deployment on NVIDIA DGX Spark—from configuring the runtime environment and serving the model locally, to installing the NemoClaw stack and connecting it to Telegram for remote access. You’ll build a local, sandboxed AI assistant that runs on your hardware and is accessible from any Telegram client.

Video 1. A walkthrough on how to set up your autonomous long-running agent

Quick links to the model and code

Access the following resources for the tutorial:

🧠 Software and models:

NemoClaw with NVIDIA Nemotron 3 Super and Telegram on DGX Spark: An end-to-end guide for setting up NemoClaw with local inference.

NVIDIA Nemotron 3 Super 120B on NVIDIA Build: The model used for the tutorial.

🛠️ Code and documentation:

NVIDIA NemoClaw documentation: Complete reference for configuration, policies, and advanced deployment.

NVIDIA NemoClaw on GitHub: Source code and community contributions.

NVIDIA DGX Spark: Hardware specifications and developer resources.

Prerequisites

For full setup instructions, visit the DGX Spark Playbook for NemoClaw, or get started with no hardware needed.

If you intend to use another device, NemoClaw is tested and validated on devices listed under alternative deployments in the documentation. Check for API/VLLM capability.

Before beginning setup, ensure the following requirements are met:

Hardware: DGX Spark (GB10) system running Ubuntu 24.04 LTS with the latest NVIDIA drivers.

Docker: Version 28.x or higher, with the NVIDIA container runtime configured (covered in the next section).

Ollama: Installed as the local model-serving engine.

Telegram bot token: Created through Telegram’s @BotFather (detailed in the Telegram integration section).

Estimated time: Approximately 20–30 minutes of active setup, plus 15–30 minutes for the initial model download (~87 GB), depending on network bandwidth.

The following commands verify system readiness:

head -n 2 /etc/os-release    nvidia-smi                     docker info --format '{{.ServerVersion}}'

The NemoClaw components

Before building a sandboxed assistant, it’s important to understand the software used in this environment.

ComponentWhat it isWhat it doesWhen to use ItNVIDIA NemoClawReference stack with Orchestration layer and InstallerInstalls OpenClaw and OpenShell with policies and inference.Fastest way to create an always-on assistant in a more secure sandbox.NVIDIA OpenShellSecurity runtime and gatewayEnforces safety boundaries (sandboxing), manages credentials, and proxies network/API calls.When you need a “walled garden” to run agents without exposing sensitive information or enabling unrestricted web access.OpenClawMulti-channel agent frameworkLives inside the sandbox. Manages chat platforms (Slack/Discord), memory, and tool integration.When you need to create a long-lived agent connected to messaging apps and persistent memory.NVIDIA Nemotron 3 Super 120BAgent-optimized LLM (120B Parameters)Provides the “brain” with high instruction-following and multi-step reasoning capabilities.For production-grade assistants who need to use tools and follow complex workflows.NVIDIA NIM / OllamaInference deploymentsRuns the Nemotron model locally If you have a GPU and want to run the LLM locallyTable 1. Architectural components of the NVIDIA NemoClaw stack

Security note: While OpenShell provides robust isolation, remember that no sandbox offers complete protection against advanced prompt injection. Always deploy on isolated systems when testing new tools.

Let’s get started.

Configure the runtimes

DGX Spark requires several Docker configuration steps to support GPU-accelerated containers with the appropriate isolation settings. Start by registering the NVIDIA container runtime with Docker:

sudo nvidia-ctk runtime configure --runtime=docker

Next, set the cgroup namespace mode to host. This configuration is required for DGX Spark to work correctly with containerized workloads:

sudo python3 -c "import json, ospath = '/etc/docker/daemon.json'd = json.load(open(path)) if os.path.exists(path) else {}d['default-cgroupns-mode'] = 'host'json.dump(d, open(path, 'w'), indent=2)"Restart Docker to apply the changes and verify that the NVIDIA runtime is functioning:sudo systemctl restart dockerdocker run --rm --runtime=nvidia --gpus all ubuntu nvidia-smi

The output should display the GB10 GPU. To avoid requiring sudo for subsequent Docker commands, add the current user to the Docker group:

sudo usermod -aG docker $USERnewgrp docker

Install Ollama

Ollama is a lightweight model-serving engine for running large language models locally. Install it using the official installer:

curl -fsSL https://ollama.com/install.sh | sh

By default, Ollama listens only on localhost. Because the NemoClaw agent runs inside a sandbox, with its own network namespace, it must reach Ollama across network boundaries. Configure Ollama to listen on all interfaces:

sudo mkdir -p /etc/systemd/system/ollama.service.d                                                                                                                                                                                            printf '[Service]\nEnvironment="OLLAMA_HOST=0.0.0.0"\n' | \       sudo tee /etc/systemd/system/ollama.service.d/override.confsudo systemctl daemon-reload                                                                                                                                                                                                                  sudo systemctl restart ollama

Verify that Ollama is running and reachable on all interfaces:

curl http://0.0.0.0:11434

Important: Only start Ollama through systemd. A manually started Ollama process doesn’t pick up the OLLAMA_HOST=0.0.0.0 override, and the NemoClaw sandbox won’t reach the inference server.

sudo systemctl restart ollama

Next, pull the Nemotron 3 Super 120B model. The download is about 87 GB:

ollama pull nemotron-3-super:120b

Once the download completes, pre-load the model weights into GPU memory to avoid cold-start latency on the first agent interaction:

ollama run nemotron-3-super:120b

After the model loads and presents a prompt, exit the session with /bye. The weights will remain cached in memory. Confirm that the model is available:

ollama listNAME                     ID              SIZE     MODIFIED                                                                                                                                                                                        nemotron-3-super:120b    95acc78b3ffd    86 GB    2 weeks ago

Install NemoClaw

With the foundation in place, install NemoClaw with a single command:

curl -fsSL https://www.nvidia.com/nemoclaw.sh | bash

The installer provides Node.js dependencies, the OpenShell runtime, and the NemoClaw CLI, then launches an onboarding wizard. The wizard prompts for the following configuration choices:

Sandbox name: Specify a lowercase alphanumeric name with hyphens (for example, my-assistant). This name is used in all subsequent commands.

Inference provider: Select Local Ollama (option 7) to route inference to the local Ollama instance.

Model: Select nemotron-3-super:120b (option 1).

Policy presets: Press Y if you accept the default policies. These presets configure filesystem and network restrictions for the sandbox.

Telegram integration: You can optionally configure your Telegram bot during step 5 of the onboarding wizard.

At the end of the onboarding process, the installer displays a tokenized Web UI URL in the format http://127.0.0.1:18789/#token=<long-token-here>. Record this URL, as it is required to access the web dashboard in the future and won’t be shown again.

If the nemoclaw command isn’t recognized after installation, reload the shell environment to enable it for all future sessions:

source ~/.bashrc

Verify the setup

Connect to the sandbox and verify that the agent can reach the inference backend:

nemoclaw my-assistant connect

This command returns model information confirming that the sandboxed environment can communicate with Ollama. Next, send a test message through the agent:

openclaw agent --agent main --local -m "hello" --session-id test

If the configuration is correct, NVIDIA Nemotron 3 Super generates a response. Note that inference with the 120B model typically takes 30–90 seconds per response—this is expected for a model of this size running local inference.

The interactive terminal UI provides a more conversational testing experience:

openclaw tui

Use Ctrl+C to exit the terminal UI when finished.

Accessing the Web UI

To access the web dashboard locally, exit the sandbox and open the tokenized URL recorded during onboarding:

exit

Then navigate to http://127.0.0.1:18789/#token=<long-token-here> in a browser.

Remote access from another machine. If you’re accessing DGX Spark over the network rather than directly, additional configuration is required. First, determine the Spark’s IP address:

hostname -I | awk '{print $1}'

Start port forwarding through the Spark’s terminal session:

openshell forward start 18789 my-assistant --background

From your remote machine, create an SSH tunnel to the Spark:

ssh -L 18789:127.0.0.1:18789 <your-user>@<your-spark-ip>

With the tunnel active, open http://127.0.0.1:18789/#token=<long-token-here> in a browser on the remote machine.

Note: Only use 127.0.0.1. A localhost may result in an “origin not allowed” error.

Connect to Telegram

Telegram integration extends the assistant beyond the local terminal, making it accessible from any device with a Telegram client.

Create the Telegram bot

Open Telegram and search for @BotFather to manage your bots. Start a conversation and use the /newbot command. @BotFather guides you through naming the bot and provides an API token upon completion. Save this token for the configuration step below.

Note: If you configured Telegram during the NemoClaw onboarding wizard, Telegram is already running inside the sandbox.

If you didn’t configure Telegram during onboarding, rerun the onboarding wizard with the token set. This rebuilds the sandbox with Telegram baked in. The bot token is registered with the OpenShell gateway and doesn’t enter the sandbox directly.

export TELEGRAM_BOT_TOKEN=<your-bot-token>nemoclaw onboard

Verify the integration

Open Telegram, locate the bot, and send a message. On first contact, OpenClaw requires pairing. The bot will respond with a pairing code:

OpenClaw: access not configured. Your Telegram user id: <your-id> Pairing code: <CODE>

Approve the pairing from inside the sandbox:

nemoclaw my-assistant connect  openclaw pairing approve telegram <CODE>exit

Send another message in Telegram. After the inference latency window, the bot should return a response generated by NVIDIA Nemotron 3 Super.

At this point, the deployment is complete. An AI assistant is running entirely on NVIDIA DGX Spark, sandboxed by OpenShell, powered by a 120B open model, and accessible remotely through Telegram. All inference occurs locally no data leaves the device, and there are no external service dependencies at runtime.

What commands can I reference for deployment?

The following commands are useful for ongoing management of the NemoClaw deployment.

CommandDescriptionnemoclaw my-assistant connectOpen a shell session inside the sandbox.nemoclaw my-assistant statusDisplay sandbox status.nemoclaw my-assistant logs --followStream live sandbox logs.nemoclaw listList all configured sandboxes.nemoclaw start / nemoclaw stopStart or stop auxiliary services (Telegram bridge, etc.).openshell forward start 18789 my-assistant --backgroundEnable port forwarding for remote Web UI access.Table 2. Commands for orchestrating, monitoring, and accessing NemoClaw agent environments

Commands for a clean uninstall

For cleanup and uninstallation, NemoClaw provides an uninstaller at ~/.nemoclaw/source/uninstall.sh. Refer to the instructions page for details on cleanup flags and troubleshooting common issues.

Extending agent access with policy approvals

By default, the sandbox restricts the agent to a limited set of network endpoints. When you ask the agent to do something that requires an external service.

For example, fetching a webpage or calling a third-party API, OpenShell blocks the request and the agent reports that network access isn’t available.

To see this in action, open the OpenShell TUI in one terminal on the host:

openshell term

In a second terminal, connect to the sandbox and start a conversation:

openclaw tui

Ask the agent to do something like “use curl to fetch https://httpbin.org/get“.

The agent attempts the request, OpenShell blocks it, and the TUI displays the blocked connection with the destination host, port, and the binary that initiated it.

From the TUI, you can approve the request for the current session, or deny it to keep the endpoint blocked.

When you want to permanently add an endpoint, use a policy preset from the host:

nemoclaw my-assistant policy-add

This approval flow gives you real-time visibility and control over what the agent can access without modifying the base policy or restarting the sandbox.

Get started

Start building with NVIDIA NemoClaw today.

Stay up to date on NVIDIA NemoClaw by subscribing to NVIDIA news and following NVIDIA AI on LinkedIn, X, Discord, and YouTube.

Visit the NemoClaw page for resources to get started. Explore NemoClaw on GitHub and Playbook available on build.nvidia.com.

Engage with Nemotron livestreams, tutorials, and the developer community on the NVIDIA forum and Discord.

この記事をシェア

関連記事

NVIDIA Developer Blog★42026年4月17日 00:00

DeepStreamコーディングエージェントを使用したビジョンAIパイプライン構築方法

NVIDIAが、DeepStreamコーディングエージェントを使用してリアルタイムビジョンAIアプリケーションの開発を効率化する方法を紹介した。複雑なデータパイプラインや大量のコードを必要とする課題を解決する技術を提案している。

AI Business★32026年4月17日 00:45

NVIDIA、チップソフトウェアメーカーと提携しシミュレーションと現実のギャップを縮める

NVIDIAはCadenceとの提携を拡大し、ロボットトレーニングデータの精度向上とエンジニア向けAIサービスの構築を目指す。

The Decoder★42026年4月17日 01:33

NVIDIA、ロボットシミュレーション訓練を拡張するLyra 2.0を発表

NVIDIAの研究者が、単一写真から大規模で一貫性のある3D環境を生成するシステム「Lyra 2.0」を発表した。生成されたシーンはリアルタイムで探索可能で、ロボットシミュレーションに直接使用できる。

ニュース一覧に戻る元記事を読む