NVIDIA ACE を活用した KRAFTON の共演可能キャラクター「PUBG Ally」の構築方法
KRAFTON は NVIDIA ACE プラットフォームを活用し、PUBG に自然言語で対話可能な共演キャラクター「PUBG Ally」を実装した。
キーポイント
NVIDIA ACE の活用と実装
KRAFTON は NVIDIA の AI エージェント(ACE)プラットフォームを基盤とし、ゲーム内キャラクターに自然言語処理能力を持たせた。
双方向の対話機能の実現
PUBG Ally はプレイヤーからの音声やテキスト入力を理解し、状況に応じた返答を行うことで、従来のスクリプトベースの NPC を超越した没入感を提供する。
開発効率と拡張性の向上
大規模言語モデル(LLM)を統合することで、膨大な数の対話シナリオを手動で記述する手間を削減し、動的なゲーム体験の構築を可能にした。
影響分析・編集コメントを表示
影響分析
このニュースは、大規模言語モデルが単なるチャットボットを超え、リアルタイムで複雑なゲーム環境と相互作用する「自律的な共演者」として実装された重要な転換点を示しています。これにより、ゲーム開発のワークフローが変わり、プレイヤーごとに異なる動的なストーリー展開や対話体験を低コストで提供できるようになる可能性があります。
編集コメント
ゲーム業界における生成 AI の実用化が、単なる演出の補助から「対話可能な共演者」という新たな体験価値へと進化していることを示す好例です。
ゲーム内の AI コンパニオンは、長くスクリプト化された行動ツリーや固定された対話によって制約されてきました。*PUBG* Ally は異なる種類のシステムです。KRAFTON によって *PUBG: BATTLEGROUNDS* のために構築されたこの AI チームメイトは、NVIDIA ACE とその効率的なモデルおよびツールスイートによって駆動されています。
PUBG Ally は、自動音声認識(ASR)、20 億パラメータの小型言語モデル、そしてテキスト読み上げ(TTS)を使用して、プレイヤーの声を理解し、ゲームの文脈や動的イベントを推論し、リアルタイムで応答します。
KRAFTON はこの結果を「共プレイ可能キャラクター(CPC)」と呼んでいます。これは非プレイアブルキャラクター(NPC)とは異なる新しいカテゴリであり、セッションを超えて協力し、適応し、記憶することを目的として設計されています。
PUBG Ally は 6 月 17 日にパブリックベータ版を開始し、6 月 30 日まで *PUBG: BATTLEGROUNDS* のアーケードモードでゲーマーに利用可能になります。私たちは *PUBG* Ally チームと座談会を行い、アーキテクチャ、レイテンシの課題、多言語サポート、そして出力が決定論的ではない AI システムを構築・調整する際に得た教訓について深く掘り下げました。
*ビデオ 1: ソウル GeForce Gamer Festival で披露された PUBG Ally の実演*
KRAFTON でのあなたの専門的なバックグラウンドと現在の職務役割は何ですか?
私たちの名前は、研究リーダーのヒョンスン・キムとプロジェクトマネージャーのユジョン・ソンです。私たちは *PUBG* Ally チームの一員であり、*PUBG* プレイヤー体験を向上させる AI 駆動技術の研究開発に注力しています。
KRAFTON は PUBG Ally を従来の NPC とは異なる、共プレイ可能なキャラクターとして位置付けています。この違いは実際には何を意味し、なぜ『PUBG: BATTLEGROUNDS』がこの機能を導入するにふさわしいタイトルだったのでしょうか。
*PUBG* Ally は従来の NPC 以上の存在です。従来の NPC は通常、スクリプト化された行動や事前に定義された対話ツリーを通じて動作するため、プレイヤーへの自然な対応や予期せぬ状況への適応に限界があります。一方、私たちは *PUBG* Ally を CPC(共プレイキャラクター:Co-Playable Character)と捉えています。これはプレイヤーと共にゲームプレイに参加するように設計された新しいタイプの AI チームメイトです。
NVIDIA ACE と、ゲームに特化したオンデバイス小型言語モデルによって駆動される Ally は、自然な音声対話を通じてプレイヤーの意図を理解し、現在のゲームプレイ状況を解釈してリアルタイムで動的に応答します。Ally はプレイヤーと協力し、戦闘や戦利品の収集などの状況に応じて行動を適応させ、ゲームプレイ中も自然にコミュニケーションを取ることができます。
目指したのは、従来のボットではなく、実際のチームメイトにより近い AI コンパニオンを作成することでした。
私たちは、*PUBG: BATTLEGROUNDS*がこのコンセプトを紹介するに最適なタイトルであると信じています。その理由は、*PUBG*のゲームプレイがチームワーク、コミュニケーション、そして予測不能な創発的状況によって強く駆動されているからです。バトルロイヤル環境では、プレイヤーは絶えず圧力下で戦術的な判断を迫られます。アイテムの共有、移動の調整、仲間の蘇生、車両の回転(ローテーション)、あるいは突発的な戦闘遭遇への対応などです。こうした動的な相互作用は、従来の NPC システムでは不可能な方法で、意味のある協力や文脈理解を探求するための強力な環境を CPC(共プレイ可能キャラクター)に提供します。
*動画 2: GDC 2026 のセッションの完全リプレイをご覧ください。ここでは Krafton のディープラーニングエンジニアと NVIDIA の専門家が、話しかけたり冗談を言ったりし、プレイヤーの命令に応答したりして、あらゆるマッチに追加の楽しさと個性をもたらすリアルタイム AI コンパニオンである PUBG: Ally について深く掘り下げます*
PUBG Ally の技術アーキテクチャについて詳しく説明してください。インタラクティブなパイプラインは、NVIDIA ACE を介した自動音声認識(ASR)、小型言語モデル、およびテキスト読み上げ(TTS)を組み合わせています。このパイプラインはどのように構成されており、ライブマッチにおいてこれらのコンポーネントはどのように連携して動作するのでしょうか?
高レベルでは、このパイプラインはプレイヤーの音声とライブゲーム状態という 2 つの入力を、アリーの発話とそのゲーム内アクションという 2 つの出力に変換します。NVIDIA ACE とカスタム AI モデルがオンデバイスで動作し、具体的には NVIDIA 自動音声認識 (ASR)、NVIDIA 小型言語モデル (SLM)、および独自開発のテキスト読み上げ (TTS) モデルです。これらを取り囲むように、当社独自のエージェントハネスとゲーム側の統合が存在します。
モデルに到達するすべての情報はテキスト形式です。プレイヤーが発話すると、ASR がその発話を文字起こしします。並行して、ゲームエンジンがライブマッチの状態を公開しており、エージェントは観測ツールを通じてこれをプレーンテキストの記述として読み取ります。つまり、各ターンにおいて SLM は、文字起こしされた要求と、マッチ内で何が起きているかのテキストによる視点という 2 つの情報に基づいて動作します。
SLM が意思決定の中核です。これはイベント駆動型のループを実行しており、プレイヤーの発話またはゲームイベントによってトリガーされ、必要な情報を観測した上で 2 種類の出力を生成します。発話は TTS に渡されてアリーの音声として再生され、ゲームアクションはゲーム側に引き渡されます。そこではビヘイビアツリーがそれらを実行し、言語推論を待たずに即座に反応するゲームプレイを処理します。これらはすべてローカルで継続的に実行されるため、プレイヤーはアリーと自然に対話できる一方、状況に応じてアリーも自ら発話したりアクションを起こしたりできます。
なぜ大規模なクラウドホスト型 LLM ではなく、小規模言語モデルを選んだのか?Mistral-NeMo-Minitron-2B をオンデバイスで実行することで、レイテンシ、ハードウェアの到達範囲、そしてプレイヤー体験においてどのようなメリットが得られたのでしょうか?
*PUBG* Ally においては、ゲームプレイの速度に即応できる AI チームメイトを作成することが最優先事項でした。*PUBG: BATTLEGROUNDS* のようなリアルタイムゲームでは、わずかな遅延さえも、対話の自然さや有用性に大きな影響を与えます。クラウドホスト型 LLM 方式をテストした際、ネットワークレイテンシとモデル推論レイテンシが組み合わさり、ライブでのチームコミュニケーションには応答が遅すぎるという結果となりました。
これがオンデバイス小規模言語モデル(SLM: Small Language Model)を採用した主要な理由の一つです。Mistral-NeMo-Minitron-2B をローカルで実行することでネットワークの往復が不要となり、ゲームプレイ中の応答時間をより予測可能にすることができました。これはユーザーテストにおいて重要な意味を持ちました:プレイヤーは SLM の即応性と存在感を一貫して高く評価しました。*PUBG* Ally はその文脈においては、広範な汎用推論能力よりも、その瞬間に即座に利用可能な感覚の方が重要であると感じさせたのです。
オンデバイスでの展開には、厳しい制約も伴いました。*PUBG* はグラフィックに富むタイトルであり、すでに GPU メモリの大きな割合を消費しているため、AI コンパニオンが利用可能な VRAM は限られています。20 億パラメータの Mistral-NeMo-Minitron-2B は、すでに強力な指示従順性を持つコンパクトな出発点でしたが、クライアントサイドでの展開のためにさらに量子化(quantization)を施しました。量子化されたモデルは、*PUBG* の実行後に残る VRAM の余裕内に収まるため、*PUBG* Ally は総 VRAM が 8GB という最小限の GPU でも動作可能です。これにより、初期の英語サービスにおいては、エンスージアスト向けの高級 GPU に限定されることなく、対応する NVIDIA ハードウェアを備えたプレイヤーが誰でも体験できるようにしています。
バトルロイヤルにおいて、レイテンシ(遅延時間)はすべてです。チームは、音声入力から発話応答までの往復時間をリアルタイム戦闘に耐えうるほど速く保つために、どのような特定の技術を採用し、最も多くのエンジニアリングリソースをどこに投入したのでしょうか。
レイテンシは *PUBG* Ally における最大の設計制約の一つでした。会話もゲーム内アクションも、すべてリアルタイムで発生しなければならないからです。この体験がオンデバイスで実行されるため、私たちは小型言語モデルの推論コストと、高速なアクションと言語推論との分離を最適化しました。
モデル側では、KV キャッシュを最大限に活用するためにプロンプト構造を設計しました。安定した指示とゲームプレイの文脈はターン間で可能な限り一貫して維持され、各ターンで更新されるのは最も関連性の高いリアルタイム情報のみです。これにより冗長な計算が削減され、オンデバイスでの応答時間がより予測可能になります。
アーキテクチャ側では、ゲーム内のあらゆる反応を言語推論に待たせることは避けました。これは人間の意思決定における素早く直感的な反応と、ゆっくりとした熟考に基づく推論に対応する「システム 1 / システム 2」の問題として扱っています。システム 1 レイヤーは行動木(behavior tree)として実装され、ゲームのティックレートで動作する移動、照準合わせ、即座の戦闘対応といった素早い反応型ゲームプレイを処理します。一方、システム 2 レイヤーである言語モデルは、プレイヤーの意図の解釈、プレイヤーとの連携、自然な発話の生成といった熟考が必要な作業を担当します。反射レベルのアクションがモデルを待たなければならないことはありません。
これらの 2 つのレイヤー間の境界線を定義し、何が即座にシステム 1 のゲームプレイ層で処理され、何がシステム 2 の言語モデルを経由してルーティングされるかを決定するために、多大なエンジニアリング努力が注ぎ込まれました。この区分を正しく行うことは、*PUBG* Ally が戦闘において十分な反応性を保ちつつ、AI チームメイトとしての柔軟性と自然さを維持するために不可欠でした。
PUBG アリーは、PUBG に特有の用語、マップ、アイテム、武器属性を理解しています。チームはこのドメイン適応にどのように取り組まれ、アリーが自由生成されたテキストではなく実際のゲーム状態に基づいた回答を行うよう保たれているのでしょうか?
私たちはこの課題を 2 つのステップで解決しました。まず、何を扱わないかを決定することでした。あらゆる可能な *PUBG* シナリオに対処させるのではなく、世界を制限しました:単一のマップであるサンホクと、単一のモードである AI Duo です。また、アリーが使用できるもの、認識はできるが使用できないもの、そしてこの文脈では存在しないものを定義する固定されたアイテム分類体系を採用しました。閉じた世界の中で作業することで、その後のすべての処理がはるかに扱いやすくなりました。
その後、決定論的な *PUBG* 仕様を構築し、それをより大規模な教師モデルのシステムプロンプトに配置しました:サンホクのランドマーク、アイテムと武器に関する知識、そしてアリーが実際に何ができるのかという明確な説明です。この教師モデルはこれを用いて、適切な *PUBG* の用語やスタイル、および自身の限界(武器、アタッチメント、アイテム、ルールを網羅したキュレーションされた辞典に裏打ちされた知識検索ツールを呼び出すことで外部ソースに依存すべき時など)を示す根拠のある回答を生成しました。これらすべての要素をオンデバイス用の学生モデルに凝縮し、これらの振る舞いが単なる指示の集合体ではなく、学生モデル自身のものとなるようにしました。
Ally をライブゲームの状態に維持することは別の問題であり、エージェント方式で対応しています。各ターンごとにマッチ全体の状態をモデルのコンテキストに読み込むのではなく、Ally が必要とする情報を自ら判断し、ツール呼び出しを通じて必要な部分のみを取得します。このエージェントには一連の観測ツールが用意されており、自身のステータス、チームメイト、近くのアイテム、戦闘状況などを把握できます。各ツールは、権限のあるエンジンデータの該当部分をプレーンテキストで返します。例えば、「M416 を装備中、マガジンに 24/30 発残っている。HP は 78%、安全地帯内にいる」といった形式です。システムプロンプトでは、これらのツール結果が現在のマッチにおける唯一の事実根拠であると定義されています。また、蒸留(distillation)プロセスにおいて、教師モデルは過去のターンから記憶するのではなく、ツールを通じて再観測する習慣を強化しました。この規律は学生モデルによって内面化され、Ally の主張する事実は、ゲームが急速に変化する中でも、直前にエンジンから意図的に取得した値に遡るものであり、モデルが推測したものではないことが保証されます。
PUBG Ally は英語、韓国語、中国語に対応しています。多言語サポートはエンジニアリング上の課題にどのような複雑さを加え、また各言語間で品質をどうバランスさせたのでしょうか?
多言語サポートは複雑性を増します。なぜなら、*PUBG* におけるコミュニケーションは単なる標準的な言語運用ではないからです。プレイヤーは短いコマンド、スラング、略語、アイテム名、マップの呼び出し名称、そして特に迅速な戦闘状況下では文化的に特有な表現を使用します。
これに対処するため、*PUBG*プレイヤーが英語圏、韓国語圏、中国語圏のコミュニティで実際にどのようにコミュニケーションを取っているかを調査し、言語別のデータを構築しました。また、各言語における品質、自然さ、ゲームプレイへの適合性について、言語専門家と協力してレビューを行いました。
言語的なレビューに加え、プレイテストやユーザーアンケートを通じて体験を検証しました。各言語のプレイヤーが、同程度の反応速度、有用性、そしてチームメイトのような行動を感じているかを比較しました。私たちの目標は、サポートされている各言語のプレイヤーにとって、*PUBG* Ally が等しく自然で一貫した存在となるようにすることです。
CES 2026 で KRAFTON は、長期的な記憶機能を備えた PUBG Ally を披露し、Ally が過去のマッチを recall し、会話の中で過去の出来事を参照できることを示しました。記憶機能の追加がゲームプレイ体験に何をもたらしたのか、またその実装方法はどのようなものなのでしょうか。
Ally の記憶は構造化されており、2 つの時間スケールで動作します。長期的な記憶はマッチ間を跨いで保持されます。そこにはプレイヤーのプロファイル(名前、好む武器、お気に入りのドロップ地点、Ally に共有した個人的な詳細情報)と、そのプレイヤーとの過去のマッチ記録(最終順位や注目すべき出来事など)が格納されています。短期的な記憶は、マッチ内の文脈を指します。これはプレイヤーの直近の発言や、現在のゲーム内で直近に発生した出来事を意味します。
最も明確な信号は、プレイテスト後のプレイヤーのコメントから得られました。あるプレイヤーは Ally に最初のマッチで Beryl を探してほしいと頼み、次のマッチ以降、Ally はその指示なしに自ら見つけるようになりました。別のプレイヤーが自分の名前を Ally に伝えると、Ally は次のマッチですでにその名前を使っていました。複数のプレイヤーは、Ally がマッチ間で好みの武器や好きなドロップ地点を記憶し、自発的に話題に出してくる様子について述べています。これらの瞬間こそが、Ally を単なる各マッチごとのアシスタントから、プレイヤーが継続的なチームメイトとして扱う存在へと変えたのです。
Ally はアイテムの要求、蘇生時の支援、そして戦利品の収集や戦闘中の自律的な判断を行うことができます。この SLM(小型言語モデル)はゲームのアクションシステムとどのように連携しており、また Ally の判断をスクリプトされたボットや予測不能なエージェントではなく、チームメイトらしいものとして保つためにはどうしているのでしょうか。
Ally はアジェンシー・ループを通じて行動を決定します。各イベントにおいて、エージェントは必要な環境の部分を観察し、現在のゲーム状態において実際に実行可能なアクションが何かを確認し、プレイヤーとの対話に基づいてアクションを選択します。Ally が取る行動は、プレイヤーが何を求めているか、そして状況が許す範囲に由来しています。この「観察→利用可能性の確認→決定」というループこそが、Ally をスクリプトされたボットではなくチームメイトらしく感じさせるために中心的な役割を果たしていることが分かりました。
これらの判断を自然なものにする鍵はデータにありました。私たちは膨大で多様な実際のユーザーの要求やゲーム内会話データを収集し、各状況に応じた適切な行動を生成するように SLM(小型言語モデル)を訓練しました。それと同様に重要なのは、実際のプレイヤーセッションからのフィードバックを用いて、不自然さや違和感を感じさせる瞬間を反復的に排除したことです。つまり、アリーのタイミング感覚や判断力は、抽象的な選好データからではなく、プレイヤーが実際にどのように使用したかという経験から学習されたものであり、これがその行動が硬直したり予測不能になったりしないように感じさせる要因となっています。
改善のループはどのようなものだったのでしょうか?特に一貫性が重要となる競争型マルチプレイヤーゲームにおいて、出力が決定論的ではない AI チームメイトをどのようにテストし、調整しているのですか?
AI チームメイトのテストは、チャットボットや単体のモデルのテストとは全く異なります。究極的には良い AI チームメイトを作ることが私たちの目標ですが、「良い」と定義することは単純ではありません。私たちにとって、良いチームメイトとは、実際のマッチにおいてプレイヤーが有用で、タイミング良く、信頼できると感じる存在です。その意味では、ユーザーエクスペリエンス(UX)が最も重要な指標となりますが、同時に直接評価するのが最も難しい要素でもあります。
そのため、当社の調整プロセスでは複数の評価レイヤーを組み合わせました。自動化された評価を用いて、アリーが期待されるインタラクションプロトコルに従っているか、利用可能なツールを適切に使用しているか、発言や行動の一貫性が保たれているかを検証しました。その後、候補となるモデルを実際のプレイテストと A/B テストを通じて比較し、アンケートや自由記述によるフィードバックを活用して、プレイヤーが実際に何に気づき、何を重視しているのかを理解しました。最後に、選定されたモデルを大規模なプレイテストで検証し、1,000 名を超える実際のプレイヤーからのプレイフィードバックに基づいてアリーを洗練させました。
最も重要だったのは、プレイヤーのシグナルをユーザーエクスペリエンス(UX)信号として評価ループにフィードバックすることでした。プレイヤーのフィードバックにより、アリーがどこで失敗したか、またプレイヤーが AI チームメイトに対して何を好み、何に不満を持ち、何を価値あると感じているかを理解できました。これらの好みを基に評価基準を洗練させ、さらなる調整を導きました。*PUBG* の QA チームと大規模なプレイテストのおかげで、専門家のゲームプレイ負荷テストと、実際のプレイヤーからの広範なフィードバックを組み合わせることができました。
PUBG アリーは *PUBG: BATTLEGROUNDS* Arcade で限定プレイテストとしてリリースされます。この最初の期間にプレイヤーから最も学びたいことは何ですか?また、コミュニティはどのように参加できますか?
*PUBG* アリーの初のベータ版リリースであるため、改善が必要な領域があることは承知しています。しかし同時に、アリーが *PUBG* に新たなゲームプレイの層をもたらすと信じています。
私たちが最も楽しみにしているのは、プレイヤーが実際のマッチで Ally をどのように使いこなすかです。創造的な戦略を発見したり、チームメイトとの協力方法を新たに開発したり、あるいは予期せぬ楽しさを見つけたりするかどうか。このプレイテストを通じて、Ally が既存の『PUBG』体験にどう組み込まれるかをより深く理解し、どのような新しいゲームプレイの可能性を開くことができるかを探りたいと考えています。
プレイテストは、6 月 17 日のアップデートから開始され、6 月 30 日までアーケードモードで 2 週間実施されます。プレイヤーはアーケードモード内の「Ally Duo」メニューを通じて参加できます。皆様にはぜひこの機会に参加し、Ally を試していただき、フィードバックをお寄せいただくようお願いいたします。皆様の体験と洞察が、今後の機能の方向性を形作る上で重要な役割を果たします。
NVIDIA ACE を活用して AI 搭載の相棒やチームメイトを初めて構築しようとする他のスタジオに対して、どのようなアドバイスをされますか?
CPC を構築する際に本当に目指すべきは、プレイヤーの体験です。つまり、相棒が良きチームメイトとして感じられるかどうかです。これはオフラインの指標や小規模な社内チームだけでは判断するのが難しいものです。そこで最も重要だったループはシンプルでした。すなわち、迅速にプロトタイプを開発し、多数の実在するプレイヤーの前で試し、そのフィードバックからモデルを改善し、これを繰り返すことです。このサイクルを回すたびに、何らかの事前設計では得られない「良きチームメイト」というものの本質について、より多くのことを学べました。もし一つだけアドバイスをするなら、そのループを早期に稼働させ、頻繁に実行できるほどコストを抑えるべきだということです。
今後、CPC はどこへ向かうとお考えですか?より高い自律性、アライ間のマルチエージェント連携、より豊かな感覚入力など?
私たちにとって、最も重要な次のステップは「発見」です。アーケードモードを通じて、AI の機能である Ally が共にプレイする際に、プレイヤーが実際にどのようにゲームを楽しみたいのかを学び、その知見を用いてゲームに真に新しい種類の楽しさを提供できる準備をしたいと考えています。
CPC は、スクリプトベースのシステムでは決してできない方法でプレイヤーを理解し、適応することができます。そのため、何が実現可能かという可能性の範囲は広大です。アーケードプレイテストは、その可能性の中でプレイヤーがどの方向に惹かれていくかを初めて実際に確認できる機会であり、それによって次につくるべきものを形作っていくことができます。
NVIDIA ACE を始めるには
KRAFTON と『PUBG』の Ally における協力、および CPC コンセプトのパブリックベータ版への移行を嬉しく思います。AI を駆使したゲームキャラクターを開発中の方は、音声・知能・アニメーションのためのオンデバイスおよびクラウド AI モデルを備えた NVIDIA ACE の利用を開始してください。
ゲーム開発者向けリソース
ゲーム開発者向けの完全なリソースリストはこちらでご覧ください。最新の NVIDIA ゲーム開発ニュースをお知らせするため、以下のチャンネルをフォローしてください:
- ソーシャルメディア: X, LinkedIn, Facebook, YouTube をフォロー
- Discord コミュニティに参加
原文を表示
AI companions in games have long been constrained by scripted behavior trees and fixed dialogue. *PUBG* Ally is a different kind of system. Built by KRAFTON for *PUBG: BATTLEGROUNDS*, this AI teammate is powered by NVIDIA ACE and its suite of efficient models and tooling.
PUBG Ally uses automatic speech recognition, a 2B-parameter small language model, and text-to-speech to understand player voice, reason through game context and dynamic events, and respond in real time.
KRAFTON is calling the result a co-playable character (CPC): a new category distinct from non-playable characters (NPCs), designed to cooperate, adapt, and remember across sessions.
PUBG Ally entered public beta on June 17 and will be available in *PUBG: BATTLEGROUNDS* Arcade Mode for gamers until June 30th. We sat down with the *PUBG* Ally team to go deep on the architecture, the latency challenges, the multilingual support, and what they learned building and tuning an AI system whose outputs aren’t deterministic.
What is your professional background and current job role at KRAFTON?
Our names are Hyunseung Kim, research lead, and Yujeong Son, project manager, at KRAFTON. We are part of the *PUBG* Ally team, focused on researching and developing AI-driven technologies that enhance the *PUBG* player experience.
KRAFTON has framed PUBG Ally as a co-playable character, distinct from a traditional NPC. What does that distinction mean in practice, and why was PUBG: BATTLEGROUNDS the right title to introduce it?
*PUBG* Ally is more than a traditional NPC. Conventional NPCs typically operate through scripted behaviors and predefined dialogue trees, which limits how naturally they can respond to players or adapt to unexpected situations. In contrast, we see *PUBG* Ally as a CPC—a new type of AI teammate designed to participate in gameplay alongside the player.
Powered by NVIDIA ACE and an on-device small language model specialized for games, Ally understands player intent through natural voice interaction, interprets the current gameplay situation, and responds dynamically in real time. Ally can cooperate with players, adapt its behavior based on combat or looting situations, and communicate naturally during gameplay.
The goal was to create an AI companion that feels closer to a real squadmate than a conventional bot.
We believed *PUBG: BATTLEGROUNDS* was the ideal title to introduce this concept because *PUBG*’s gameplay is heavily driven by teamwork, communication, and unpredictable emergent situations. In a battle royale environment, players constantly make tactical decisions under pressure; sharing items, coordinating movement, reviving teammates, rotating vehicles, or reacting to sudden combat encounters. These kinds of dynamic interactions create a strong environment for a CPC to explore meaningful cooperation and contextual understanding in ways that traditional NPC systems can’t.
Walk us through the technical architecture of PUBG Ally. The interactive pipeline combines automatic speech recognition, a small language model, and text-to-speech through NVIDIA ACE. How is that pipeline structured, and how do those components work together in a live match?
At a high level, the pipeline turns two inputs—the player’s voice and the live game state —into two outputs: Ally’s speech and its in-game actions. NVIDIA ACE and custom AI models run on-device: NVIDIA automatic speech recognition (ASR), NVIDIA small language model (SLM), and a custom in-house text-to-speech (TTS) model. Around them sit our own agent harness and the game-side integration.
Everything reaching the model is text. When the player speaks, ASR transcribes the utterance. In parallel, the game engine exposes the live match state, which the agent reads through observation tools as plain-text descriptions. So on each turn the SLM works from a transcribed request together with a textual view of what is happening in the match.
The SLM is the decision core. It runs an event-driven loop, triggered either by the player speaking or by a game event, observes what it needs, and produces two kinds of output. Speech is passed to TTS and played back as Ally’s voice; game actions are handed to the game side, where a behavior tree executes them and handles the fast, reactive gameplay that shouldn’t wait on language reasoning. All of this runs locally and continuously through the match, so the player can talk to Ally naturally while Ally also speaks and acts on its own when the situation calls for it.
Why a small language model rather than a larger cloud-hosted LLM? What did running the Mistral-NeMo-Minitron-2B on-device give you in terms of latency, hardware reach, and player experience?
For *PUBG* Ally, our priority was to create an AI teammate that could respond at the speed of gameplay. In a real-time game like *PUBG: BATTLEGROUNDS*, even a small delay can change how natural or useful an interaction feels. When we tested cloud-hosted LLM approaches, the combination of network latency and model inference latency often made responses feel too slow for live squad communication.
That was one of the key reasons we chose an on-device small language model. Running Mistral-NeMo-Minitron-2B locally removed the network round-trip and gave us far more predictable response times during gameplay. This mattered in user testing: players consistently valued the SLM’s responsiveness and sense of presence. *PUBG* Ally felt immediately available in the moment, which in this context matters more than broad general-purpose reasoning alone.
On-device deployment also came with a hard constraint. *PUBG* is a graphically rich title that already consumes a significant share of GPU memory, so the VRAM available to an AI companion is limited. At 2B parameters, Mistral-NeMo-Minitron-2B was already a compact starting point with strong instruction-following quality, and we further quantized it for client-side deployment. The quantized model fits within the VRAM headroom that remains after *PUBG*, allowing *PUBG* Ally to run on GPUs with as little as 8GB of total VRAM. This keeps the experience, in its initial English service, accessible to players with supported NVIDIA hardware rather than gated behind enthusiast-tier GPUs.
Latency is everything in a battle royale. What specific techniques did your team apply to keep the round trip from voice input to spoken response fast enough for real-time combat, and where did you spend the most engineering effort?
Latency was one of the biggest design constraints for *PUBG* Ally: both conversation and in-game actions have to happen in real time. Since the experience runs on-device, we optimized the small language model’s inference cost and the separation between fast actions and language reasoning.
On the model side, we designed the prompt structure to make the best use of the KV cache. Stable instructions and gameplay context are kept as consistent as possible across turns, while only the most relevant real-time information is updated each turn. This reduces redundant computation and makes on-device response times more predictable.
On the architecture side, we didn’t want every in-game reaction to wait on language reasoning. We treat this as a System 1 / System 2 problem, analogous to the fast, instinctive responses and the slower, deliberate reasoning in human decision-making. A System 1 layer, implemented as a behavior tree, handles fast, reactive gameplay such as movement, aiming, and immediate combat responses at game tick rate. A System 2 layer, the language model, handles the deliberate work: interpreting player intent, coordinating with the player, and generating natural speech. Reflex-level actions never have to wait for the model.
A significant amount of engineering effort went into defining the boundary between those two layers, deciding what should be handled immediately by the System 1 gameplay layer and what should be routed through the System 2 language model. Getting that division right was essential to making *PUBG* Ally feel responsive enough for combat while preserving the flexibility and naturalness of an AI teammate.
PUBG Ally understands PUBG-specific terminology, maps, items, and weapon attributes. How did your team approach that domain adaptation, and how do you keep Ally’s responses grounded in actual game state rather than freely generated text?
We approached this in two steps. The first was simply deciding what not to handle. Rather than asking the model to cope with every possible *PUBG* scenario, we constrained the world: a single map, Sanhok, and a single mode, AI Duo, with a fixed item taxonomy that defines what Ally can use, what it can recognize but not use, and what doesn’t exist in this context. Working within a closed world made everything downstream far more tractable.
From there, we built a deterministic *PUBG* specification— and placed it in a larger teacher model’s system prompt: Sanhok landmarks, item and weapon knowledge, and a clear account of what Ally can actually do. The teacher used it to produce grounded responses, demonstrating both the right *PUBG* terminology and style and its own limits, including when to reach for an external source by calling a knowledge-lookup tool backed by a curated dictionary of weapons, attachments, items, and rules. We distilled all of that into the on-device student model, so those behaviors became the student’s own rather than a set of instructions.
Keeping Ally grounded in live game state is a separate problem, and we handle it agentically. Rather than dumping the entire match state into the model’s context every turn, Ally decides what it needs to know and fetches only that through tool calls. The agent has a set of observation tools: its own status, the teammate, nearby items, the combat situation. Each returns a plain-text view of its slice of authoritative engine data, such as: “You are armed with M416, 24/30 bullets in the magazine. HP 78%, inside the safe zone.” The system prompt establishes that these tool results are the only ground truth for the current match, and during distillation the teacher reinforced the habit of re-observing through tools rather than recalling from earlier turns, a discipline the student model absorbed as its own. So even as the game changes fast, Ally’s factual claims trace back to a value it deliberately pulled from the engine moments earlier, not to something the model guessed.
PUBG Ally supports English, Korean, and Chinese. What did multilingual support add to the engineering challenge, and how did you balance quality across languages?
Multilingual support adds complexity because *PUBG* communication isn’tjust standard language. Players use short commands, slang, abbreviations, item names, map callouts, and culturally specific expressions, especially in fast combat situations.
To address this, we built language-specific data by researching how *PUBG* players actually communicate in English, Korean, and Chinese communities. We also worked with language experts to review quality, naturalness, and gameplay appropriateness across each language.
Beyond linguistic review, we validated the experience through playtests and user surveys. We compared whether players in each language felt a similar level of responsiveness, usefulness, and teammate-like behavior. Our goal was to make *PUBG* Ally feel equally natural and consistent for players in each supported language.
At CES 2026, KRAFTON showed PUBG Ally with long-term memory, letting Ally recall prior matches and reference past events in conversation. What did adding memory unlock for the gameplay experience, and how is it implemented?
Ally’s memory is structured, and it operates on two timescales. Long-term memory carries across matches. It holds a profile of who the player is — their name, preferred weapons, favorite drop locations, and personal details they have shared with Ally — alongside a record of prior matches with that player, including final placements and notable moments. Short-term memory is the within-match context: the player’s recent speech and what has just happened in the current game.
The clearest signal came from player comments after playtests. One player asked Ally to look out for a Beryl in the first match, and from the next match onward Ally started finding it without being asked. Another told Ally their name once, and Ally was already using it in the next match. Several players described Ally remembering their preferred weapons and favorite drop locations across matches and bringing them up on its own. These were the moments that turned Ally from a per-match assistant into a teammate players treated as ongoing.
Ally can request items, assist with revives and make autonomous decisions during looting and combat. How does the SLM connect to the game’s action system, and how do you keep Ally’s decisions feeling like a teammate rather than a scripted bot or an unpredictable agent?
Ally decides what to do through an agentic loop. On each event, the agent observes the parts of the environment it needs, checks which actions are actually available in the current game state, and chooses an action based on its communication with the player. The action Ally takes follows from what the player is asking for and what the situation allows. We found this observe → check availability → decide loop to be central to making Ally feel like a teammate rather than a scripted bot.
Making those decisions feel natural came down to data. We collected a large and diverse set of real user requests and in-game conversations, and trained the SLM to generate the appropriate behavior for each. Just as importantly, we used feedback from real player sessions to iteratively remove the moments that felt awkward or uncomfortable. So Ally’s sense of timing and judgment is learned from how players actually played with it, not from abstract preference data, which is what helps its behavior feel less rigid or unpredictable.
What did the iteration loop look like? How do you test and tune an AI teammate whose outputs aren’t deterministic, especially in a competitive multiplayer game where consistency matters?
Testing an AI teammate is very different from testing a chatbot or a standalone model. Ultimately, our goal is to build a good AI teammate, but defining “good” is not simple. For us, a good teammate is one that players feel is useful, timely, and reliable during a real match. In that sense, User Experience is the most important signal, but it is also the hardest thing to evaluate directly.
That is why our tuning process combined multiple evaluation layers. We used automated evaluations to check whether Ally followed the expected interaction protocol, used available tools properly, and kept its speech and actions consistent. We then compared candidate models through live playtests and A/B tests, using surveys and free-form feedback to understand what players actually noticed and cared about. Finally, we validated selected models through large-scale playtests, refining Ally with play feedback from over a thousand real players.
The most important part was feeding player signals back into the evaluation loop as User Experience signals. Player feedback helped us understand where Ally failed, as well as what players liked, disliked, and valued in an AI teammate. We used those preferences to refine our evaluation criteria and guide further tuning. Thanks to *PUBG* QA and large-scale playtests, we could combine expert gameplay stress tests with broader feedback from real players.
PUBG Ally launches as a limited playtest in PUBG: BATTLEGROUNDS Arcade. What are you most hoping to learn from players in that first window, and how can the community get involved?
As *PUBG* Ally’s first beta release, we know there will be areas that need improvement. However, we also believe Ally will bring a fresh layer of gameplay to *PUBG*.
What we’re most excited to learn is how players choose to use Ally in real matches, whether they discover creative strategies, develop new ways to cooperate with teammates, or simply find unexpected moments of fun. We see this playtest as an opportunity to better understand how Ally fits into the existing *PUBG* experience and what kinds of new gameplay possibilities it can unlock.
The playtest is now available in Arcade Mode for two weeks starting with the June 17 update and ending on June 30. Players can participate in the playtest through Ally Duo menu in Arcade Mode. We encourage everyone to jump in, experiment with Ally, and share their feedback with us. Your experiences and insights will play a key role in helping us shape the future of the feature.
What advice would you give to other studios looking to build their first AI-powered companion or teammate using NVIDIA ACE?
For a CPC, what you are really building toward is the player’s experience: whether the companion feels like a good teammate. That is hard to judge from offline metrics or a small internal team alone. So the loop that mattered most was simple: develop a fast prototype, put it in front of a large number of real players, and improve the model from their feedback, then repeat. Each turn through that cycle taught us more about what “a good teammate” actually means than any amount of upfront design could. If we could give just one piece of advice, it would be to get that loop running early, and to keep it cheap enough to run often.
Looking ahead, where do you see CPCs going next? More autonomy, multi-agent cooperation between Allies, richer sensory inputs?
For us, the most important next step is discovery. Through the arcade mode, we want to learn how players actually want to enjoy the game when they have an AI feature like Ally playing alongside them, and use what we find to prepare genuinely new kinds of fun for the game.
A CPC can understand a player and adapt to them in ways a scripted system never could, so the space of what might be possible is broad. The arcade playtest is our first real chance to see which of those possibilities players gravitate toward, and to let that shape what we build next.
Get started with NVIDIA ACE
We’re excited to collaborate with KRAFTON on *PUBG* Ally and see the CPC concept enter public beta. If you’re building AI-driven game characters, get started with NVIDIA ACE, a suite of on-device and cloud AI models for speech, intelligence, and animation.
Resources for game developers
See our full list of game developer resources here and follow us to stay up to date with the latest NVIDIA game development news:
- Follow us on social: X, LinkedIn, Facebook, and YouTube
- Join our Discord community
関連記事
Gemini を活用して Google スプレッドシートを作成する方法
Google が提供する AI モデル「Gemini」を用いて、ユーザーが直接 Google スプレッドシートを生成・操作する機能の利用方法について解説している。
AI を駆使した説明と実験による脳理解の探求
マイクロソフト研究所は、大規模言語モデルを用いて人間の脳の言語反応を高精度に予測する手法を開発したが、その性能の根拠となるパラメータ群は解読不能である。同所は大学と連携し、生成因果テスト(GCT)という新たなアプローチでこの黒箱問題を解決しようとしている。
Anthropic の Claude が有料消費者層で ChatGPT を凌駕し市場を席巻
Anthropic が提供する AI チャットボット「Claude」が、従来 ChatGPT が独占していた有料顧客市場において支持を集め、シェア拡大に成功していることが示された。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み