AI Shift、言語処理学会第32回年次大会(NLP2026)で3件の発表を実施
AI Shiftは言語処理学会第32回年次大会(NLP2026)で、ハルシネーション可視化のギャップ分析、B2B商談対話の階層型Dialogue Actスキーマ提案、および安全な音声対話設計に関する3件の発表を行う。
キーポイント
ハルシネーション可視化の主観・客観ギャップ
LLM応答のハルシネーションリスク可視化において、情報粒度を細かくすると主観的な有用性は向上するが、客観的な正確性は頭打ちになる「ギャップ」が生じることを実証した。
B2B商談対話の階層型Dialogue Actスキーマ
5種のPhaseと9種のActからなる階層的スキーマを提案し、模擬商談データを用いて高いアノテーション一致率とLLM自動分類の有効性を確認した。
安全なリアルタイム音声対話の設計課題
コールセンター等のテクニカルサポートを想定し、誤解が重大な結果を招く状況での文脈保持や前提管理の課題を整理し、社会実装に向けた設計指針を示した。
影響分析・編集コメントを表示
影響分析
本発表は、LLMの応用拡大に伴う「信頼性と実用性のバランス」という現実的な課題に焦点を当てており、特にハルシネーション可視化の限界や安全設計の重要性を指摘している点は実務者にとって示唆に富む。また、B2B商談といった特定のドメインにおける構造化対話のモデル化は、Revenue Intelligenceツールの高度化に寄与する可能性を秘めている。
編集コメント
学会発表という形式ではあるが、ハルシネーション可視化における「主観と客観のギャップ」や、音声対話における「安全設計」への言及は、実務導入時の重要なリスクヘッジとして捉えるべき内容である。
こんにちは、AI Shiftの村田です。3月9日(月)から3月13日(金)にライトキューブ宇都宮で言語処理学会第32回年次大会(NLP2026)が開催されます。
AI Shiftが関わる3件の発表があります。
本記事では各発表の概要と、議論したいポイントについて取り上げたいと思います。
また、会期中にはサイバーエージェントのイベントで弊社CAIOの友松も登壇します。学生の皆様はぜひこちらもチェックしてみてください。
image
▶ イベントページを見る
- AI Shiftからの発表
日時
セッション
タイトル
著者
3月10日 (火) 15:10-16:40
B3-6
ハルシネーション可視化における主観的評価と情報取得の正確性のギャップ
亀井 遼平, 坂田 将樹 (東北大), 邊土名 朝飛, 栗原 健太郎 (サイバーエージェント/AI Shift), 乾 健太郎 (MBZUAI/東北大/理研)
3月10日 (火) 15:10-16:40
P3-3
商談対話における階層的 Dialogue Act スキーマの提案
戸田 隆道, 二宮 大空, 天谷 航平, 野崎 文宏, 千飯 啓太 (AI Shift)
3月11日 (水) 9:30-11:00
P5-5
Keep Generating and Nobody Explodes💣:カスタマー操作型対話の自動化に向けた課題分析
佐藤 志貴, 邊土名 朝飛 (サイバーエージェント), 東 佑樹 (AI Shift), 岩田 伸治 (サイバーエージェント)
- 各発表の概要と議論したいポイント
2.1 ハルシネーション可視化における主観的評価と情報取得の正確性のギャップ
予稿:https://www.anlp.jp/proceedings/annual_meeting/2026/pdf_dir/B3-6.pdf
概要

LLM応答のハルシネーションリスク可視化において、情報の粒度を段階的に細かくした場合の、主観的評価と情報取得の正確性の推移を検証しました。異なる粒度の4手法を設計して評価実験を行った結果、粒度を細かくすると有用性などの主観的評価は向上するものの、正確性などの客観的評価は頭打ちとなり、両者にギャップが生じることを示しました。
議論したいポイント
実運用において「成功」はどのように定義・測定すべきか
「分かった気になる」で終わらせないUI設計について
2.2 商談対話における階層的 Dialogue Act スキーマの提案
予稿:https://www.anlp.jp/proceedings/annual_meeting/2026/pdf_dir/P3-3.pdf
概要

B2B商談対話の構造を捉えるため、5種類のPhaseと9種類のActからなる階層的Dialogue Actスキーマを提案しました。模擬商談データへのアノテーション実験により、高いアノテーター間一致率とLLMによる自動分類の有効性を確認し、合成データ生成の基盤としての実用可能性を示しました。
議論したいポイント
模擬データを用いた妥当性: 実データではなくロールプレイであるため、実際の商談と比較した際にどのような差異が生じるか
合成データ生成への応用: 生成モデルに「構造制約」を組み込む最適な方法
Gongなどの既存のRevenue Intelligenceツールについての率直な意見交換
2.3 Keep Generating and Nobody Explodes💣:カスタマー操作型対話の自動化に向けた課題分析
予稿:https://www.anlp.jp/proceedings/annual_meeting/2026/pdf_dir/P5-5.pdf
概要

コールセンターにおけるテクニカルサポートでは、音声のみで相手の環境を把握し、誤りが許されない操作手順を案内する必要があります。爆弾解除ゲームを題材に、誤解が重大な結果を招き得る状況において、リアルタイム音声対話モデルが文脈保持や前提管理で陥りやすい課題を整理し、社会実装に向けた安全な設計などについて議論します。
議論したいポイント
実際のテクニカルサポートに近い対話タスクの設計について
コールセンターにおけるリアルタイム音声対話API活用の課題について
- おわりに
AI Shiftからは上記3件の発表がありますが、サイバーエージェントからも他に多数の発表があります。また、今年もスポンサーブースを出展しますので、ぜひお立ち寄りください。
私は聴講者として参加しますが、参加される皆さまと議論できることを楽しみにしています。
投稿 言語処理学会第32回年次大会 (NLP2026) でAI Shiftから3件の発表を行います は 株式会社AI Shift に最初に表示されました。
原文を表示
こんにちはAI Shiftの村田です。3月9日(月)から3月13日(金)にライトキューブ宇都宮で言語処理学会第32回年次大会(NLP2026)が開催されます。
AI Shiftが関わる3件の発表があります。
本記事では各発表の概要と、議論したいポイントについて取り上げたいと思います。
また、会期中にはサイバーエージェントのイベントで弊社CAIOの友松も登壇します。学生の皆様はぜひこちらもチェックしてみてください。
image
▶ イベントページを見る
- AI Shiftからの発表
日時
セッション
タイトル
著者
3月10日 (火) 15:10-16:40
B3-6
hallucination可視化における主観的評価と情報取得の正確性のギャップ
亀井 遼平, 坂田 将樹 (東北大), 邊土名 朝飛, 栗原 健太郎 (サイバーエージェント/AI Shift), 乾 健太郎 (MBZUAI/東北大/理研)
3月10日 (火) 15:10-16:40
P3-3
商談対話における階層的 Dialogue Act スキーマの提案
戸田 隆道, 二宮 大空, 天谷 航平, 野崎 文宏, 千飯 啓太 (AI Shift)
3月11日 (水) 9:30-11:00
P5-5
Keep Generating and Nobody Explodes💣:カスタマー操作型対話の自動化に向けた課題分析
佐藤 志貴, 邊土名 朝飛 (サイバーエージェント), 東 佑樹 (AI Shift), 岩田 伸治 (サイバーエージェント)
- 各発表の概要と議論したいポイント
2.1 hallucination可視化における主観的評価と情報取得の正確性のギャップ
予稿:https://www.anlp.jp/proceedings/annual_meeting/2026/pdf_dir/B3-6.pdf
概要

LLM応答のハルシネーションリスク可視化の情報粒度を段階的に細かくした際、主観評価と情報取得の正確性がどのように推移するかを検証しました。粒度を変えた4手法を設計し評価実験を実施した結果、細かくすると有用性などの主観評価は向上しますが、正確性などの客観評価は頭打ちとなり、ギャップが生じることを示しました。
議論したいポイント
実運用では“成功”はどのように定義・測定するか
“分かった気になる”で終わらせないUI設計について
2.2 商談対話における階層的 Dialogue Act スキーマの提案
予稿:https://www.anlp.jp/proceedings/annual_meeting/2026/pdf_dir/P3-3.pdf
概要

B2B商談対話の構造を捉えるため、5種のPhaseと9種のActからなる階層的Dialogue Actスキーマを提案しました。模擬商談データへのアノテーション実験により、高いアノテーター間一致率とLLMによる自動分類の有効性を確認し、合成データ生成基盤としての実用可能性を示しました。
議論したいポイント
模擬データを用いた妥当性: 実データではなくロールプレイなので、実際の商談と比較した時にどのような差が出てきそうか
合成データ生成への応用: 生成モデルに「構造制約」を入れる最適な方法
Gongなどの既存のRevenue Intelligenceツールについてざっくばらんに
2.3 Keep Generating and Nobody Explodes💣:カスタマー操作型対話の自動化に向けた課題分析
予稿:https://www.anlp.jp/proceedings/annual_meeting/2026/pdf_dir/P5-5.pdf
概要

コールセンターにおけるテクニカルサポートでは、音声だけで相手の環境を把握し、誤りが許されない操作手順を案内する必要があります。爆弾解除ゲームを題材に、誤解が重大な結果を招き得る状況で、リアルタイム音声対話モデルが文脈保持や前提管理で陥りやすい危険を整理したうえで、社会で安全に活用するための設計等に関して議論します。
議論したいポイント
より実際のテクニカルサポートに近い対話タスクの設計について
コールセンターにおけるリアルタイム音声対話APIの活用における課題について
- おわりに
AI Shiftからは上記3件ですが、サイバーエージェントからは他にも発表があります。また、今年もスポンサーブースがありますのでぜひそちらにもお立ち寄りください!
私は聴講参加ですが、参加される皆さんと議論ができることを心待ちにしています。
投稿 言語処理学会第32回年次大会 (NLP2026) でAI Shiftから3件の発表を行います は 株式会社AI Shift に最初に表示されました。
関連記事
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み