Google、Gemini-SQL2 を発表:Gemini 3.1 Pro 搭載の Text-to-SQL で BIRD リーダーボードで 80.04% の実行精度を達成
Google は Gemini 3.1 Pro を基盤とした新システム「Gemini-SQL2」を発表し、BIRD リーダーボードのシングルモデル部門で 80.04% の実行精度を記録して業界首位に立った。
キーポイント
BIRD リーダーボードでの新記録達成
Gemini-SQL2 は、複雑なビジネス文脈やデータの不整合を含む BIRD ベンチマークで 80.04% の実行精度(EX)を記録し、既存の Gemini-SQL や他社モデルを上回る首位となった。
実行検証型評価への対応
単なる構文の正しさではなく、SQL が実際にデータベースで実行され正しい結果を返すかを測定する厳格な基準において、人間レベル(92.96%)との差が 12.92 ポイントまで縮まった。
既存データサービスへの統合予定
この機能は独立したモデルリリースではなく、BigQuery Studio や AlloyDB AI などの Google Cloud データサービスに組み込まれ、自然言語による SQL 生成能力を向上させることが期待されている。
モデル競争と性能の背景
Google は Gemini-SQL2 と Gemini-SQL でトップ2を独占し、専門的な32B SQLモデルも一般 Frontier モデルを上回る結果を示している。
実務における自己サービス分析とデータエンジニアリング
複雑な結合や日付演算が必要な分析や、BigQuery 変換のドラフト作成において、曖昧な列や不揃いな値への対応能力が向上している。
精度の限界と人的レビューの必要性
80% の精度でもクエリの1/5は誤りを含むため、SaaS 機能の実装には依然として人間のレビュープロセスが必要である。
複雑な SQL 生成能力の向上
大規模で多様なデータベーススキーマを持つ実世界のクエリに対して、高精度なテキストから SQL への生成を実現し、推論と構文構築の両面で大幅な改善が見られました。
影響分析・編集コメントを表示
影響分析
このニュースは、自然言語処理とデータベース操作の境界をさらに曖昧にし、非技術者でも複雑なデータ分析が可能になることを示唆しています。特に「実行精度」に焦点を当てた評価での首位獲得は、実環境での導入リスクを低減し、企業における AI 活用ポテンシャルを大きく高めるものです。
編集コメント
単なる構文生成の精度向上にとどまらず、実際のデータベース実行結果を正しく返す能力が評価される時代に入ったことを示す重要なマイルストーンです。Google のデータサービス戦略において、AI が「ツール」から「インテリジェントなパートナー」へと進化する過程を如実に表しています。
Google Research チームは X(旧 Twitter)上で Gemini-SQL2 の発表を行いました。このシステムは、Gemini 3.1 Pro を基盤とした画期的なテキストから SQL への生成能力として説明されています。Gemini-SQL2 は BIRD テキストから SQL へのリーダーボード(シングルモデル部門)において、実行精度 80.04% を記録しました。Google のチャートでは、これは以前のトップエントリーであった同社の Gemini-SQL よりも上位に位置しています。この指標は、生成された SQL が正しく動作し正しい結果を返すかどうかを測定するものであり、単に見た目が有効であるかどうかを問うものではありません。
imagehttps://x.com/GoogleResearch/status/2065475343205740911
Gemini-SQL2
Gemini-SQL2 は、独立した基盤モデルのリリースではなく、テキストから SQL への生成能力です。これは自然言語の質問を、Google が「実行準備完了型の SQL クエリ」と呼ぶものに変換します。この機能は Gemini 3.1 Pro をベースに構築されています。
X での発表によると、「データの微妙なニュアンスや複雑なビジネス文脈は、自然言語から正確な SQL を生成することを極めて困難にする要因となっています」とあります。また X の投稿では、「SQL 理解力の向上は、Google のデータサービス全体における自然言語処理能力を高めることができる」と述べられています。これはすでに Gemini ベースの SQL 生成を搭載している BigQuery Studio、AlloyDB AI、Cloud SQL Studio などの統合先を示唆しています。Google はまだ、Gemini-SQL2 がどの製品に導入されるかについては確認していません。
ベンチマーク
BIRD(BIg Bench for LaRge-scale Database Grounded Text-to-SQL Evaluation)は、このタスクにおける業界標準です。37 の専門分野にわたる 95 のデータベース全体で 12,751 の質問 - SQL ペアを含み、総量は 33.4GB に達します。Spider などの以前のベンチマークとは異なり、これらのデータベースには不整合な値が含まれており、外部知識による根拠付けが必要です。
BIRD は実行精度(EX)を測定します:生成された SQL は実行可能であり、ゴールドクエリと一致する結果を返す必要があります。Google はこれを明確に述べています。「実行検証済み精度を測定する BIRD ベンチマークによると、GeminiSQL-2 の SQL は単に見た目が正しいだけでなく、実際に正常に実行されます。」
シングルトレーニングモデルトラックでは、スコアを向上させるためにアンサンブルが使用する前処理、検索、およびエージェントフレームワークの制限が課されます。これはモデルの中核となるテキストから SQL への生成能力を測定するものです。Google Cloud のこのトラックにおける過去の記録は 2025 年 11 月 15 日に報告された 76.13 です。Google は人間の性能を 92.96 とベンチマークしており、80.04 から 12.92 ポイントの差が残されています。
リーダーボードの比較状況
X(旧 Twitter)上の Google のチャートでは、Gemini-SQL2 が 8 つの名前付き競合他社およびいくつかのラベルなしポイントを上回っていることが示されています。数値として明記されているのは 80.04% のみです。以下の数値はチャートの位置から読み取られた近似値であり、日付は各ポイントの横方向の配置に基づいています。
システム組織 BIRD 実行精度(シングルモデル)チャート日付
Gemini-SQL2 Google 80.04%(明記)2026 年 6 月
Gemini-SQL Google 約 77.2% 2026 年 3 月
Q-SQL AWS 約 76.5% 2025 年 12 月
Databricks RLVR 32B Databricks 約 75.7% 2025 年 7 月
SiriusAI-Text2SQL-32B-v2Tencent~75.0% 2025 年 12 月
Arctic-Text2SQL-R1-32BSnowflake~73.9% 2025 年 6 月
GPT-5.5-xhighOpenAI~72.5% 2026 年 4 月
SQLWeaver-32BAlibaba~71.7% 2026 年 5 月
Claude Opus 4.6Anthropic~70.1% 2026 年 2 月
2 つのパターンが浮かび上がっています。Google は現在、Gemini-SQL2 と Gemini-SQL の上位 2 つの名称付きポジションを独占しています。また、このチャート上では、いくつかの専門化された 32B SQL モデル(Text-to-SQL モデル)が、一部の一般向けフロンティアモデルよりも高いスコアを示しています。
使用例と具体例
セルフサービス分析:収益管理担当者が、アップグレードから 90 日以内に解約したアカウントについて、地域別の月間定期収益を問い合わせます。これには結合(JOIN)、ウィンドウ関数のロジック、および日付演算が必要です。実行検証付きの生成機能は、SQL が正しく実行されるが誤った行を返すケースを検出します。
データエンジニアリングの下書き:開発者は英語から BigQuery 変換処理を下書きし、ゼロから作成するのではなくレビューを行うことができます。Google の 2025 年 11 月の研究では、スキーマの理解が困難な部分であると特定されました。BIRD(Bird Benchmark)スコアの向上は、曖昧な列や不揃いな値に対するより良い処理能力を反映しています。
埋め込み型「データへの質問」機能:自然言語クエリインターフェースを追加する SaaS チームでも、80% の精度では依然として人間のレビューが必要です。5 件に 1 件の割合で誤りがある可能性があります。このスコアは期待値を設定するものであり、レビューの不要化を意味するものではありません。
Gemini-SQL2 ローンチ:コミュニティ受容ダッシュボード
/* wpautop suppression */
#mtp-gsql2-dash hr, #mtp-gsql2-dash p:empty,
#mtp-gsql2-dash del, #mtp-gsql2-dash s { display:none !important; }
#mtp-gsql2-dash {
background:#111 !important; color:#e8e8e8 !important;
border:1px solid #2a2a2a !important; border-radius:14px !important;
font-family:-apple-system,BlinkMacSystemFont,'Segoe UI',Roboto,Helvetica,Arial,sans-serif !important;
padding:22px !important; max-width:860px !important; margin:24px auto !important;
box-sizing:border-box !important; line-height:1.45 !important;
}
#mtp-gsql2-dash * { box-sizing:border-box !important; }
#mtp-gsql2-dash .dd-title { color:#fff !important; font-size:18px !important; font-weight:800 !important; margin:0 !important; }
#mtp-gsql2-dash .dd-title b { color:#76B900 !important; }
#mtp-gsql2-dash .dd-sub { color:#9aa0a6 !important; font-size:12.5px !important; margin:4px 0 18px 0 !important; }
#mtp-gsql2-dash .dd-grid { display:grid !important; grid-template-columns:repeat(4,1fr) !important; gap:10px !important; }
#mtp-gsql2-dash .dd-card { background:#1a1a1a !important; border:1px solid #2d2d2d !important; border-radius:10px !important; padding:14px 12px !important; text-align:center !important; }
#mtp-gsql2-dash .dd-num { color:#76B900 !important; font-size:24px !important; font-weight:800 !important; line-height:1.1 !important; }
#mtp-gsql2-dash .dd-cap { color:#9aa0a6 !important; font-size:11px !important; margin-top:4px !important; text-transform:uppercase !important; letter-spacing:.6px !important; }
#mtp-gsql2-dash .dd-h { color:#76B900 !important; font-size:11px !important; font-weight:700 !important; letter-spacing:1.2px !important; text-transform:uppercase !important; margin:20px 0 10px 0 !important; }
#mtp-gsql2-dash .dd-bar-row { display:grid !important; grid-template-columns:230px 1fr 64px !important; align-items:center !important; gap:10px !important; margin-bottom:7px !important; }
#mtp-gsql2-dash .dd-bar-label { color:#cfcfcf !important; font-size:12px !important; text-align:right !important; white-space:nowrap !important; overflow:hidden !important; text-overflow:ellipsis !important; }
#mtp-gsql2-dash .dd-bar-track { background:#1d1d1d !important; border-radius:5px !important; height:16px !important; overflow:hidden !important; border:1px solid #262626 !important; }
#mtp-gsql2-dash .dd-bar-fill { height:100% !important; background:#3f4a2a !important; border-radius:5px !important; width:0 !important; transition:width 1s ease !important; }
#mtp-gsql2-dash .dd-bar-fill.dd-hero { background:linear-gradient(90deg,#76B900,#a4e21a) !important; box-shadow:0 0 10px rgba(118,185,0,.45) !important; }
#mtp-gsql2-dash .dd-bar-val { color:#e8e8e8 !important; font-size:12px !important; font-weight:700 !important; }
#mtp-gsql2-dash .dd-bar-val.dd-hero { color:#76B900 !important; }
#mtp-gsql2-dash .dd-split { display:grid !important; grid-template-columns:1fr 1fr !important; gap:14px !important; }
#mtp-gsql2-dash .dd-panel { background:#161616 !important; border:1px solid #262626 !important; border-radius:10px !important; padding:14px !important; }
#mtp-gsql2-dash .dd-panel-t { color:#fff !important; font-size:13px !important; font-weight:700 !important; margin:0 0 10px 0 !important; }
#mtp-gsql2-dash .dd-kv { display:flex !important; justify-content:space-between !important; font-size:12.5px !important; padding:5px 0 !important; border-bottom:1px solid #222 !important; }
#mtp-gsql2-dash .dd-kv:last-child { border-bottom:none !important; }
#mtp-gsql2-dash .dd-kv span:first-child { color:#9aa0a6 !important; }
#mtp-gsql2-dash .dd-kv span:last-child { color:#e8e8e8 !important; font-weight:700 !important; }
#mtp-gsql2-dash .dd-gauge-wrap { text-align:center !important; padding:6px 0 !important; }
#mtp-gsql2-dash .dd-gauge-note { color:#9aa0a6 !important; font-size:11.5px !important; margin-top:8px !important; }
#mtp-gsql2-dash .dd-foot { margin-top:16px !important; padding-top:12px !important; border-top:1px solid #222 !important; color:#777 !important; font-size:11px !important; }
@media (max-width:640px) {
#mtp-gsql2-dash { padding:14px !important; }
#mtp-gsql2-dash .dd-grid { grid-template-columns:repeat(2,1fr) !important; }
#mtp-gsql2-dash .dd-split { grid-template-columns:1fr !important; }
#mtp-gsql2-dash .dd-bar-row { grid-template-columns:110px 1fr 52px !important; }
#mtp-gsql2-dash .dd-bar-label { font-size:10.5px !important; }
#mtp-gsql2-dash .dd-num { font-size:20px !important; }
}
Gemini-SQL2 ローンチ:コミュニティ受容ダッシュボード
Google Research の発表投稿における検証済み公衆エンゲージメント • 最初の約3時間 • 2026年6月12日
0
X 件のビュー
0
X 件のいいね
0
ブックマーク数
0
リポスト(X + LinkedIn)
BIRD シングルモデルリーダーボード • 実行精度
プラットフォームエンゲージメント内訳
X / Twitter(メイン投稿)
ビュー144.4K
いいね2,800
リポスト267
ブックマーク1,300
コメント64
エンゲージメント率3.1%
LinkedIn(メイン投稿)
リアクション349+
コメント12
リポスト27
受容シグナル
9.3 : 1
X におけるブックマークプラスいいねに対する返信比率。高い保存率で返信が少ないことは、通常、論争よりも承認を示すシグナルです。コメントレベルのセンチメントはまだ測定可能ではなく、キャプチャ時点では返信が読み込み中です。
データ検証日:2026年6月12日。X(太平洋標準時午前9時44分、144.4K ビュー)および LinkedIn(投稿後3時間、著者を含む348 リアクション)の Google Research 投稿から取得。80.04% 以外のリーダーボード値は Google が公開したチャートから読み取り、概数としてマーク付け(~)。ダッシュボード作成:Marktechpost
(function(){
var L=[
{n:"Gemini-SQL2 (Google)",v:80.04,hero:true,txt:"80.04%"},
{n:"Gemini-SQL (Google)",v:77.2,txt:"~77.2%"},
{n:"Q-SQL (AWS)",v:76.5,txt:"~76.5%"},
{n:"Databricks RLVR 32B",v:75.7,txt:"~75.7%"},
{n:"SiriusAI-Text2SQL-32B-v2 (Tencent)",v:75.0,txt:"~75.0%"},
{n:"Arctic-Text2SQL-R1-32B (Snowflake)",v:73.9,txt:"~73.9%"},
{n:"GPT-5.5-xhigh (OpenAI)",v:72.5,txt:"~72.5%"},
{n:"SQLWeaver-32B (Alibaba)",v:71.7,txt:"~71.7%"},
{n:"Claude Opus 4.6 (Anthropic)",v:70.1,txt:"~70.1%"}
];
var box=document.getElementById("dd-bars"),MIN=68,MAX=82;
L.forEach(function(d){
var row=document.createElement("div");row.className="dd-bar-row";
row.innerHTML=""+d.n+"
"+
"
"+
""+d.txt+"
必ず JSON 形式で返してください。translation フィールドのみ。他のフィールド (technical_terms 等) は一切追加しないこと — 余計なフィールドを書こうとして本文翻訳がトークン上限で打ち切られる事故を防ぐため:
{"translation": "翻訳全文"}
box.appendChild(row);
});
function fmt(n,f){
if(f==="k"&&n>=1000){return (n/1000).toFixed(n>=100000?1:1).replace(/\.0$/,"")+"K;"}
return n.toLocaleString();
}
function animate(){
Array.prototype.forEach.call(document.querySelectorAll("#mtp-gsql2-dash .dd-bar-fill"),function(b){
b.style.setProperty("width",b.getAttribute("data-w")+"%","important");
});
Array.prototype.forEach.call(document.querySelectorAll("#mtp-gsql2-dash .dd-num"),function(el){
var end=parseInt(el.getAttribute("data-count"),10),f=el.getAttribute("data-fmt"),
start=null,dur=1100;
function step(ts){if(!start)start=ts;var p=Math.min((ts-start)/dur,1);
el.textContent=fmt(Math.round(end*(p*(2-p))),f);
if(p
実装パターン
Google はまだ Gemini-SQL2 モデルの文字列や API を公開していません。以下のスキーマに根ざしたパターンは、google-genai SDK を介して現在の Gemini モデルで動作します。Gemini-SQL2 がリリースされたらモデル文字列を置き換えてください。
コードをコピーしました別のブラウザを使用してください
from google import genai
client = genai.Client() # 環境変数から GEMINI_API_KEY を読み取る
schema = """
CREATE TABLE orders (
order_id INTEGER, customer TEXT, region TEXT,
amount REAL, status TEXT, created_at DATE
);
"""
question = "2026 年の地域別支払済み注文合計額、高い順に。"
prompt = f"""あなたはテキストから SQL を生成するシステムです。
スキーマ:{schema}
質問: {question}
実行可能な SQLite クエリを一つだけ返してください。説明は不要です。"""
resp = client.models.generate_content(
model="gemini-3.1-pro-preview", # the base model named in the announcement; swap when a Gemini-SQL2 ID ships
contents=prompt,
)
print(resp.text)
Production systems should add execution verification. Run the returned SQL, catch errors, and retry with the error message appended. That loop mirrors what BIRD's execution accuracy metric rewards.
Key Takeaways
Google reports Gemini-SQL2 at 80.04% execution accuracy on the BIRD single-model leaderboard.
The capability is powered by Gemini 3.1 Pro and targets "execution-ready SQL," not just plausible SQL.
On Google's chart, Gemini-SQL2 and Gemini-SQL hold the top two named positions; human performance is 92.96.
No API, model card, technical report, or product integration details have been published yet.
MARKTECHPOST Visual Explainer
/* wpautop suppression */
#mtp-gsql2-demo hr, #mtp-gsql2-demo p:empty,
#mtp-gsql2-demo del, #mtp-gsql2-demo s { display:none !important; }
#mtp-gsql2-demo {
background:#111 !important; color:#e8e8e8 !important;
border:1px solid #2a2a2a !important; border-radius:14px !important;
font-family:-apple-system,BlinkMacSystemFont,'Segoe UI',Roboto,Helvetica,Arial,sans-serif !important;
padding:22px !important; max-width:860px !important; margin:24px auto !important;
box-sizing:border-box !important; line-height:1.5 !important;
}
#mtp-gsql2-demo * { box-sizing:border-box !important; }
#mtp-gsql2-demo .gd-head { display:flex !important; align-items:center !important; gap:10px !important; margin:0 0 4px 0 !important; }
#mtp-gsql2-demo .gd-dot { width:10px !important; height:10px !important; border-radius:50% !important; background:#76B900 !important; box-shadow:0 0 8px #76B900 !important; }
#mtp-gsql2-demo .gd-title { color:#fff !important; font-size:18px !important; font-weight:700 !important; margin:0 !important; }
#mtp-gsql2-demo .gd-sub { color:#9aa0a6 !important; font-size:13px !important; margin:0 0 16px 0 !important; }
#mtp-gsql2-demo .gd-sub b { color:#76B900 !important; }
#mtp-gsql2-demo .gd-label { color:#76B900 !important; font-size:11px !important; font-weight:700 !important; letter-spacing:1.2px !important; text-transform:uppercase !important; margin:14px 0 8px 0 !important; }
#mtp-gsql2-demo .gd-chips { display:flex !important; flex-wrap:wrap !important; gap:8px !important; }
#mtp-gsql2-demo .gd-chip {
background:#1b1b1b !important; color:#e8e8e8 !important; border:1px solid #333 !important;
border-radius:20px !important; padding:8px 14px !important; font-size:13px !important;
cursor:pointer !important; transition:all .15s ease !important; font-family:inherit !important;
}
#mtp-gsql2-demo .gd-chip:hover { border-color:#76B900 !important; color:#fff !important; }
#mtp-gsql2-demo .gd-chip.gd-on { background:#76B900 !important; color:#0c0c0c !important; border-color:#76B900 !important; font-weight:700 !important; }
#mtp-gsql2-demo .gd-sqlbox {
background:#0a0a0a !important; border:1px solid #2f2f2f !important; border-left:3px solid #76B900 !important;
border-radius:8px !important; padding:14px 16px !important; min-height:84px !important;
font-family:'SF Mono',ui-monospace,Menlo,Consolas,monospace !important;
font-size:13px !important; color:#c8f08f !important; white-space:pre-wrap !important;
margin:0 !important; overflow-x:auto !important;
}
#mtp-gsql2-demo .gd-cursor { display:inline-block !important; width:7px !important; background:#76B900 !important; animation:gd-blink 1s steps(1) infinite !important; }
@keyframes gd-blink { 50% { opacity:0; } }
#mtp-gsql2-demo .gd-runrow { display:flex !important; align-items:center !important; gap:12px !important; margin-top:12px !important; }
#mtp-gsql2-demo .gd-run {
background:#76B900 !important; color:#0c0c0c !important; border:none !important;
border-radius:8px !important; padding:10px 22px !important; font-size:14px !important;
font-weight:800 !important; cursor:pointer !important; font-family:inherit !important;
}
#mtp-gsql2-demo .gd-run:hover { background:#8ed40a !important; }
#mtp-gsql2-demo .gd-run:disabled { background:#3a3a3a !important; color:#777 !important; cursor:not-allowed !important; }
#mtp-gsql2-demo .gd-status { font-size:12px !important; color:#9aa0a6 !important; }
#mtp-gsql2-demo .gd-status.gd-ok { color:#76B900 !important; font-weight:700 !important; }
#mtp-gsql2-demo .gd-tablewrap { overflow-x:auto !important; margin-top:12px !important; border:1px solid #2a2a2a !important; border-radius:8px !important; }
#mtp-gsql2-demo table.gd-t { width:100% !important; border-collapse:collapse !important; background:#161616 !important; margin:0 !important; font-size:13px !important; }
#mtp-gsql2-demo table.gd-t th { background:#0d0d0d !important; color:#76B900 !important; text-align:left !important; padding:9px 12px !important; border-bottom:1px solid #2a2a2a !important; font-weight:700 !important; }
#mtp-gsql2-demo table.gd-t td { color:#e8e8e8 !important; padding:8px 12px !important; border-bottom:1px solid #222 !important; }
#mtp-gsql2-demo table.gd-t tr:last-child td { border-bottom:none !important; }
#mtp-gsql2-demo .gd-schema { display:none !important; }
#mtp-gsql2-demo .gd-schema.gd-show { display:block !important; }
#mtp-gsql2-demo .gd-toggle { background:none !important; border:none !important; color:#76B900 !important; font-size:12px !important; cursor:pointer !important; padding:0 !important; text-decoration:underline !important; font-family:inherit !important; }
#mtp-gsql2-demo .gd-foot { margin-top:16px !important; padding-top:12px !important; border-top:1px solid #222 !important; color:#777 !important; font-size:11.5px !important; }
@media (max-width:640px) {
#mtp-gsql2-demo { padding:14px !important; border-radius:10px !important; }
#mtp-gsql2-demo .gd-title { font-size:16px !important; }
#mtp-gsql2-demo .gd-chip { font-size:12px !important; padding:7px 11px !important; }
#mtp-gsql2-demo .gd-sqlbox { font-size:11.5px !important; }
#mtp-gsql2-demo table.gd-t { font-size:12px !important; }
}
Text-to-SQL プレイグラウンド
Gemini-SQL2 が直近 80.04% のスコアを記録したタスク(BIRD ベンチマーク、単一モデル)です。質問を選択し、生成された SQL を確認してから、ブラウザ内で実行可能な生データセット上でクエリを実行してください。
1 • 自然言語で質問する
2 • 生成された SQL のスキーマ表示
上の質問を選択して SQL を生成します。
CREATE TABLE orders (
order_id INTEGER, customer TEXT, region TEXT,
amount REAL, status TEXT, created_at DATE
); -- ブラウザ内でサンプル行 12 件を読み込み済み
▶ クエリを実行
実行精度とは、SQL が正常に実行され、かつ正しい行を返すことを意味します。
デモ提供:Marktechpost。クエリはサンプルデータ上でクライアントサイドで実行されます(API 呼び出しなし)。Gemini-SQL2 はまだ一般公開されていません。ベンチマーク数値:Google Research, 2026 年 6 月 12 日
(function(){
var DB=[
{order_id:1001,customer:"Acme Corp",region:"NA",amount:4200.00,status:"paid",created_at:"2026-01-14"},
{order_id:1002,customer:"Globex",region:"EU",amount:1850.50,status:"paid",created_at:"2026-01-29"},
{order_id:1003,customer:"Initech",region:"NA",amount:980.00,status:"refunded",created_at:"2026-02-03"},
{order_id:1004,customer:"Umbrella",region:"APAC",amount:7600.00,status:"paid",created_at:"2026-02-18"},
{order_id:1005,customer:"Hooli",region:"NA",amount:3120.75,status:"paid",created_at:"2026-03-02"},
{order_id:1006,customer:"Globex",region:"EU",amount:540.00,status:"pending",created_at:"2026-03-11"},
{order_id:1007,customer:"Stark Ind",region:"NA",amount:12500.00,status:"paid",created_at:"2026-03-27"},
{order_id:1
原文を表示
Google Research team has announced the launch of Gemini-SQL2 on X. They described this system as a breakthrough text-to-SQL capability powered by Gemini 3.1 Pro. Gemini-SQL2 posted 80.04% execution accuracy on the BIRD Text-to-SQL Leaderboard (Single Model). Google’s chart places it above its own Gemini-SQL, the prior top entry. The metric measures whether generated SQL runs and returns correct results, not whether it looks valid.
imagehttps://x.com/GoogleResearch/status/2065475343205740911
Gemini-SQL2
Gemini-SQL2 is a text-to-SQL capability, not a standalone foundation model release. It translates natural language questions into what Google calls ‘execution-ready SQL queries.’ The capability is built on Gemini 3.1 Pro.
Per the announcement on X, “data subtlety & complex business contexts make generating accurate SQL from natural language notoriously hard.” The X Post also stated that “improved SQL understanding can elevate natural language skills across Google’s data services.” That points toward integration targets like BigQuery Studio, AlloyDB AI, and Cloud SQL Studio, which already ship Gemini-based SQL generation. Google has not yet confirmed which products will receive Gemini-SQL2.
Benchmarks
BIRD (BIg Bench for LaRge-scale Database Grounded Text-to-SQL Evaluation) is an industry standard for this task. It contains 12,751 question-SQL pairs across 95 databases spanning 37 professional domains, totaling 33.4GB. The databases include dirty values and require external knowledge grounding, unlike older benchmarks such as Spider.
BIRD measures execution accuracy (EX): the generated SQL must run and return results matching the gold query. Google stated this directly. “Per the BIRD benchmark, which measures execution-verified accuracy, GeminiSQL-2’s SQL doesn’t just look right, it also runs successfully.”
The Single Trained Model Track restricts the preprocessing, retrieval, and agentic frameworks that ensembles use to boost scores. It measures the model’s core text-to-SQL ability. Google Cloud’s prior record on this track, reported November 15, 2025, was 76.13. Google benchmarks human performance at 92.96, leaving a 12.92-point gap from 80.04.
How the Leaderboard Stacks Up
Google’s chart, on X post, shows Gemini-SQL2 ahead of eight named competitors, along with several unlabeled points. Only 80.04% is stated as text. The values below are read from the chart’s position and are approximate; dates reflect each point’s horizontal placement.
SystemOrganizationBIRD Execution Accuracy (Single Model)Chart Date
Gemini-SQL2Google80.04% (stated)Jun 2026
Gemini-SQLGoogle~77.2%Mar 2026
Q-SQLAWS~76.5%Dec 2025
Databricks RLVR 32BDatabricks~75.7%Jul 2025
SiriusAI-Text2SQL-32B-v2Tencent~75.0%Dec 2025
Arctic-Text2SQL-R1-32BSnowflake~73.9%Jun 2025
GPT-5.5-xhighOpenAI~72.5%Apr 2026
SQLWeaver-32BAlibaba~71.7%May 2026
Claude Opus 4.6Anthropic~70.1%Feb 2026
Two patterns are visible. Google now holds the top two named positions, Gemini-SQL2 and Gemini-SQL. Several specialized 32B SQL models also sit above some general frontier models on this chart.
Use Cases with Examples
Self-service analytics: A revenue manager asks for monthly recurring revenue by region, for accounts that churned within 90 days of upgrade. This needs joins, window logic, and date arithmetic. Execution-verified generation catches SQL that runs but returns wrong rows.
Data engineering drafts: Devs can draft BigQuery transformations from English, then review rather than write from scratch. Google’s November 2025 work identified schema understanding as the hard part. Higher BIRD scores reflect better handling of ambiguous columns and messy values.
Embedded “ask your data” features: SaaS teams adding natural-language query interfaces still need human review at 80% accuracy. One in five queries can be wrong. The score sets expectations, not a removal of review.
Gemini-SQL2 Launch: Community Reception Dashboard
/* wpautop suppression */
#mtp-gsql2-dash hr, #mtp-gsql2-dash p:empty,
#mtp-gsql2-dash del, #mtp-gsql2-dash s { display:none !important; }
#mtp-gsql2-dash {
background:#111 !important; color:#e8e8e8 !important;
border:1px solid #2a2a2a !important; border-radius:14px !important;
font-family:-apple-system,BlinkMacSystemFont,'Segoe UI',Roboto,Helvetica,Arial,sans-serif !important;
padding:22px !important; max-width:860px !important; margin:24px auto !important;
box-sizing:border-box !important; line-height:1.45 !important;
}
#mtp-gsql2-dash * { box-sizing:border-box !important; }
#mtp-gsql2-dash .dd-title { color:#fff !important; font-size:18px !important; font-weight:800 !important; margin:0 !important; }
#mtp-gsql2-dash .dd-title b { color:#76B900 !important; }
#mtp-gsql2-dash .dd-sub { color:#9aa0a6 !important; font-size:12.5px !important; margin:4px 0 18px 0 !important; }
#mtp-gsql2-dash .dd-grid { display:grid !important; grid-template-columns:repeat(4,1fr) !important; gap:10px !important; }
#mtp-gsql2-dash .dd-card { background:#1a1a1a !important; border:1px solid #2d2d2d !important; border-radius:10px !important; padding:14px 12px !important; text-align:center !important; }
#mtp-gsql2-dash .dd-num { color:#76B900 !important; font-size:24px !important; font-weight:800 !important; line-height:1.1 !important; }
#mtp-gsql2-dash .dd-cap { color:#9aa0a6 !important; font-size:11px !important; margin-top:4px !important; text-transform:uppercase !important; letter-spacing:.6px !important; }
#mtp-gsql2-dash .dd-h { color:#76B900 !important; font-size:11px !important; font-weight:700 !important; letter-spacing:1.2px !important; text-transform:uppercase !important; margin:20px 0 10px 0 !important; }
#mtp-gsql2-dash .dd-bar-row { display:grid !important; grid-template-columns:230px 1fr 64px !important; align-items:center !important; gap:10px !important; margin-bottom:7px !important; }
#mtp-gsql2-dash .dd-bar-label { color:#cfcfcf !important; font-size:12px !important; text-align:right !important; white-space:nowrap !important; overflow:hidden !important; text-overflow:ellipsis !important; }
#mtp-gsql2-dash .dd-bar-track { background:#1d1d1d !important; border-radius:5px !important; height:16px !important; overflow:hidden !important; border:1px solid #262626 !important; }
#mtp-gsql2-dash .dd-bar-fill { height:100% !important; background:#3f4a2a !important; border-radius:5px !important; width:0 !important; transition:width 1s ease !important; }
#mtp-gsql2-dash .dd-bar-fill.dd-hero { background:linear-gradient(90deg,#76B900,#a4e21a) !important; box-shadow:0 0 10px rgba(118,185,0,.45) !important; }
#mtp-gsql2-dash .dd-bar-val { color:#e8e8e8 !important; font-size:12px !important; font-weight:700 !important; }
#mtp-gsql2-dash .dd-bar-val.dd-hero { color:#76B900 !important; }
#mtp-gsql2-dash .dd-split { display:grid !important; grid-template-columns:1fr 1fr !important; gap:14px !important; }
#mtp-gsql2-dash .dd-panel { background:#161616 !important; border:1px solid #262626 !important; border-radius:10px !important; padding:14px !important; }
#mtp-gsql2-dash .dd-panel-t { color:#fff !important; font-size:13px !important; font-weight:700 !important; margin:0 0 10px 0 !important; }
#mtp-gsql2-dash .dd-kv { display:flex !important; justify-content:space-between !important; font-size:12.5px !important; padding:5px 0 !important; border-bottom:1px solid #222 !important; }
#mtp-gsql2-dash .dd-kv:last-child { border-bottom:none !important; }
#mtp-gsql2-dash .dd-kv span:first-child { color:#9aa0a6 !important; }
#mtp-gsql2-dash .dd-kv span:last-child { color:#e8e8e8 !important; font-weight:700 !important; }
#mtp-gsql2-dash .dd-gauge-wrap { text-align:center !important; padding:6px 0 !important; }
#mtp-gsql2-dash .dd-gauge-note { color:#9aa0a6 !important; font-size:11.5px !important; margin-top:8px !important; }
#mtp-gsql2-dash .dd-foot { margin-top:16px !important; padding-top:12px !important; border-top:1px solid #222 !important; color:#777 !important; font-size:11px !important; }
@media (max-width:640px) {
#mtp-gsql2-dash { padding:14px !important; }
#mtp-gsql2-dash .dd-grid { grid-template-columns:repeat(2,1fr) !important; }
#mtp-gsql2-dash .dd-split { grid-template-columns:1fr !important; }
#mtp-gsql2-dash .dd-bar-row { grid-template-columns:110px 1fr 52px !important; }
#mtp-gsql2-dash .dd-bar-label { font-size:10.5px !important; }
#mtp-gsql2-dash .dd-num { font-size:20px !important; }
}
Gemini-SQL2 Launch: Community Reception Dashboard
Verified public engagement on Google Research’s announcement posts • first ~3 hours • Jun 12, 2026
0
X views
0
X likes
0
X bookmarks
0
Reposts (X + LinkedIn)
BIRD Single-Model Leaderboard • Execution Accuracy
Platform Engagement Breakdown
X / Twitter (main post)
Views144.4K
Likes2,800
Reposts267
Bookmarks1,300
Replies64
Engagement rate3.1%
LinkedIn (main post)
Reactions349+
Comments12
Reposts27
Reception signal
9.3 : 1
Bookmark-plus-like to reply ratio on X. A high save rate with few replies typically signals approval over controversy. Comment-level sentiment not yet measurable; replies still loading at capture time.
Data verified Jun 12, 2026 from Google Research posts on X (9:44 AM PT, 144.4K views) and LinkedIn (348 reactions + author, 3h after posting). Leaderboard values besides 80.04% are read from Google’s published chart and marked approximate (~). Dashboard by Marktechpost.
(function(){
var L=[
{n:"Gemini-SQL2 (Google)",v:80.04,hero:true,txt:"80.04%"},
{n:"Gemini-SQL (Google)",v:77.2,txt:"~77.2%"},
{n:"Q-SQL (AWS)",v:76.5,txt:"~76.5%"},
{n:"Databricks RLVR 32B",v:75.7,txt:"~75.7%"},
{n:"SiriusAI-Text2SQL-32B-v2 (Tencent)",v:75.0,txt:"~75.0%"},
{n:"Arctic-Text2SQL-R1-32B (Snowflake)",v:73.9,txt:"~73.9%"},
{n:"GPT-5.5-xhigh (OpenAI)",v:72.5,txt:"~72.5%"},
{n:"SQLWeaver-32B (Alibaba)",v:71.7,txt:"~71.7%"},
{n:"Claude Opus 4.6 (Anthropic)",v:70.1,txt:"~70.1%"}
];
var box=document.getElementById("dd-bars"),MIN=68,MAX=82;
L.forEach(function(d){
var row=document.createElement("div");row.className="dd-bar-row";
row.innerHTML=""+d.n+"
"+
"
"+
""+d.txt+"
";
box.appendChild(row);
});
function fmt(n,f){
if(f==="k"&&n>=1000){return (n/1000).toFixed(n>=100000?1:1).replace(/\.0$/,"")+"K";}
return n.toLocaleString();
}
function animate(){
Array.prototype.forEach.call(document.querySelectorAll("#mtp-gsql2-dash .dd-bar-fill"),function(b){
b.style.setProperty("width",b.getAttribute("data-w")+"%","important");
});
Array.prototype.forEach.call(document.querySelectorAll("#mtp-gsql2-dash .dd-num"),function(el){
var end=parseInt(el.getAttribute("data-count"),10),f=el.getAttribute("data-fmt"),
start=null,dur=1100;
function step(ts){if(!start)start=ts;var p=Math.min((ts-start)/dur,1);
el.textContent=fmt(Math.round(end*(p*(2-p))),f);
if(p
Implementation Pattern
Google has not published a Gemini-SQL2 model string or API yet. The schema-grounded pattern below works with current Gemini models via the google-genai SDK. Swap the model string when Gemini-SQL2 ships.
Copy CodeCopiedUse a different Browser
from google import genai
client = genai.Client() # reads GEMINI_API_KEY from environment
schema = """
CREATE TABLE orders (
order_id INTEGER, customer TEXT, region TEXT,
amount REAL, status TEXT, created_at DATE
);
"""
question = "Total paid order amount by region in 2026, highest first."
prompt = f"""You are a text-to-SQL system.
Schema:{schema}
Question: {question}
Return only one executable SQLite query. No explanation."""
resp = client.models.generate_content(
model="gemini-3.1-pro-preview", # the base model named in the announcement; swap when a Gemini-SQL2 ID ships
contents=prompt,
)
print(resp.text)
Production systems should add execution verification. Run the returned SQL, catch errors, and retry with the error message appended. That loop mirrors what BIRD's execution accuracy metric rewards.
Key Takeaways
Google reports Gemini-SQL2 at 80.04% execution accuracy on the BIRD single-model leaderboard.
The capability is powered by Gemini 3.1 Pro and targets "execution-ready SQL," not just plausible SQL.
On Google's chart, Gemini-SQL2 and Gemini-SQL hold the top two named positions; human performance is 92.96.
No API, model card, technical report, or product integration details have been published yet.
MARKTECHPOST Visual Explainer
/* wpautop suppression */
#mtp-gsql2-demo hr, #mtp-gsql2-demo p:empty,
#mtp-gsql2-demo del, #mtp-gsql2-demo s { display:none !important; }
#mtp-gsql2-demo {
background:#111 !important; color:#e8e8e8 !important;
border:1px solid #2a2a2a !important; border-radius:14px !important;
font-family:-apple-system,BlinkMacSystemFont,'Segoe UI',Roboto,Helvetica,Arial,sans-serif !important;
padding:22px !important; max-width:860px !important; margin:24px auto !important;
box-sizing:border-box !important; line-height:1.5 !important;
}
#mtp-gsql2-demo * { box-sizing:border-box !important; }
#mtp-gsql2-demo .gd-head { display:flex !important; align-items:center !important; gap:10px !important; margin:0 0 4px 0 !important; }
#mtp-gsql2-demo .gd-dot { width:10px !important; height:10px !important; border-radius:50% !important; background:#76B900 !important; box-shadow:0 0 8px #76B900 !important; }
#mtp-gsql2-demo .gd-title { color:#fff !important; font-size:18px !important; font-weight:700 !important; margin:0 !important; }
#mtp-gsql2-demo .gd-sub { color:#9aa0a6 !important; font-size:13px !important; margin:0 0 16px 0 !important; }
#mtp-gsql2-demo .gd-sub b { color:#76B900 !important; }
#mtp-gsql2-demo .gd-label { color:#76B900 !important; font-size:11px !important; font-weight:700 !important; letter-spacing:1.2px !important; text-transform:uppercase !important; margin:14px 0 8px 0 !important; }
#mtp-gsql2-demo .gd-chips { display:flex !important; flex-wrap:wrap !important; gap:8px !important; }
#mtp-gsql2-demo .gd-chip {
background:#1b1b1b !important; color:#e8e8e8 !important; border:1px solid #333 !important;
border-radius:20px !important; padding:8px 14px !important; font-size:13px !important;
cursor:pointer !important; transition:all .15s ease !important; font-family:inherit !important;
}
#mtp-gsql2-demo .gd-chip:hover { border-color:#76B900 !important; color:#fff !important; }
#mtp-gsql2-demo .gd-chip.gd-on { background:#76B900 !important; color:#0c0c0c !important; border-color:#76B900 !important; font-weight:700 !important; }
#mtp-gsql2-demo .gd-sqlbox {
background:#0a0a0a !important; border:1px solid #2f2f2f !important; border-left:3px solid #76B900 !important;
border-radius:8px !important; padding:14px 16px !important; min-height:84px !important;
font-family:'SF Mono',ui-monospace,Menlo,Consolas,monospace !important;
font-size:13px !important; color:#c8f08f !important; white-space:pre-wrap !important;
margin:0 !important; overflow-x:auto !important;
}
#mtp-gsql2-demo .gd-cursor { display:inline-block !important; width:7px !important; background:#76B900 !important; animation:gd-blink 1s steps(1) infinite !important; }
@keyframes gd-blink { 50% { opacity:0; } }
#mtp-gsql2-demo .gd-runrow { display:flex !important; align-items:center !important; gap:12px !important; margin-top:12px !important; }
#mtp-gsql2-demo .gd-run {
background:#76B900 !important; color:#0c0c0c !important; border:none !important;
border-radius:8px !important; padding:10px 22px !important; font-size:14px !important;
font-weight:800 !important; cursor:pointer !important; font-family:inherit !important;
}
#mtp-gsql2-demo .gd-run:hover { background:#8ed40a !important; }
#mtp-gsql2-demo .gd-run:disabled { background:#3a3a3a !important; color:#777 !important; cursor:not-allowed !important; }
#mtp-gsql2-demo .gd-status { font-size:12px !important; color:#9aa0a6 !important; }
#mtp-gsql2-demo .gd-status.gd-ok { color:#76B900 !important; font-weight:700 !important; }
#mtp-gsql2-demo .gd-tablewrap { overflow-x:auto !important; margin-top:12px !important; border:1px solid #2a2a2a !important; border-radius:8px !important; }
#mtp-gsql2-demo table.gd-t { width:100% !important; border-collapse:collapse !important; background:#161616 !important; margin:0 !important; font-size:13px !important; }
#mtp-gsql2-demo table.gd-t th { background:#0d0d0d !important; color:#76B900 !important; text-align:left !important; padding:9px 12px !important; border-bottom:1px solid #2a2a2a !important; font-weight:700 !important; }
#mtp-gsql2-demo table.gd-t td { color:#e8e8e8 !important; padding:8px 12px !important; border-bottom:1px solid #222 !important; }
#mtp-gsql2-demo table.gd-t tr:last-child td { border-bottom:none !important; }
#mtp-gsql2-demo .gd-schema { display:none !important; }
#mtp-gsql2-demo .gd-schema.gd-show { display:block !important; }
#mtp-gsql2-demo .gd-toggle { background:none !important; border:none !important; color:#76B900 !important; font-size:12px !important; cursor:pointer !important; padding:0 !important; text-decoration:underline !important; font-family:inherit !important; }
#mtp-gsql2-demo .gd-foot { margin-top:16px !important; padding-top:12px !important; border-top:1px solid #222 !important; color:#777 !important; font-size:11.5px !important; }
@media (max-width:640px) {
#mtp-gsql2-demo { padding:14px !important; border-radius:10px !important; }
#mtp-gsql2-demo .gd-title { font-size:16px !important; }
#mtp-gsql2-demo .gd-chip { font-size:12px !important; padding:7px 11px !important; }
#mtp-gsql2-demo .gd-sqlbox { font-size:11.5px !important; }
#mtp-gsql2-demo table.gd-t { font-size:12px !important; }
}
Text-to-SQL Playground
The task Gemini-SQL2 just scored 80.04% on (BIRD benchmark, single model). Pick a question, inspect the generated SQL, then run it on a live in-browser dataset.
1 • Ask in natural language
2 • Generated SQL view schema
Select a question above to generate SQL.
CREATE TABLE orders (
order_id INTEGER, customer TEXT, region TEXT,
amount REAL, status TEXT, created_at DATE
); -- 12 sample rows loaded in this browser
▶ Run query
Execution accuracy means the SQL must run AND return the right rows.
Demo by Marktechpost. Queries execute client-side on sample data; no API calls. Gemini-SQL2 itself is not yet publicly available. Benchmark figure: Google Research, Jun 12, 2026.
(function(){
var DB=[
{order_id:1001,customer:"Acme Corp",region:"NA",amount:4200.00,status:"paid",created_at:"2026-01-14"},
{order_id:1002,customer:"Globex",region:"EU",amount:1850.50,status:"paid",created_at:"2026-01-29"},
{order_id:1003,customer:"Initech",region:"NA",amount:980.00,status:"refunded",created_at:"2026-02-03"},
{order_id:1004,customer:"Umbrella",region:"APAC",amount:7600.00,status:"paid",created_at:"2026-02-18"},
{order_id:1005,customer:"Hooli",region:"NA",amount:3120.75,status:"paid",created_at:"2026-03-02"},
{order_id:1006,customer:"Globex",region:"EU",amount:540.00,status:"pending",created_at:"2026-03-11"},
{order_id:1007,customer:"Stark Ind",region:"NA",amount:12500.00,status:"paid",created_at:"2026-03-27"},
{order_id:1
関連記事
【Next Tokyo セッション公開】スクウェア・エニックスとリクルートが「Gemini 本番実装」のアーキテクチャを公開
スクウェア・エニックスとリクルートは、Google Developers JP が開催した Next Tokyo セッションで、大規模言語モデル Gemini を本番環境に導入する際の具体的なアーキテクチャ設計について発表した。
Google I/O、Gemini Spark、アンチグラビティ
Simon Willison は、試せない発表や「近日公開」の情報は書かない方針のため、今年度の Google I/O で実際に体験可能な Gemini 3.5 Flash などの利用可能になった技術について言及している。
「Next Tokyo」Expo の最新情報を公開!Gemini やクラウドを企業で活用するヒントを実感できる
「Next Tokyo」Expo が、Gemini やクラウド技術を企業の現場でどう活かすかを示す最新情報を公開し、参加者がその活用ヒントを実際に体感できるイベントを開催します。
今日のまとめ
AI日報で今日の重要ニュースをまとめ読み