Google BigQuery / リリースノート / 2026/06/10 / 通常

BigQuery、AI.KEY_DRIVERSとSTRING_AGG関連ドキュメントを更新

dataAI

公式リリースノート

BigQueryの公式ドキュメントでは、AI.KEY_DRIVERS functionとSTRING_AGGに関する説明が更新されています。どちらもSQLや分析ワークフローに直接関係するため、分析者やデータ基盤チームは、既存クエリやレポート運用にどう影響するかを確認したい内容です。

要点

AI.KEY_DRIVERSは、合計可能な指標の変化にどのdimensionが寄与したかを調べるための関数です
ドキュメントでは、contribution analysis モデルを作ってML.GET_INSIGHTSを使う方法と比べ、AI.KEY_DRIVERSがより簡潔な構文として説明されています
STRING_AGGは、連続クエリや集約表現での扱いを確認すべき関数です

実務上の読みどころ

AI.KEY_DRIVERSは、売上、利用量、費用、エラー数のような指標の増減理由を探索する分析に向きます。分析者は、どのdimensionを渡すか、対象期間の切り方、結果をそのまま意思決定に使ってよいかを確認する必要があります。自動化された根因説明は便利ですが、入力データの粒度や欠損、季節性、外れ値に影響されます。

STRING_AGGのような集約関数は地味に見えますが、リアルタイム処理や継続クエリでは出力サイズ、順序、重複、NULLの扱いが下流に影響します。BigQueryのリリース候補としては、関数単位で既存SQLと運用監視への影響を確認するのが安全です。

今回の更新で何が変わるのか

今回のBigQuery更新で中心になるのは、AI.KEY_DRIVERSを使って、合計可能な指標の変化にどのデータセグメントが統計的に意味のある寄与をしているかをSQLから調べられる点です。公式ドキュメントでは、新商品の売上変化を例に、売上のような数値指標、地域や都市のようなディメンション、interestとreferenceを分ける真偽値カラムを渡す形が示されています。従来のcontribution analysisモデルを作ってML.GET_INSIGHTSを呼び出す流れに近いものの、多くの用途ではAI.KEY_DRIVERSの方が構文が簡潔で、結果が速く、冗長な洞察を既定で刈り込むと説明されています。

一方で、この関数は万能な根因分析ではありません。プレビュー機能であり、最大12個のディメンション、合計可能な指標、構造化データ、interest/referenceを分ける真偽値カラムという条件があります。出力にはdrivers、interest側とreference側の指標値、差分、相対差、想定外差分、寄与度などが含まれますが、それらは入力データの粒度や期間設計に強く依存します。売上、利用量、費用、エラー数のような指標に対して「どの地域、カテゴリ、顧客層が変化を押し上げたのか」を見たい分析者には有用ですが、因果関係を自動で証明するものではない点を明確にしておく必要があります。

実務では、既存のBigQuery MLやSQL集計にこの関数を追加する前に、対象指標が本当に合計可能か、interest期間とreference期間の切り方が妥当か、ディメンション数を12個以内にどう絞るかを確認してください。STRING_AGGのような集約関数も同じ分析クエリ内で使われることが多く、結果説明やラベル生成に関係します。AIによる洞察抽出を業務レポートへ組み込むなら、SQLの正しさだけでなく、どのユーザーが結果を見て、どの判断に使うのか、誤ったセグメント解釈をどうレビューするのかまで設計する必要があります。