Google BigQuery のロゴ

Google BigQuery / リリースノート / 2026/05/20 / 重要

BigQuery 2026年5月20日の更新: 再実行検知、Python UDF GA、AI.AGG Preview

dataAIgovernance

公式リリースノート

Google Cloud は BigQuery release notes の 2026年5月20日付で、BigQuery が performance / correctness / functional regression を検知するために query を副作用なしで再実行すること、Python UDFs の GA、自然言語 instruction による AI.AGG function Preview を公開しました。

要点

  • BigQuery は regression detection のため、query を副作用なし・追加コストなしで再実行する場合がある
  • data access logs には bigquery-adminbot@system.gserviceaccount.com が表示される可能性がある
  • Python UDFs が GA になり、SQL query 内で Python scalar function を使える
  • Python UDFs では PyPI libraries の install や Cloud resource connection 経由の external services access が可能
  • AI.AGG function が Preview になり、natural language instructions に基づいて unstructured input data を semantic aggregation できる

今回のリリースノートで語られていること

今回の BigQuery 更新は、運用面の透明性、Python による拡張、AI aggregation の3方向に分かれています。まず、BigQuery は query を再実行して performance、correctness、functional regression を proactive に検知する場合があると案内しました。この再実行は副作用がなく、追加コストや resource consumption なしで行われると説明されています。一方、data access logs には bigquery-adminbot@system.gserviceaccount.com が表示される可能性があります。

これは一見小さな announcement ですが、監査や security monitoring をしている組織には重要です。通常の user / service account ではない system account による access log が見える場合、誤って異常アクセスや不正利用と判定しないよう、SOC、data governance、audit log review の runbook に反映する必要があります。特に sensitive dataset、regulated workload、customer-managed audit process を持つ組織では、この system account の意味を明文化しておくと混乱を避けられます。

2つ目は Python UDFs の GA です。BigQuery SQL の中で Python scalar function を実装でき、PyPI から third-party libraries を install したり、Cloud resource connection を使って external services に access したりできます。これにより、SQL だけでは書きにくい text processing、custom parsing、specialized scoring、library-based transformation を BigQuery 内に寄せやすくなります。GA になったことで、preview 検証から本番利用を検討するチームが増えそうです。

ただし、Python UDFs は便利な一方で、dependency management、execution cost、network / external service access、data egress、library license、reproducibility を確認する必要があります。SQL query に Python logic が入ると、analytics engineer、data scientist、platform admin の責任境界も変わります。誰が UDF を作り、どの libraries を許可し、どの connection を使えるかを統制しないと、BigQuery 内の処理が見えにくくなる可能性があります。

3つ目は AI.AGG function の Preview です。natural language instructions に基づき、unstructured input data を semantic に aggregate できると説明されています。従来の COUNTSUMARRAY_AGG のような構造化集計とは異なり、自由記述、レビュー、問い合わせ、support ticket、document fragments などから意味的な要約・分類・集約を行う方向の機能です。BigQuery が AI function を DWH 内の query primitive として増やしている流れの一部として読めます。

対象になりそうなチーム

  • BigQuery audit logs / data access logs を監視している security / governance team
  • SQL と Python を組み合わせて変換・スコアリングを行いたい data engineering / analytics engineering team
  • BigQuery 上で非構造データを semantic aggregation したい AI / BI team
  • Python UDF の library / connection / cost governance を設計する platform team

実務で確認したいポイント

まず、bigquery-adminbot@system.gserviceaccount.com が data access logs に出た場合の扱いを監査 runbook に追加します。検知ルールが system account を異常として扱っていないか、ログを読むチームに説明できるかを確認してください。

Python UDFs は、許可する libraries、Cloud resource connection、review process、test strategy を決めてから広げます。特に external service access を伴う UDF は、network policy、credential、data transfer、latency、failure handling を確認する必要があります。AI.AGG は Preview なので、業務レポートや意思決定に使う前に、prompt / instruction の安定性、出力の再現性、evaluation、human review を検証したいところです。

結局、この更新をどう見るべきか

5月20日の BigQuery 更新は、DWH の中に Python と AI aggregation をさらに取り込む一方、Google 側の regression detection による system account access も明示するものです。機能面では柔軟性が増えますが、監査、依存関係、外部接続、AI 出力の品質管理を同時に整える必要があります。