Snowflake のロゴ

Snowflake / リリースノート / 2026/05/22 / 重要

Snowflake、AI_EXTRACT の extraction scores GA と Dynamic Tables 更新を公開

dataAIgovernance

公式リリースノート

Snowflake は 2026年5月21日から22日にかけて、Recent feature updates に複数の linked-feature-update を追加しました。中心は、AI_EXTRACT の extraction scores が GA になったこと、Dynamic Tables に storage lifecycle policy を直接付けられるようになったこと、Dynamic Tables の運用ドキュメントが拡充されたこと、Snowflake Data Clean Rooms API Version 15.6 が出たことです。

要点

  • AI_EXTRACT で抽出値ごとの confidence score を返す機能が GA になった
  • entities、lists、tables の抽出で score を扱える
  • fine-tuned arctic-extract models でも extraction scores を利用できる
  • Dynamic Tables に storage lifecycle policy を直接 attached できる機能が GA になった
  • Dynamic Tables の設計、移行、監視、troubleshooting、cost management のドキュメントが大幅に書き直された
  • Snowflake Data Clean Rooms API Version 15.6 では performance improvements、bug fixes、private preview updates が追加された

今回のリリースノートで語られていること

今回の Snowflake 更新は、AI による非構造データ抽出と、Dynamic Tables のライフサイクル運用という2つの実務領域にまたがっています。AI_EXTRACT extraction scores は、抽出された値に対して 0 から 1 の score を返す機能です。従来、契約書、請求書、申請書、顧客文書、画像や PDF から値を取り出す処理では、「抽出できたか」だけでなく「その値をどれくらい信用してよいか」を別途判断する必要がありました。今回の GA により、Snowflake 内の処理で confidence score を持ちながら後続の review、filter、fallback、human-in-the-loop workflow につなげやすくなります。

特に重要なのは、entities だけでなく lists や tables の抽出でも score が扱える点です。業務文書では単一フィールドより、明細表、項目リスト、複数の属性を持つレコードの抽出が問題になりがちです。score を保存しておけば、一定以下の値だけ人手確認に回す、低 confidence の行を downstream table から分離する、品質指標を dashboard 化する、といった運用が取りやすくなります。また、fine-tuned arctic-extract models でも使えるため、汎用モデルだけでなく業務ドメインに寄せた抽出モデルを検証しているチームにも関係します。

Dynamic Tables 側では、storage lifecycle policy を dynamic table に直接 attach できる機能が GA になりました。CREATE DYNAMIC TABLE では WITH STORAGE LIFECYCLE POLICY、既存 table には ALTER DYNAMIC TABLE ... ADD STORAGE LIFECYCLE POLICY を使い、predicate に合う行を delete または archive する運用ができます。重要なのは、この policy が dynamic table refresh とは独立した schedule で非同期に動くと説明されている点です。refresh は expired region を frozen として扱うため、データ保持、コスト、履歴、再処理の境界を設計する必要があります。

Dynamic Tables documentation rewritten は、機能リリースというより運用面の signal です。Snowflake は dynamic table pipelines の build、optimize、monitor、troubleshoot の lifecycle をカバーする新規・更新ページを追加し、streams and tasks からの migration、dbt integration、design patterns、pipeline boundaries、replication behavior、creation / permission / refresh troubleshooting、refresh optimization、warehouse selection、cost management などを整理しています。Dynamic Tables を本番 pipeline に採用する組織が増えるほど、単なる SQL 定義ではなく、障害時の診断、権限、warehouse sizing、cost control、移行設計まで含めて標準化する必要があります。

Snowflake Data Clean Rooms updates は API Version 15.6 の更新です。今回の記述は general performance improvements、bug fixes、private preview features の更新にとどまりますが、Clean Rooms は共同分析や activation workflow に関わるため、API version、UI session refresh、private preview 機能の有無を確認しておく意味があります。

対象になりそうなチーム

  • AI_EXTRACT を文書処理、請求書処理、契約レビュー、data enrichment に使っている data / AI platform team
  • Dynamic Tables で ELT、refresh pipeline、dbt 連携、cost optimization を設計している analytics engineering team
  • 抽出 AI の confidence score、human review、data quality gate を設計する governance / operations team
  • Clean Rooms API を使って partner collaboration や activation workflow を自動化しているチーム

実務で確認したいポイント

AI_EXTRACT extraction scores は、score を返すだけでは運用になりません。まず、score をどの table に保存するか、どの threshold で人手確認に回すか、低 confidence の値を downstream BI や workflow に流してよいかを決める必要があります。fine-tuned model を使う場合は、model version、評価データ、score distribution、retraining の基準も管理対象になります。

Dynamic Tables の storage lifecycle policy は、コスト削減と保持期間管理に役立つ一方で、過去データの再計算、監査、再現性に影響します。refresh と policy の schedule が別であることを前提に、どの行が expired region になるのか、archive か delete か、復元や再処理が必要なときの手順を確認してください。

結局、この更新をどう見るべきか

5月21日から22日の Snowflake 更新は、AI 抽出と data pipeline 運用を「本番で管理できる形」に近づけるものです。AI_EXTRACT の score は非構造データ処理の品質管理に、Dynamic Tables の lifecycle policy とドキュメント拡充は pipeline の運用標準化に関係します。Snowflake 上で AI と ELT を同じ基盤に載せているチームほど、早めに検証すべき更新です。