Amazon Redshift のロゴ

Amazon Redshift / 公式ブログ / 2026/05/14 / 通常

Amazon Redshift公式ブログ解説: S3 Tables クエリを外部スキーマ・MV・compactionで最適化

databiworkflow

公式ブログ原文

AWS Big Data Blog は 2026年5月14日、Amazon Redshift から Amazon S3 Tables 上の Apache Iceberg tables を効率よく query するための実装パターンを公開しました。外部スキーマ、materialized views、S3 Tables compaction の三つを組み合わせる内容です。

要点

  • Amazon Redshift から S3 Tables / Apache Iceberg tables を query する際の最適化パターンが紹介された
  • 外部スキーマで三部構成の table reference を簡略化し、BI tool や利用者の SQL friction を下げる
  • materialized views により、繰り返し使う query の結果を Redshift 側に保持できる
  • S3 Tables compaction で file layout を整え、読み取り効率を改善する

今回のブログ記事で語られていること

この記事は、S3 Tables と Amazon Redshift を組み合わせる分析 workload で、性能と使いやすさをどう改善するかを説明しています。S3 Tables は Apache Iceberg table を S3 上で扱える選択肢ですが、query volume が増えると、毎回 S3 側を scan するコスト、長い table reference、file layout の非効率が効いてきます。AWS はこの課題に対して、外部スキーマ、materialized views、compaction の三つを使うアプローチを示しています。

外部スキーマは、database@catalog.schema.table のような三部構成の参照を、利用者や BI tool が扱いやすい形へ近づけるためのものです。SQL を書く人にとって参照名が長く複雑だと、ad hoc 分析や dashboard authoring の friction になります。Lake Formation resource links を使って schema surface を整えることで、アクセス制御を保ちながら query syntax を単純にできます。

Materialized views は、繰り返し実行される dashboard や join-heavy query を Redshift 側に pre-compute しておくための手段です。S3 Tables を直接 scan するたびに同じ処理を繰り返すのではなく、Redshift 側に計算済みの結果を保持することで、更新頻度と query latency のバランスを取りやすくなります。BI dashboard が頻繁に refresh される環境では、これは利用者体験とコストの両方に効きます。

Compaction は、Iceberg table の file layout を query pattern に合わせて整える部分です。小さなファイルが増えたり、predicate pushdown が効きにくい配置になったりすると、S3 から読むファイル数が増えて performance が落ちます。S3 Tables compaction strategy を使って data file layout を改善することで、Redshift からの query をより安定させる狙いがあります。

実務で重要なのは、この三つを「どれか一つのチューニング」としてではなく、lakehouse analytics を運用するための層として考えることです。schema surface は利用者体験、materialized view は繰り返し workload、compaction は storage layout に効きます。どこが bottleneck かによって優先順位は変わります。

実務で確認したいポイント

  1. BI tool や analyst が使う SQL で table reference が複雑になっていないか
  2. 繰り返し実行される dashboard / join query を materialized view 化できるか
  3. S3 Tables の file size、partition、compaction 状態を workload に合わせて確認する
  4. Lake Formation と Redshift の権限設計が、外部スキーマ化後も意図どおりか見る

どう読むべきか

このブログは、Redshift と Iceberg / S3 Tables をつなぐだけでは終わらない、という実務的な注意喚起です。lakehouse を BI や定常分析に使うなら、参照しやすさ、再計算の抑制、ファイル配置の三つをセットで設計する必要があります。