Amazon Redshift / 公式ブログ / 2026/05/14 / 通常

Amazon Redshift公式ブログ解説: S3 Tables クエリを外部スキーマ・MV・compactionで最適化

databiworkflow

公式ブログ原文

公式ブログ原文: Optimize Amazon S3 Tables queries with Amazon Redshift

AWS Big Data Blog は 2026年5月14日、Amazon Redshift から Amazon S3 テーブル上の Apache Iceberg テーブルを効率よく query するための実装パターンを公開しました。外部スキーマ、materialized views、S3 テーブル compaction の三つを組み合わせる内容です。

要点

Amazon Redshift から S3 テーブル / Apache Iceberg テーブルを query する際の最適化パターンが紹介された
外部スキーマで三部構成のテーブル reference を簡略化し、BI tool や利用者の SQL friction を下げる
materialized views により、繰り返し使う query の結果を Redshift 側に保持できる
S3 テーブル compaction でファイル layout を整え、読み取り効率を改善する

今回のブログ記事で語られていること

この記事は、S3 テーブルと Amazon Redshift を組み合わせる分析 workload で、性能と使いやすさをどう改善するかを説明しています。S3 テーブルは Apache Iceberg テーブルを S3 上で扱える選択肢ですが、query volume が増えると、毎回 S3 側を scan するコスト、長いテーブル reference、ファイル layout の非効率が効いてきます。AWS はこの課題に対して、外部スキーマ、materialized views、compaction の三つを使うアプローチを示しています。

外部スキーマは、database@catalog.schema.table のような三部構成の参照を、利用者や BI tool が扱いやすい形へ近づけるためのものです。SQL を書く人にとって参照名が長く複雑だと、ad hoc 分析やダッシュボード authoring の friction になります。Lake Formation リソース links を使ってスキーマ surface を整えることで、アクセス制御を保ちながら query syntax を単純にできます。

Materialized views は、繰り返し実行されるダッシュボードや join-heavy query を Redshift 側に pre-compute しておくための手段です。S3 テーブルを直接 scan するたびに同じ処理を繰り返すのではなく、Redshift 側に計算済みの結果を保持することで、更新頻度と query 遅延のバランスを取りやすくなります。BI ダッシュボードが頻繁に refresh される環境では、これは利用者体験とコストの両方に効きます。

Compaction は、Iceberg テーブルのファイル layout を query pattern に合わせて整える部分です。小さなファイルが増えたり、predicate pushdown が効きにくい配置になったりすると、S3 から読むファイル数が増えてパフォーマンスが落ちます。S3 テーブル compaction strategy を使って data ファイル layout を改善することで、Redshift からの query をより安定させる狙いがあります。

実務で重要なのは、この三つを「どれか一つのチューニング」としてではなく、lakehouse analytics を運用するための層として考えることです。スキーマ surface は利用者体験、materialized view は繰り返し workload、compaction は storage layout に効きます。どこが bottleneck かによって優先順位は変わります。

実務で確認したいポイント

BI tool や analyst が使う SQL でテーブル reference が複雑になっていないか
繰り返し実行されるダッシュボード / join query を materialized view 化できるか
S3 テーブルのファイル size、partition、compaction 状態を workload に合わせて確認する
Lake Formation と Redshift の権限設計が、外部スキーマ化後も意図どおりか見る

どう読むべきか

このブログは、Redshift と Iceberg / S3 テーブルをつなぐだけでは終わらない、という実務的な注意喚起です。lakehouse を BI や定常分析に使うなら、参照しやすさ、再計算の抑制、ファイル配置の三つをセットで設計する必要があります。