Apache Iceberg のロゴ

Apache Iceberg / リリースノート / 2025/02/13 / 重要

Apache Iceberg 2025年2月13日のリリース解説: apache-iceberg-1.8.0

dataopen-source

公式リリースノート

2025年2月13日に Apache Iceberg core の公式 リリースとして apache-iceberg-1.8.0 が公開されました。Apache Iceberg はマネージド SaaS ではなく、複数のクエリエンジン、カタログ、ストレージをまたぐためのオープンなテーブルフォーマットです。そのため、リリースの意味は新機能の有無だけでなく、互換性、依存関係、メタデータ、読み書きの挙動、運用中のエンジン連携にどう影響するかで判断する必要があります。

要点

  • Apache Iceberg core の リリースとして公開された更新です
  • 主な読みどころは セキュリティや依存関係の安全性にも関わる更新 です
  • Iceberg は複数エンジンから同じテーブルを扱う前提があるため、バージョン差分は運用互換性に直結します
  • 本番利用環境では、依存ライブラリ、catalog、エンジン側の対応状況をあわせて確認したい更新です
  • 公式ノート上の注目テーマ: REST Catalog / catalog 連携
  • 公式ノート上の注目テーマ: Iceberg v3 metadata / format support
  • 公式ノート上の注目テーマ: delete file / row-level delete handling
  • 公式ノート上の注目テーマ: Parquet やファイル読み書き
  • 公式ノート上の注目テーマ: ORC read support

今回のリリースで何が変わるのか

この公式リリースは、Iceberg を直接ライブラリとして使うチームだけでなく、Spark、Flink、Trino、DuckDB、Snowflake、BigQuery、Redshift、Databricks などの周辺エンジンやサービスで Iceberg テーブルを扱うチームにも関係します。Iceberg の価値は、データを特定ベンダーの内部形式に閉じ込めず、スナップショット、スキーマ進化、パーティション進化、カタログ連携を共通の仕組みで扱えることにあります。

今回の リリース は セキュリティや依存関係の安全性にも関わる更新 として読むと理解しやすいです。リリースノートの細部には、依存関係の更新、API や実装の変更、ファイル読み書き、delete file、REST Catalog、型変換、エンジン統合などが含まれることがあります。これらは単体では小さな差分に見えても、実運用ではクエリエンジン間の見え方、テーブルメタデータの扱い、既存ワークロードの安定性、アップグレード時の検証範囲に影響します。

特に注意したいのは、Iceberg が「ひとつの製品」ではなく、仕様と複数実装の組み合わせで使われる点です。Java/core、Python、Rust、Go、C++ のどの実装を使うかによって、影響を受けるチームは異なります。データ基盤チームはフォーマットやカタログ互換性を、アプリケーション開発者は SDK/API の変更を、分析基盤担当はエンジン連携とパフォーマンスを確認する必要があります。

関係しそうなチーム

  • Iceberg テーブルを本番データ基盤で使っているデータプラットフォームチーム
  • Spark、Flink、Trino、DuckDB などから Iceberg を読み書きしているチーム
  • REST Catalog、Hive Metastore、Nessie、クラウドカタログなどを運用する担当者
  • Python / Rust / Go / C++ から Iceberg を扱うアプリケーション開発者

実務で確認したいこと

  1. 自社で使っている Iceberg 実装と今回の対象コンポーネントが一致するか確認する
  2. テーブル format version、catalog、query engine、依存ライブラリの対応状況を確認する
  3. 読み書き、snapshot、delete file、schema evolution、partition evolution の既存テストを再実行する
  4. RC の場合は、本番適用ではなく次の安定版に向けた検証計画として扱う

どう読むべきか

この更新は、単に apache-iceberg-1.8.0 が出たというニュースではなく、Iceberg エコシステムがどの実装領域を広げているかを見る材料です。複数エンジン・複数クラウド・複数言語から同じテーブル形式を扱う組織ほど、リリースノートをバージョン番号だけでなく、互換性と運用リスクの観点で読む価値があります。