Apache Iceberg / リリースノート / 2026/02/10 / 重要

Apache Iceberg Python 0.11.0 リリース解説: PyIceberg の読み書きと REST Catalog が強化

公式リリースノート

公式リリースノート: 公式リリース記事: Apache Iceberg Python 0.11.0 Release

Apache Iceberg Python 0.11.0 は、PyIceberg の read / write、snapshot management、カタログ連携、ORC サポート、REST scan 計画を広く強化するリリースです。公式記事では、380件以上の pull request、50人以上の contributor、28人の first-time contributor が紹介されています。

要点

delete ファイル lookup、generator-based writes、remote S3 signing、manifest cache など read / write path が改善された
snapshot ID や時点指定によるロールバック、current snapshot の直接設定が可能になった
Entra ID auth manager、REST カタログ namespace separator、AWS profile サポートなどカタログ周りが強化された
PyArrow I/O layer に full ORC read サポートが追加された
REST カタログによる server-side scan 計画の同期 API が追加された
Python 3.9 が dropped され、Python 3.13 サポートや aarch64 wheel build が追加された

今回の更新で何が変わるのか

Python 0.11.0 は、PyIceberg を notebook や軽いメタデータ操作だけでなく、より実務的な Iceberg client として使いやすくするリリースです。Reads and writes では、DeleteFileIndex による delete ファイル lookup の高速化、memory pressure を下げる generator-based writes、remote S3 signing の connection reuse、multi-プロセス safe ExecutorFactory、manifest cache の O(N²) growth 修正など、規模が大きくなったときに効く変更が並びます。

Snapshot management では、特定 snapshot ID や時点へのロールバック、current snapshot の直接設定が入りました。Iceberg の強みである snapshot / time travel / ロールバックを Python からより自然に扱えるようになるため、データ修復、検証、パイプラインロールバックの自動化に関係します。

カタログ improvements では、Entra ID、REST カタログの namespace separator、namespace_exists、rename_table の namespace validation、REST request の X-Client-Version header、Glue や fsspec S3 の AWS profile サポートなど、クラウドや enterprise 環境で必要になりやすい認証・名前空間・互換性の改善が目立ちます。

対象になりそうなユーザー・チーム

PyIceberg を ETL、メタデータ inspection、data quality、notebook automation に使っているチーム
REST カタログ、Glue、S3、ADLS などを Python client から扱う platform team
snapshot ロールバックや scan 計画を Python ワークフローに組み込みたいデータエンジニア
ORC を含む Iceberg テーブルを Python から読みたい分析基盤チーム

実務でまず確認したいこと

Python 3.9 の利用が残っていないか確認する
削除された deprecated methods を呼んでいないか regression テストで洗い出す
REST カタログの supported エンドポイント / scan 計画が自社カタログ側でどう返るか確認する
S3 / ADLS / Glue / Entra ID など認証設定の挙動を staging で確認する

どう読むべきか

このリリースは、PyIceberg が本番データ基盤の automation layer として使われる前提に近づいていることを示します。特に REST scan 計画と snapshot management は、単なるメタデータ client から operational client への広がりを感じさせます。一方で Python version と deprecated API の破壊的変更があるため、移行前の依存棚卸しは必須です。