OCI GoldenGateによるOCIオブジェクト・ストレージへのリアルタイムApache Iceberg Lakehouseの構築 (2026/05/08)
OCI GoldenGateによるOCIオブジェクト・ストレージへのリアルタイムApache Iceberg Lakehouseの構築 (2026/05/08)
投稿者:Deniz Sendil | Senior Principal Product Manager
この1年間で、Apache Icebergはオープンレイクハウスアーキテクチャの標準的なテーブルフォーマットとなりました。こうした流れを受け、OCI GoldenGateのApache Icebergサポートも進化を続け、Oracle GoldenGateを基盤としたさまざまなリアルタイムオープンレイクハウスアーキテクチャに関するブログ記事を複数公開してきました。
このブログでは、OCI オブジェクトストレージ上にリアルタイムの Apache Iceberg ベースのオープンなレイクハウスを作成するために、OCI GoldenGate を構成する方法について詳しく見ていきます。
あなたが構築するもの
このブログでは、OCI GoldenGate Big Data を構成して、ソース データベースからの変更をキャプチャし、OCI Object Storage に保存されている Apache Iceberg テーブルにリアルタイムでレプリケートする方法を説明します。ターゲットアーキテクチャでは、OCI Object Storage Amazon S3 互換性 API、Apache Iceberg Hadoop カタログ、および OCI GoldenGate の Apache Iceberg ハンドラーを使用して、外部処理エンジンを必要とせずに Iceberg テーブルを作成し、継続的に更新します。
Apache Iceberg CDCにOCI GoldenGateを採用する理由とは?
- 処理エンジンは不要です。OCI GoldenGateはApache Iceberg Java APIを直接使用するため、外部の処理エンジンを必要とせずに、Icebergテーブルを作成し、データをリアルタイムで複製できます。
- プラットフォームを横断したリアルタイムIcebergレイクハウス:OCI GoldenGateは、幅広いオブジェクトストレージサービスとApache Icebergカタログをサポートしており、チームはニーズに最適なプラットフォーム上でリアルタイムレイクハウスアーキテクチャを柔軟に構築できます。
- OCI GoldenGate マルチクラウド: OCI GoldenGate は、Oracle Database@Azure や Oracle Database@Google Cloud などのマルチクラウド環境に、Oracle のフルマネージド型クラウドネイティブ CDC サービスを提供します。これにより、チームはデータおよび分析プラットフォームの近くでリアルタイムの Apache Iceberg レプリケーションを実行し、該当する場合は好みのクラウド商用モデルに合わせて消費量を調整し、クラウド全体で GoldenGate インフラストラクチャを自己管理する必要がなくなります。
前提条件:
OCIオブジェクトストレージに接続するためのオブジェクトストレージAmazon S3互換性APIを設定します。
- OCIオブジェクトストレージバケットを作成し 、一意の名前空間を取得します。
- OCIポリシーを Amazon S3互換性APIと連携させるには、設定を有効にしてください 。
- 顧客秘密鍵を作成する
- 名前空間名 と リージョン識別子を含む、アプリケーションの新しいパス形式のエンドポイントを設定します 。例:https://<namespace>.compat.objectstorage.<region>.oci.customer-oci.com
Apache Iceberg レプリケーションは、OCI GoldenGate Big Data デプロイメントタイプでサポートされています。OCI GoldenGate Big Data デプロイメントを作成します。
Apache Iceberg接続を作成する
- OCI GoldenGateとApache Icebergの接続に関する詳細は、OCI GoldenGateのドキュメントを参照してください。
- このブログでは、カタログタイプとして Hadoopを使用します。OCIオブジェクトストレージには、Nessie、Polaris、RESTカタログも使用できます。
- OCIオブジェクトストレージS3 APIエンドポイントへの接続には、ストレージタイプとしてAmazon S3を使用します。詳細については、OCI GoldenGateのAmazon S3接続に関するドキュメントを参照してください。
- スキーマタイプはS3Aのままにしてください。
- 必要に応じて残りの項目を入力してください。
- 接続を作成し、 OCI GoldenGateビッグデータデプロイメントに割り当てます。

Apache Iceberg Replicatを作成する







ベストプラクティスと推奨事項
- Apache Icebergレプリケーションには、非圧縮操作を使用することをお勧めします。Oracle GoldenGate Extractは 、非圧縮操作を生成するように構成できます。Extractを追加する際に、LOGALLSUPCOLS パラメータを使用してください。LOGALLSUPCOLSを指定すると、ExtractはUPDATE操作の完全な前イメージをトレイルレコードに自動的に含めます。
- ソーステーブルに主キー(PK)がない場合、 ExtractにKEYCOLS 句を含めることで代替キーを定義できます。ソーステーブルにPKがなく、かつExtractにKEYCOLSが指定されていない場合、OCI GoldenGate Apache Icebergレプリケーションは失敗します。
- OCI GoldenGate Apache Iceberg レプリケーションは、マージオンリードをサポートしています。マージオンリードのパフォーマンスを向上させるため、Apache Iceberg レプリケーションは内部集約を実行します。デフォルトの集約ウィンドウは 15 分で、設定可能です。集約期間が長いほど、Oracle GoldenGate が集約できる操作の数が増え、特に長時間実行されるトランザクションに有効です。この設定は、 Replicat プロパティファイルにgg.handler.iceberg.fileRollInterval を追加することで行えます。例: gg.handler.iceberg.fileRollInterval=30m
制限事項
現在、 Oracle Autonomous AI DatabaseはApache Icebergテーブルとのマージオンリードをサポートしていません。OCI GoldenGateのApache Icebergレプリケーションはマージオンリードをサポートしているため、このことがOCI GoldenGateによって作成されたApache Icebergテーブルへのクエリ機能を制限しています。
その他の既知の制限事項については、Oracle GoldenGateのドキュメントを参照してください。
まとめ
OCI GoldenGateは、エンタープライズグレードのCDCとオープンテーブルフォーマット、そしてOCIオブジェクトストレージを組み合わせることで、OCIオブジェクトストレージ上にリアルタイムのApache Iceberg Lakehouseを簡単に構築できるようにします。Apache Icebergカタログ、S3互換ストレージ、自動テーブル作成、そしてIceberg Java APIの直接使用をサポートするOCI GoldenGateは、追加の処理エンジンを不要にし、アーキテクチャの柔軟性と拡張性を維持します。
このブログでは、Amazon S3 Compatibility APIを使用して、OCI GoldenGate Big Dataを構成し、ソースデータベースの変更をOCI Object Storage上のApache Icebergテーブルにレプリケートする方法について説明しました。また、パススタイルのアクセス、データウェアハウスの場所、ソースとターゲットのマッピング、操作の集約、キーの処理など、重要な構成オプションについても解説しました。
Apache Icebergがオープンなレイクハウスアーキテクチャの基盤として定着するにつれ、OCI GoldenGateはIcebergテーブルを運用データで継続的に更新するための強力なCDCレイヤーを提供します。これにより、チームはOCIオブジェクトストレージ上にリアルタイム分析アーキテクチャを構築しながら、Oracle GoldenGateに期待されるオープン性、柔軟性、信頼性を維持することができます。
コメント
コメントを投稿