Oracle Autonomous Data WarehouseとSnowflakeが異なる2つのポイント (2021/06/01)
Oracle Autonomous Data WarehouseとSnowflakeが異なる2つのポイント (2021/06/01)
https://www.oracle.com/news/connect/oracle-autonomous-data-warehouse-and-snowflake.html
トランザクションのサポートと弾力的なスケーラビリティは、ワークロードが大規模で複雑になるほど重要になります。
投稿者: Jeff Erickson
開発者がOracle Autonomous Data WarehouseやSnowflakeにたどり着くのは、「複数のソースからのデータを統合して、一緒に分析できる場所を作りたい」という同じ目的を持っているからです。どちらのサービスもクラウド上でネイティブに動作するため、社内のサーバーにハードウェアやソフトウェアをインストールしたり、設定したり、メンテナンスしたりする必要がありません。また、どちらのサービスも、セットアップが簡単で使いやすいことが特長です。
共通点はそれだけではありません。2014年に事業を開始し、2020年に株式を公開したSnowflake Inc.は、比較的短期間で一つのことを極めて成功させましたが、オラクルは数十年前から、技術トレンドや世界中の顧客からの要望に基づいて、コンバージドデータベースの機能を構築してきました。両者の違いが表れるのは、データアーキテクチャが複雑になり始めたときです。いくつかの例を挙げてみましょう。
Amazon Web ServicesとMicrosoft Azure上で動作するSnowflakeは、オンライン・トランザクション・プロセッシング(OLTP)をサポートしていません。
なぜそれが重要なのでしょうか?データは別の場所から発信されているため、複製、抽出、変換(Snowflakeのデータウェアハウス構造に適合するようにデータを加工すること)、そして最終的にSnowflakeのデータウェアハウスにロードする必要があります。このETL(Extract, Transform, Load)プロセスは、人材、サードパーティのソフトウェアツール、サードパーティのサービスに多大な投資を必要とします。しかし何よりもETLには多くの時間がかかるため、分析対象のデータが最新のものではなくなってしまう可能性があります。
Oracle社のデータウェアハウス製品管理担当副社長であるGeorge Lumpkin氏は、「Snowflakeの設計は、データを挿入することだけを目的としており、現実の世界ではデータが実際に変化するという事実を無視しています。Snowflakeでは、大規模なクエリと少数のユーザーによるシンプルな読み取り専用のデータウェアハウスを実現することができます。そして、そのためにOracle Autonomous Databaseを使用することもできます。しかし、何千人ものユーザーがいて、大量の更新やリアルタイム分析を伴う非常に複雑なワークロードを伴うエンタープライズ要件になると、Snowflakeが設計したバニラデータウェアハウスのワークロードの種類をはるかに超えることになります」。
"何千人ものユーザーがいて、多くの更新やリアルタイム分析を伴う本当に複雑なワークロードを持つエンタープライズ要件になると、Snowflakeが設計したバニラデータウェアハウスのワークロードの種類をはるかに超えてしまいます。"
オラクル、データウェアハウス製品管理担当バイスプレジデント、George Lumpkin氏
Lumpkin氏のアドバイス。使いやすいクラウドデータウェアハウスを手に入れても、将来の複雑な要件を念頭に置いておく必要があります。
Snowflakeも「クラウドネイティブ」を標榜していますが、そのアーキテクチャはオンプレミスのデータセンターが抱える古いハードウェアの課題と同じです。Snowflakeは、コンピュートリソースを1、2、4、8、16、32、64、128ノードのビルディングブロックで提供しています*。これは顧客にとって、ワークロードが16ノードから18ノードに増えた場合、32ノードを購入しなければならないことを意味します。つまり、ワークロードが16ノードから18ノードに増えると、32ノードを購入しなければならないということです。これでは、人々がクラウドに移行する際の弾力性に欠けてしまいます」とLumpkin氏は言います。
Oracle Autonomous Data WarehouseはOracle Cloud Infrastructure上で動作し、必要に応じて正確にスケールアップ/ダウンすることができます。「ワークロードを実行するために16個のCPUを使用していて、需要に応じてあと2個のCPUが必要な場合は、単に2個のCPUを追加するだけです。ワークロードを実行するために16個のCPUを使用していて、需要に応じてあと2個のCPUが必要な場合は、2個のCPUを追加するだけです。
オラクルのデータ管理プラットフォームは、クラウド企業が計算機やストレージを問題なく利用できるようになる前に開発されたことも功を奏しているとLumpkin氏は指摘します。その結果、Oracle社はリソースを「非常に慎重に」使用し、CPUとメモリを最大限に活用できるようにプラットフォームを最適化したという。"その結果、Oracleはリソースを「非常に慎重に」使用し、プラットフォームを最適化してCPUとメモリの性能を最大限に引き出すことができました。
開発者やITチームにとっての使いやすさという点では、Autonomous Data Warehouseは、データウェアハウスのプロビジョニング、構成、セキュリティ、チューニング、スケーリング、バックアップを自動化し、ヒューマンエラーを引き起こす可能性のある手動の複雑なタスクをほぼすべて排除することで、より多くのメリットを提供します。また、Snowflakeでは実現できない、Oracle CloudとOracle Cloud@Customerによる顧客のデータセンターの両方で利用できます。
OUTFRONT Media社では、Oracle Autonomous Data Warehouseを使用して、50万枚以上のデジタルおよび静的ビルボードの情報を組み合わせています。わずか数分でテラバイト級のデータをロードして結合し、インタラクティブなダッシュボードを安全に公開しています。
*アナリストのMark Staimerが2021年4月に発表した「Snowflake and the Autonomous Data Warehouse」に関する論文を参照してください。
"...Snowflakeは純粋なデータウェアハウスである。データベース市場の80%を占めるトランザクション型リレーショナルデータベースのデータに直接アクセスすることはできない。Snowflake以外のソースからこのデータにアクセスする必要があります。"
"...DBAは、ワークロードをそれぞれのワークロードのニーズを満たすクラスタの種類に合わせる必要があります。クラスタは、1(X-Small)、2(Small)、4(Medium)、8(Large)、16(X-Large)、32(2X-Large)、64(3X-Large)、128(4X-Large)ノードの異なる固定ハードウェアサイズを持つことができます。"
詳細は
コメント
コメントを投稿