オラクル、OCI Lakeパブリック・ベータにお客様をご招待 (2022/09/01)

オラクル、OCI Lakeパブリック・ベータにお客様をご招待 (2022/09/01)

https://blogs.oracle.com/cloud-infrastructure/post/oracle-welcomes-customers-to-oci-lake-public-beta

投稿者: Tony Alleven | Principal Product Manager


企業は、増え続けるデータを処理するために、従来のデータベースやデータウェアハウスに加えて、データレイクを構築することが多くなっています。お客様は、高い信頼性と経済性、そしてあらゆる種類のデータを保存できることから、データレイクにObject Storageを使用しています。データを管理するために、Oracle Cloud Infrastructure(OCI)は、データの定義と発見、データの移動と処理、およびデータ準備と分析のためのAIサービスのためのネイティブツールを提供します。このようにして、データレイクは、ビジネスユーザー、アナリスト、データオーナー、管理者、データサイエンティスト、プログラマーなどが共有する分析リソースとなり得ます。


多くのデータ、多くのユーザー、多くのツール、そして多くのユースケースがある中で、データレイクにおいて誰がどのデータにアクセスできるかを定義する複雑さを管理する方法を、お客様は必要としています。そこで、データレイクのObject Storageにあるすべてのリソースに対して、きめ細かなアクセスコントロールを提供するOCI Lakeサービスを発表することにしました。お客様は、役割ごとにアクセスルールを設定できるため、例えばIAM(Identity and Access Management)管理者がデータサイエンティストのグループに社員を追加・削除すると、自動的にそのグループの他のメンバーと同じ権限を持つようになります。アクセス権は、標準SQLデータ定義言語を使用して、バケット、オブジェクト、フィールドごとにすべてのObject Storageに対して設定することができます。



OCI Lakeは、ツール間で簡単に共有可能


OCI Lakeのアセットに対するアクセスポリシーが設定されると、アクセスできるすべてのツールとサービスに対して適用されます。各ツールやサービスのアクセスを個別に管理する必要がなく、この統一されたソリューションにより、時間の節約とエラーの回避が可能になります。

図1:分析ソリューションの一部としてのOCI Lake



OCI Lake:Autonomous Data Warehouseとの強力な組み合わせ


データベースを利用するユーザーの多くは、非構造化データや半構造化データも扱えるようにする必要があります。OCI Lakeでは、Lakeにすでに設定されている権限ルールを尊重しながら、LakeをリソースとしてAutonomous Databaseインスタンスに簡単に接続することができます。現在、Autonomous Data Warehouseのユーザーは、統一されたパーミッション・モデルでLakeに問い合わせができるだけでなく、この同じモデルが、Big Data Service、Dataflow、Data Science notebooksといった他の問い合わせサービスにも適用されています。



統一されたアクセス制御


OCI Lakeの使用には2つの部分があります。ロールの作成と、そのロールに権限を割り当てることです。ロールの作成では、例えばデータサイエンス・ユーザー・ロール、データアナリスト・ロール、ファイナンシャルプランナー・ロールを作成し、企業を模倣することができます。これらのロールのメンバーとしてIAMユーザーを割り当てることができます。図 3 では、下位のユーザーは上位の datascience ユーザーの権限を継承します。

図2:ロールの一覧

図 3: datascience ユーザーのロールの詳細


パーミッションも同様に簡単に割り当てることができます。パーミッションはSQLのような構文を使用し、管理者はユーザーがテーブル、データベース、ビュー、マウント、またはファイルを照会、編集する能力を制御することが可能です。

図4:作成されたストックテーブルに権限を追加



非構造化データ、半構造化データの格納


OCI Lakeでは、ファイル構造とテーブル構造の両方でデータを保存することができます。ファイル構造のストレージは、他のObject Storageのバケットと同様に動作します。バケットに接続するマウントを作成し、そのマウントにパーミッションを割り当てることができます。


半構造化データをテーブルやビューのようにクエリできることが重要なので、仮想テーブルと仮想ビューという概念を作りました。多くのテーブルとビューを含むことができる仮想データベースを作成することができます。これらのテーブルやビューは、Parquet、CSV、JSONのファイル形式でLakeに保存されている情報を基に構築されます。ファイルの上にテーブルを作成することで、ユーザーは行や列のレベルでファイルを保護することができます。例えば、データサイエンティストは、患者名を削除した患者記録でモデルを構築できるようになりました。


OCI Lakeでは、統一されたアクセス制御により、レイクデータの保存と管理を簡単に行うことができます。ビッグデータサービス、データフロー、Autonomous Warehouse、Data Integrationサービス、Data Scienceから、中央の権限モデルでデータを照会することができます。



アーリーアクセス


2023年にグローバルリリースを予定しており、現在アーリーアクセスが可能です。早期アクセス期間中のOCI Lakeの使用および評価には、費用はかかりません。Oracle Cloud Infrastructure上で独自のデータレイクを管理し、拡張や複雑性の軽減をお考えの場合は、このメール・リクエストを使ってお知らせください。ご連絡をお待ちしております。


コメント

このブログの人気の投稿

Oracle RACによるメンテナンスのためのドレインとアプリケーション・コンティニュイティの仕組み (2023/11/01)

Oracle Cloud Infrastructure Secure Desktopsを発表: デスクトップ仮想化のためのOracleのクラウドネイティブ・サービス (2023/06/28)

Oracle Cloudのデータベースをオブジェクト・ストレージにバックアップする3つの方法 (2021/12/13)