すべてのデータを対象としたグラフ分析 (2025/10/14)
すべてのデータを対象としたグラフ分析 (2025/10/14)
https://blogs.oracle.com/database/post/graph-analytics-for-all-of-your-data
今日、データはデータベース、オブジェクトストア、ファイルシステム、ストリーミングソース、保存されている履歴データなど、あらゆる場所に存在します。こうしたデータの中には、例えば次のような難しい質問への答えが隠されています。
- サプライチェーンにおける物流のボトルネックの追跡
- 製造プロセスにおける製品とコンポーネントの依存関係の検出
- 金融システムにおける資金の流れを追跡し、詐欺の可能性がある異常なパターンを発見する
- クリックストリームアクティビティを製品購入に結び付けて、より優れた製品推奨を実現します
グラフ分析は、開発者がデータ内の一見して明らかではない関係性を探ることを可能にすることで、こうした複雑な疑問に答えるのに役立ちます。図1では、グラフクエリによって特定のサイクルパターンが強調表示されており、金融サービスにおける潜在的な不正行為(つまり、資金がサイクル内で移動している)を示唆している可能性があります。
これらの例が示すように、チームは従来の分析を超えて、グラフ分析を通じて相互接続されたデータ全体のパターン、依存関係、隠れた関係を発見できます。
グラフ分析とデータレイク
グラフ分析の威力を考えると、分析対象データの範囲(データレイクに存在する外部データなど)の拡大を検討し、グラフ分析をデータレイクで活用することの容易さに疑問を抱くかもしれません。データレイクは、その定義上、さまざまなソースからさまざまな形式でデータを保存するため、さまざまなツールと言語が必要になります。さまざまなツールと複数の言語は、JSONデータ、CSVログファイル、位置データ、ベクター検索など、それぞれ専用のAPIとツールが必要になるため、複雑さを増します。その結果、開発者は、この「従来型」データレイクにさまざまなコンポーネントを統合することに多くの時間を費やし、アプリケーションの革新と開発に費やす時間が少なくなってしまいます。そのため、グラフ分析はもちろんのこと、あらゆる種類の分析を実行することさえ難しく複雑な作業だと考えるかもしれません。
先日発表されたOracle Autonomous AI Databaseの新たなイノベーションにより、データレイクがより多様化、複雑化しても、統合環境のシンプルさを維持できるようになりました。重要なのは、クラウド・オブジェクト・ストレージとApache Icebergなどのオープン・テーブル形式のスケーラビリティと、高速で詳細なグラフ分析をOracle Autonomous AI Database内で統合できることです。
- あらゆる種類のデータを活用:Autonomous AI Database なら、SQL のパワーを活用して、多種多様なデータソースから、事実上あらゆるタイプのデータを分析できます。従来のデータレイクでは、様々なデータタイプやデータ形式に対応するために、ニッチでサイロ化した専門技術を駆使する必要がありましたが、今ではSQLという単一の言語で、多種多様なデータに対して多様な分析を実行できます。Autonomous AI Database を使えば、あらゆる分析を統合・統合できるため、AI アプリケーションに必要なすべてのデータを提供できます。
- プロパティグラフが簡単に:SQLのシンプルさは、従来は専用のグラフクエリ言語を必要としていたグラフ分析にも応用されています。最新のSQL標準規格(SQL:2023)には、プロパティグラフの作成とクエリのための新しい構文が含まれており、SQLでアクセス可能なあらゆるデータに対して高度なグラフ分析を実行できます。標準化されたSQLをグラフで使用できるようになったことで、SQL開発者はグラフ分析を活用できるようになり、ニッチなツールセットから、実質的にあらゆるアプリケーションワークフローに統合できる、広く利用可能な機能へと進化しました。Oracle AI Databaseは、この新しいグラフ構文を実装した最初の商用データベースです。
- 外部データへのアクセスを簡素化:フルマネージドのOracle AI Databaseクラウド・サービスであるAutonomous AI Databaseは、実質的にあらゆる外部データソースをテーブルという抽象化を通して表示し、SQLでアクセスすることを可能にします。また、SQLでアクセス可能なデータは、データベース・テーブルやオブジェクト・ストアなど、保存場所や形式(Apache IcebergやJSONなど)を問わず、グラフとして分析できます。つまり、Icebergテーブルを含むオブジェクト・ストアのデータに直接接続、クエリ、分析できるため、膨大な量のデータを移動したり複製したりすることなく、隠れた関係性やパターンを解明できます。
- 強力な構築済みアルゴリズム:Autonomous AI DatabaseはGraph Serverを統合し、特許取得済みの技術を用いて複雑なグラフアルゴリズムを高速に並列実行することを可能にします。Graph Serverでは、標準的なグラフアルゴリズムとグラフ機械学習アルゴリズムを使用してグラフを分析できます。グラフ機械学習アルゴリズムはモデルを作成し、それを用いて一致するパターンを見つけて予測を行うことができます。例えば、「どの顧客が類似した閲覧パターンや購入パターンを持っているか、そしてそれによって顧客の将来の購入を予測できるか?」といった予測が可能です。開発者は、統合ノートブックまたはクライアントアプリケーションでPythonまたはJava APIを使用して80を超える構築済みアルゴリズムにアクセスすることで、この種の予測を実行できます。
Icebergデータを使ったシンプルなグラフクエリで複雑な質問に答える
Autonomous AI Databaseのようなデータプラットフォームを利用すると、シンプルなSQL構文を使って外部のデータとデータベース内のトランザクションデータを組み合わせることで、グラフ分析を実行できます。ここでは、クリックストリームデータと商品購入トランザクションデータを1つのグラフに統合しています(図2参照)。これにより、「顧客は商品ページにアクセスするために何回クリックしたか、そしてそれが商品購入にどのような影響を与えたか」といった質問に簡単に答えることができます。
グラフは、データを頂点(ノードとも呼ばれ、図2の円はすべてグラフに示されています)とエッジ(リレーションシップとも呼ばれ、図2の線)でモデル化します。頂点はデータ内のエンティティまたは「もの」を表し、エッジはそれらのつながりを表します。例えば、オンラインショッピングにおける顧客の行動を追跡する場合、各Webページは頂点としてモデル化され、顧客によるページ間の移動はエッジとしてモデル化されます。取引データの場合、各顧客と各製品は頂点としてモデル化され、製品を購入する顧客はそれらの間のエッジとしてモデル化されます。
とデータベース内の取引データ(ピンクのノード)のリンク
Apache Iceberg のようなオブジェクトストア形式のデータに対してグラフ分析を直接活用することで、これまでサイロ化されていた膨大なデータソースから新たなインサイトを引き出すことができます。例えば、上に示したように、オンラインショッピング中の顧客行動を追跡し、データベース内のトランザクションデータとリンクさせることができます。オンラインショッピングでは、顧客の購入決定は、閲覧、ユーザーコメントの確認、商品の比較、デジタルショッピングカートへの商品の保存といったデジタルパスを経由します。データレイク内の Web ログやアプリインタラクションのアクティビティを、データベースに保存されている顧客の購入履歴とリンクさせることで、顧客の購入パターンに関する新たな、より詳細なインサイトを得ることができます。顧客の閲覧パターンと購入決定の関係性を把握することが可能になります。
データレイクを使用してグラフ分析を実行する場合の適用可能なユースケースは他にも多数あります。
このようなグラフには、様々な種類のデータを統合できます。製品に対する顧客レビューなどの非構造化テキストのベクトル埋め込みは、頂点または辺のプロパティとして使用できます。また、製品の説明など、JSON形式で表現されたキーと値のペアにアクセスし、グラフ内で表現できます。「閲覧時間が短い顧客が購入した商品と一致する製品説明は何か?」といった質問は、顧客がこれらの商品を購入する際に何が欲しいかを知っていることを示唆している可能性があり、類似商品もよく売れている可能性があります。
エンタープライズ規模のパフォーマンスとセキュリティ
Autonomous AI Databaseでグラフクエリを実行する際、そのスケーラビリティ機能を活用することで、データサイズの増大に合わせて複雑なマルチホップクエリのパフォーマンスを拡張できます。パーティションプルーニングやハイブリッド列指向圧縮といった成熟したパフォーマンス機能、そしてAutonomous AI Database Data Lake Acceleratorは、強力なクエリパフォーマンスとスケーラビリティを実現する主要機能の一部です。
さらに、このようなグラフクエリを用いたデータの取得は、Autonomous AI Databaseに内蔵された高度なセキュリティポリシーによって制御できます。データベースのネイティブ機能として、あらゆるセキュリティアクセスポリシーが利用可能です。
まとめ
Autonomous AI DatabaseとOracle Graphを活用することで、組織はオブジェクト・ストレージ内の大規模なIcebergテーブルを含むあらゆるデータに対してグラフ分析のパワーを活用し、これまで隠れていた関連性、パターン、そしてビジネスチャンスを発見することができます。シンプルで標準化されたSQLにより開発者はアクセスが可能になり、グラフ分析をアプリケーションや分析ワークフローに統合することで、画期的なビジネスインサイトを獲得できます。
皆様からのご意見をお待ちしております。Oracle Databaseの公開ディスカッションフォーラムで、皆様の体験談、アイデアの投稿、ご質問などをぜひお寄せください 。LiveLab 「オペレーショナル・プロパティ・グラフの探索」も ぜひお試しください 。
詳細については、以下をご覧ください。
コメント
コメントを投稿