Oracle AnalyticsとOCI Document Understandingを使用してキー値を抽出 (2023/12/27)

12月 26, 2023

Oracle AnalyticsとOCI Document Understandingを使用してキー値を抽出 (2023/12/27)

https://blogs.oracle.com/analytics/post/innovate-with-oracle-analytics-and-ai-document-understanding

投稿者： Benjamin Arnulf | Senior Director, Product Strategy, Oracle Analytics

Barry Mostert | Senior Director, Artificial Intelligence and Analytics

事前トレーニングされたOCI AIモデルに基づいてテキストと有効期限を認識するためにOracle Analyticsで使用されるパスポート画像の例

Oracle AnalyticsソリューションがOracle Cloud Infrastructure (OCI) Document Understandingと統合されるようになりました。

OCI Document Understanding は、開発者が API やコマンドラインインタフェースツールを通じてドキュメントファイルからテキスト、表、その他の重要なデータを抽出できるようにする OCI AI サービスです。 OCI Document Understanding を使用すると、事前構築された AI モデルを使用して退屈なビジネス処理タスクを自動化し、業界固有のニーズに合わせてドキュメント抽出をカスタマイズできます。

テキスト抽出、テーブル抽出、キー値抽出、およびドキュメント分類に事前トレーニングされたモデルを使用できます。事前トレーニングされたモデルを選択したら、画像をアップロードし、そのモデルをOracle Analytics Cloud (OAC)に登録し、データ・フローにモデルを適用して、履歴書、パスポート、領収書、または請求書。

ここでは、OCI Document Understanding に基づいてデータ視覚化プロジェクトを 5 分以内の 4 つのステップで作成する方法を説明します。手順は次のとおりです。

サンプル・パスポート・イメージをOracle Cloudのプライベート(非パブリック)バケット・オブジェクト・ストレージにアップロード
OCI Document Understanding モデルをOracle Analytics Cloudに登録
AI モデルをサンプルのパスポート画像に適用するデータフローを作成
認識されたキー値をデータセットに追加し、このデータセットをワークブックで使用してデータを視覚化

前提条件は、OCIに接続できるOracle Analytics Cloudインスタンスがあることです。

ステップ 1 – OCI でバケットを作成

次の URL で OCI に接続します: https://www.oracle.com/cloud/sign-in.html
メニューオプションをクリックし、 [ストレージ]をクリックして、バケットを作成し、名前を設定します。
モデルのトレーニングとテストに必要なすべてのドキュメント画像をバケットにアップロードします。
バケットが OAC と同じテナントにあることを確認してください。この例では、バケットは以前に作成した「Bucket-vision-ai」で、AID という名前のフォルダーに 9 枚のサンプルのパスポート写真をアップロードしました。

このステップでは、OAC がアップロードされた画像にアクセスして AI モデルを適用できる場所を生成します。

ステップ2 – Oracle Analytics Cloudにモデルを登録

OAC ホームページで、右上隅にある 3 つの小さな点メニュー (「...」または省略記号) をクリックします。
「モデル/関数の登録」を選択し、「OCI ドキュメント理解モデル」を選択します。
選択したら、OCI 接続を選択します。存在しない場合は、OAC で新しい接続を作成する必要があります ([作成] > [接続] > [OCI リソース])。
「モデルの選択」ウィンドウが表示されます。モデルタイプとして「事前トレーニング済みドキュメントキー値抽出」を選択します。
右側のパネルで OCI バケットを選択し、ドキュメントタイプを選択します。この例では「パスポート」です。

OAC での事前トレーニングされたドキュメントキー値抽出 AI モデルの選択の例

ステップ 3 – AI モデルを画像に適用

OAC で新しいデータフローを作成します。
バケット URL を含む CSV ファイルを使用してデータセットを作成します。
データセットをデータフローに追加します。
「 AI モデルを適用する」ステップを追加して、事前トレーニングされた AI モデルを画像に適用します。 [パラメータ] でバケット URL を選択するか、ラインアイテムとして画像を表示するデータセットを使用する場合は [ファイルの場所] を選択します。
項目別画像を使用する場合は入力タイプとして「ドキュメント」を選択し、バケット URL を使用する場合は「バケット」を選択します。
データを新しいデータセットに保存するステップを追加します。保存されたデータには、イメージ名と URL、および抽出されたキー値のテキスト/番号が含まれている必要があります。

データフローは画像をロードし、事前トレーニングされた AI モデルで分析し、画像から重要な値を抽出します。この例では、パスポート文書です。次に、データフローによってすべての情報がデータセットに読み込まれ、データの探索と視覚化に使用できます。

このスクリーンショットは、AI モデルによって生成された結果を含むデータフローの例を示しています。

ステップ 4 – Oracle Analytics で結果を視覚化

OAC で新しいワークブックを作成します。
データフローによって生成された新しいデータセットを追加します。
バケット内のすべての画像を表示するには、画像プラグイン視覚化オブジェクトを追加します。
左上隅のフィルターアイコンをクリックして、この Image オブジェクトをフィルターとして使用します。
データセットのすべての列を表示する新しいテーブルを作成します。
パスポート画像の 1 つをクリックすると、テーブルで抽出されたキーの値が表示されます。
これで、このワークブックを出発点として使用して、ドキュメントをフィルター処理して分析するための追加の計算メトリックを作成できるようになりました。この例では、有効期限を分析し、期限切れ (赤) か期限切れ (緑) かを示す条件付き書式ドーナツを作成することにしました。

画像プラグイン、OCI Document Understanding、計算メトリックの条件付き書式設定を使用した OAC ワークブックの例

お客様は OCI Document Understanding を使用して、パスポートから請求書、領収書、履歴書に至るまで、複数の種類の文書を大規模に認識しています。 Oracle Analyticsを使用すると、数分でデータを適用して視覚化できるため、データから洞察、アクション、意思決定まで迅速に進むことができます。

データ視覚化のヒント

画像や検出されたオブジェクトの表示に問題がある場合は、Google Chrome ブラウザに URL (chrome://flags/#block-insecure-private-network-requests) を入力してください。
Google Chrome では次の拡張機能が必要になる場合があります: https://chrome.google.com/webstore/detail/always-disable-content-se/ffelghdomoehpceihalcnbmnodohkibj?utm_source=chrome-ntp-icon
また、オブジェクトストレージへのアクセスに問題がある場合は、デバッグテストとして「安全でないプライベートネットワークリクエストのブロック」を一時的に無効にします。

リソース

OAC で AI Document Understanding を使用する方法の詳細については、次のリンクを確認してください。

Watch a YouTube demo of OAC and OCI Document Understanding https://www.youtube.com/watch?v=GpjRpl77WL4.
Read how OAC is integrated with AI Vision in the Oracle Analytics and AI Vision blog.
More information about Oracle Analytics: https://www.oracle.com/business-analytics/.
More information about Oracle AI: https://www.oracle.com/artificial-intelligence/ .
For documentation, visit the Oracle Help Center.

このブログを検索

Oracle Cloud Infrastructure Blog(翻訳)