OML4Py: AI Vector SearchにONNXとHugging Faceを活用 (2024/05/31)
OML4Py: AI Vector SearchにONNXとHugging Faceを活用 (2024/05/31) https://blogs.oracle.com/machinelearning/post/oml4py-leveraging-onnx-and-hugging-face-for-advanced-ai-vector-search 投稿者: Sherry LaMonica Oracle Database 23aiでは、 Oracle AI Vector Search が導入され、トランスフォーマ・モデルを使用してベクターを生成し、データベース内で大規模に管理することで、セマンティック類似性検索に革命をもたらしました。これにより、ユーザーは、意味とコンテキストに基づいて関連情報を見つけられるようになり、データを別のベクトル・データベースに転送する問題点をなくし、複雑さと運用上のオーバーヘッドを削減できます。 OML4Py 2.0以降、クライアントは、事前トレーニング済のトランスフォーマ・モデルをHugging FaceからAI Vector Search用のOpen Neural Network Exchange ( ONNX )形式に変換します。Hugging FaceはディープラーニングのためのオープンソースのPythonライブラリで、自然言語処理(NLP)、コンピュータビジョン、オーディオなどのための何千もの事前トレーニング済みモデルを提供しています。ONNXは、トランスフォーマー、分類、回帰などの様々な機械学習モデルを表すためのオープン形式です。 OML4Pyクライアントは、Hugging Faceリポジトリから事前トレーニング済モデルをダウンロードし、前処理および後処理ステップで拡張し、拡張モデルをONNX形式に変換し、それをデータベース内モデルにロードするか、ファイルにエクスポートすることで、データベースに生成を埋め込むためのパスを合理化します。ONNX形式でロードされると、データベース内のONNXランタイムをシームレスに使用して、AI Vector Searchのベクトル埋込みを生成できます。 AI Vector Searchは、OML4Pyクライアントと組み合わせて、Oracle Databaseでベクトル埋め込みを活用し、テキストデー...