OML AutoML UI - パフォーマンスに影響する4つのポイント (2021/03/31)

OML AutoML UI - パフォーマンスに影響する4つのポイント (2021/03/31)

https://blogs.oracle.com/machinelearning/oml-automl-ui-4-things-you-can-do-that-affect-performance

投稿者:Mark Hornick | Senior Director, Data Science and Machine Learning



OML AutoML User Interfaceのご紹介」では、OML AutoML UIが自動実験のワークフローを通じて機械学習のモデリングプロセスを簡素化するとともに、選択したモデルに対するOML Notebookの生成や、OMLサービスへの即時デプロイメントのサポートなど、いくつかの嬉しい機能を追加していることをご紹介しました。今回の記事では、OML AutoML UIの実験を行う際に使える、4つのパフォーマンスに関するヒントをご紹介します。


Tierを知る


Oracle Autonomous Database上でOracle Machine Learningを使用する際には、使用しているAutonomous Databaseのティアと、データベースのコンピュート設定を念頭に置くことが重要です。Always Free Tierを使用している場合、これは1 OCPUのAutonomous Databaseインスタンスです。つまり、並列性はなく、このようなインスタンスは、比較的小さなデータセットで機能を探索するのに適しています。有料版では、ニーズに合わせてAutonomous Databaseインスタンスを設定することができ、オートスケーリングを選択すると、通常のAutonomous DatabaseのOCPU設定の最大3倍まで弾力的に割り当てられます。


実験のランタイムパフォーマンスに影響を与える


最初にトップレベルのヒントを紹介し、次に追加設定を伴う3つのヒントを見ていきます。


ヒント1:実験を行う際には、「結果を早く出す」か「精度を上げる」かを選択することができます。最初の結果を早く出したいのであれば、これは当然の選択です。結果を早く出す」を選択すると、ハイパーパラメータの探索空間が小さくなります。「精度の向上」では、内部のメタ学習モデルが推奨する、より広範なハイパーパラメータのオプションが使用されます。




実験の設定


実験を作成する際には、追加で設定できる項目があります。ここでは、デフォルトの設定について簡単に説明します。




デフォルトでは、利用可能なすべてのアルゴリズムの中から上位5つのモデルを選択するように設定されています。また、データベースのサービスレベルは「LOW」に設定されているため、並列処理は行われず、ランタイムの上限も高く設定されています。また、実験の実行に伴い、すべての候補アルゴリズムが選択されています。


ヒント2:各アルゴリズムの上位モデルを得るためにモデルをチューニングするには追加の時間が必要なので、上位モデルの選択数を2~3に減らすことができます。初期結果をより早く得たい場合は、推奨アルゴリズムのトップを選ぶことを検討してもよいでしょう。数字を1に設定すると、そのアルゴリズム用にモデルがチューニングされます。




ヒント3:特定のアルゴリズムにこだわりがある場合や、特定の要件がある場合などは、アルゴリズムを検討対象から外すことができます。例えば、モデルの透明性が重要な場合、ニューラルネットワークのようなモデルを除外することは理にかなっています。例えば、ナイーブ・ベイズや決定木は、サポート・ベクター・マシンやニューラル・ネットワークよりも一般的に高速です。




ヒント4:データベースのサービスレベルをMEDIUMまたはHIGHに変更することができます。HIGHは並列性が最も高くなるが、同時実行できるジョブ数が大幅に制限され、MEDIUMはある程度の並列性が得られるが、ジョブ処理の同時実行性が高くなる。なお、Always Free Tierでは1 OCPUの制限があるため、この設定を変更しても影響はありません。ただし、Autonomous Databaseに割り当てるOCPUを増やした場合は、データベースのサービスレベルをMEDIUMまたはHIGHにすることができます。



以上のようになります。



OML AutoML UIをテスト・ドライブする


Oracle Autonomous DatabaseでOracle Machine Learning AutoML UIにOracle Machine Learning Notebooksと一緒にアクセスし、実験の作成と実行、モデルのデプロイ、Notebookの生成を行います。

Oracle Machine Learningの詳細を確認するか、Oracle Always Freeサービスを使用して今すぐお試しください。

コメント

このブログの人気の投稿

Oracle Database 19cサポート・タイムラインの重要な更新 (2024/11/20)

Oracle GoldenGate 23aiでMicrosoft Fabricでのオープン・ミラーリングがサポートされるようになりました (2024/11/19)

Oracle APEX 24.1の一般提供の発表 (2024/06/17)