投稿

9月, 2019の投稿を表示しています

Oracle Machine Learning - 主要な属性 (2019/09/24)

イメージ
Oracle Machine Learning - 主要な属性 (2019/09/24) https://blogs.oracle.com/machinelearning/oracle-machine-learning-key-attributes 投稿者: Mark Hornick | Senior Director, Data Science and Machine Learning Oracle Machine Learning は、Oracle Database、Oracle Autonomous Database、Oracle Big Data関連の製品・技術を用いて、データ・サイエンスや機械学習をサポートします。前回のブログ「 Oracle Machine Learning family of products, OML 」でご紹介したように、OMLには様々な機能がありますが、今回のブログでは、「自動化」「スケーラブル」「本番対応」の3つに焦点を当ててご紹介します。 自動化 データサイエンスでは、データの準備、テキストの処理、アンサンブル、モデルの構築と評価、アルゴリズムの選択、モデルのハイパーパラメータの調整など、様々な作業が繰り返されます。 OMLでは、データの準備として、ビン化、正規化、異常値・欠損値の処理などの自動化をサポートしています。これらは、特定のアルゴリズムの要件に基づいて自動的に適用されます。テキスト処理では、データセット内の 1 つ以上の列をテキスト列として認識することができます。これらの列は自動的に処理され、例えば、TF-IDF スコアを持つトークンが抽出されます。このようにして得られた疎なトークン化されたデータは、提供されたトレーニングデータセット内の他の構造化されたデータと自動的に統合され、アルゴリズムに提供されます。 OMLでは、アンサンブルモデルの一種であるパーティショニング・モデルをサポートしています。パーティショニング・モデルは、データを分割する列を1つ以上指定することで、分割ごとに1つのモデルを自動的に構築する機能です。これにより、複数のサブモデルからなる1つのモデルが完成します。ユーザーはトップレベルのモデルを指定してデータをスコアリングしますが、システムはスコアリングされたデータの行に応じて適切なサブモデルを選択