CMRI、小児がんの治療にオラクルAIを活用、30~50%の効率化を実現 (2022/06/01)
CMRI、小児がんの治療にオラクルAIを活用、30~50%の効率化を実現 (2022/06/01)
投稿者: Sherry Tiao
著者は、Oracle 社の Principal Solution Engineer である Prachi Solomon 氏の貢献に感謝します。
Children's Medical Research Institute(CMRI)は、オーストラリアの医学・生物学研究機関であり、非営利団体として登録されている。60年以上にわたり、子どもたちの健康増進に取り組んでいます。オーストラリア初の新生児研究ユニットの設立や、乳幼児の血管や臓器を修復するためのマイクロサージェリー技術の開発など、多くの実績を残しています。
現在、CMRIは小児がん、てんかん、眼疾患、その他の遺伝病の分野で、子どものためのヘルスケア研究を進めています。しかし、ゲノミクス・シーケンス、プロテオミクス、顕微鏡の高解像度画像、数値シミュレーションなどのデータを分析し、数テラバイトのデータを管理するためには、既存のソリューションでは対応できない優れた計算リソースと、機械学習の目標をサポートする高度なデータサイエンス・サービスが必要であるとCMRIは考えていました。
Oracle Cloud with Oracle AIを採用することで、CMRIは以下を実現することができました。
- OCI Data Scienceの導入により、数値シミュレーションにかかる時間を30日から5日に短縮
- リソースの利用効率が30~50%向上
- Oracle Cloudの利用で約30%のコスト削減
CMRIのクラウドの目標
研究者がさまざまな場所で共同研究を行い、高速なCPUやGPUなどの計算能力をさらに必要とする中、CMRIはこれまでのデータパイプラインの管理方法を変更する時期が来たと認識していました。この機関は、次のような目標を掲げていました。
- プロセスを最適化し、パフォーマンスを向上
- シームレスなコラボレーションを促進し、データを最大限に活用
CMRIは、AWSとGoogle、そしてOracleを評価しました。CMRIは、適切なクラウドソリューションが次のようなものであることを理解していました。
- インフラをほぼ瞬時にプロビジョニングできること
- ニーズの変化に応じてスケールアップまたはスケールダウンが可能
- 物理データセンターと仮想ネットワークのセキュリティを提供すること
また、モデルのライフサイクル全体を管理する機械学習サービスを提供し、オープンソースのライブラリやツールへのアクセスを提供し、モデルの共有や再利用を希望するデータサイエンティストを支援する予定です。
さらにCMRIは、研究者、データサイエンティスト、運用チームが研究データを共有、カスタマイズ、再利用できるようにすることを目指しています。オンプレミスの1台のローカルサーバーでは、複数の人がリソースを共有し、研究プロセスを遅らせることになっていました。パンデミックにより自宅での作業が必要になると、研究者は外部からシステムにログインする必要があり、時間がかかり効率的ではありませんでした。
厳選されたクラウドと機械学習のサービス群
CMRIは、大規模なデータ解析とハイスループットNGS技術からもたらされるデータで医学研究をサポートするという当面の課題に取り組むため、オラクルとパートナーシップを結びました。
CMRIがOCI Data Scienceを採用したのは、機械学習機能に加え、以下のような多くのサービスを提供するためです。
- Oracle Cloud Infrastructure:Oracle Cloudは、あらゆるアプリケーションにとってより良いクラウドとなるよう、ゼロから構築された初のパブリック・クラウドです。クラウド・コンピューティングのためのコア・エンジニアリングとシステム設計を見直すことで、移行を加速し、あらゆるアプリケーションに優れた信頼性とパフォーマンスを提供するイノベーションを生み出し、革新的なクラウドアプリケーションの構築に必要な完全なサービスをお客様に提供しています。
- OCI Data Science:OCI Data Scienceは、データサイエンス・チームがOracle Could Infrastructureで機械学習モデルを構築、訓練、管理するための、フルマネージドかつサーバーレスのサービスです。データ科学者に、Conda環境上でPythonを中心としたツール、ライブラリ、およびパッケージを使用してモデルをトレーニングするための、プロジェクト主導型のコラボレーション可能なワークスペースを提供します。
- OCI Object Storage: Oracle Cloud Infrastructure(OCI)Object Storageは、あらゆる種類のデータをネイティブなフォーマットで安全に保存することができます。冗長性を備えたOCI Object Storageは、分析、バックアップ、アーカイブなどの目的で複数のデータソースを統合できるため、拡張性と柔軟性を必要とするモダンなアプリケーションの構築に理想的です。
Oracle Cloudへの移行経路
CMRIは数カ月かけてAWSを含むさまざまなクラウドをテストしたが、最終的にはその機能と使い勝手の良さからOCIを選択しました。
同社がOCIを選んだ理由は以下の通り。
- CMRIにとって最も重要な機能に対するパフォーマンスの向上
- コスト削減
- クラウドサポートの充実、ハードル解決のための頻繁なエンゲージメントとミーティング
- アップグレードの必要性とインフラの複雑な老朽化に対処する能力
- オープンソースのライブラリやフレームワークにアクセスできる統合AIソリューション
CMRIは数カ月前からOCIをテストしていたため、プロジェクトを正式にクラウドに展開するまでに1週間もかかりませんでした。CMRIは、RAMとCPUを大量に必要とするリソース集約型のジョブを優先的に導入しました。また、コラボレーションが必要なプロジェクトも、クラウド化によって最も恩恵を受けられるプロジェクトとして優先的に導入しました。
その結果、CMRIはデータをコピーする必要がなくなりました。これにより、データサイエンス・インスタンスからVMへの切り替えが可能になりました。CMRIは、OCI Object Storageを使用して、アーカイブされたデータセットを保存しています。さらに、CMRIはドメイン固有のワークフロー言語を使用した多くのパイプラインを使用しており、公衆インターネット上のサーバーに接続するためにローカル転送とSSHトンネリングを使用しています。
AIと機械学習による医療研究の成果
CMRIのシニアバイオインフォマティシャン兼データサイエンティストであるPablo Galaviz氏は、「オラクルは、小児がんを治療するための研究開発に必要な人工知能と計算のプラットフォームを提供してくれました」と述べています。
かつてCMRIが約30日かかっていた典型的な数値シミュレーションは、実行するシミュレーションの数にかかわらず、OCI Data Scienceを使用すればわずか5日で完了します。これは、エンドツーエンドの機械学習サービスであるOCI Data Scienceによって実現されたもので、CMRIは研究者にさまざまな種類の分析やデータに対する基本テンプレートを提供し、データサイエンティストはそれをさらにカスタマイズできるようになっています。
OCI Data Scienceの利用例としては、タンパク質のシミュレーションや、特定のタンパク質に変異を導入したときに何が起こるか、その変異によってタンパク質が弱くなるか強くなるかの測定、プロテオミクスプロジェクトのデータ分析などが挙げられます。
OCIへの移行により、CMRIは常に最新の技術を利用することができるようになりました。OCIを購入する前にやらなければならなかったことのひとつに、自社でサーバーを購入し、自社製のグラフィックカードを使用することがありました。しかし、グラフィックカードは常に進化しているため、すぐに古くなってしまうという問題がありました。しかし、Oracleは常にグラフィックカードをアップデートしているので、常に最新のハードウェアを利用することができます。"
CMRIは、オラクルが提供するGPUを使用して、集中的な分子ダイナミックシミュレーションを実行し、さらにNVIDIAのParabricksというツールを使用して、CMRIがゲノムから参照ゲノムに配列をマッチングするのを助けています。CMRI は、データ転送やリソースの取得を待つのではなく、より速くテストを行い、より速くリソースをプロビジョニングできるようになりました。現在では、新しいプロジェクトを1日以内に展開し、設定することができます。
OCIへの移行により、CMRIはビッグデータと機械学習機能を活用し、データベースの定型作業、データベース統合、業務報告、バッチデータ処理などを自動化することができるようになりました。また、データを必要とする人が、より迅速にデータを利用できるようになりました。
OCIは、CMRIのガバナンスとセキュリティの簡素化に貢献しました。OCIを導入する前、CMRIは集中型の共有ドライブを使用しており、VPNやマウントドライブによる複雑なアクセスを行っていました。現在では、OCI Object Storageからデータを共有することができます。OCIを使用することで、CMRIは環境に対するコントロールを強化し、特定の分析のために特定の環境を構築することができます。これにより、特に異なるソフトウェアタイプ間でパッケージの互換性がない場合、ガバナンスがよりシンプルになります。これにより、CMRIは医学研究のためのより高度なパイプラインの構築に専念できるようになりました。現在、CMRIはデータ、コード、リソースを研究所内の人と容易に共有することができます。
また、単一の統一されたクラウドプラットフォームを利用することで、ワークフローの構築や再現性のある結果の生成にも役立っています。クラウドによる近代化は、複雑な遺伝子治療研究の実施など、CMRIに革新的な機会をもたらしています。scRNA-Seqやゲノミクスなどのプロジェクトにおいて、CMRIはリソースの利用効率を30~50%向上させました。また、サーバーを維持する場合と比較して、約30%のコスト削減を実現しています。
今後の機械学習による医療研究の目標
CRMIは、最終的にOCI VisionとOCI Data Labelingを使用して、境界細胞に関するワークフローを自動化することを計画しています。また、CMRIは、画像をオブジェクトストレージに置き、スクリプトを実行して画像を取り出し、ネットワークの学習が完了した時点でそれを処理することも計画しています。また、ビッグデータ統合の分野も拡大が見込まれています。プロテオミクス、ゲノミクス、トランスクリプトミクスを含むプロジェクトでは、異なる研究機関からのサンプルとメタデータを必要とし、乳がん、骨がんなどの異なる疾患からのデータを統合する必要があります。これを達成するために、CMRIはOCIにある追加の計算能力を利用する予定です。
CMRIは、医学研究の限界を押し広げ続けており、オラクルとの連携により、子供たちの生活をより良いものにし続けることができます。
Oracle AIを試すには、無料の機械学習ワークショップを開始してください。
コメント
コメントを投稿