ETIQMEDIA、OCIで自動化された動画転写およびインデックス作成ソリューションを認定 (2024/04/17)

ETIQMEDIA、OCIで自動化された動画転写およびインデックス作成ソリューションを認定 (2024/04/17)

https://blogs.oracle.com/cloud-infrastructure/post/etiqmedia-video-transcription-indexation-oci

投稿者:María Perolet | Lead speech technologies expert in Etiqmedia

Antonio Carpio | CEO in Etiqmedia

Adolfo Arguedas | COO in Etiqmedia

Nacho Herrera | Senior Speech Technologies Specialist in Etiqmedia

Alessio Comisso | OCI Senior Big Compute Specialist


この記事では、Oracle Cloud Infrastructure(OCI)上のETIQMEDIAの自動転写システムの効率を評価することを目指しています。


人工知能(AI)はトレンド・マーケットであり、あらゆる業種で採用が拡大しています。メディアプロフェッショナルにとって、AIはゲームチェンジャーであることが証明されており、効率性を高め、コンテンツ品質を高め、ユーザー体験に革命をもたらす多数のアプリケーションを提供しています。コンテンツ推奨システムから、最新の生成AIテクノロジーによる自動コンテンツ作成まで、自動転写、翻訳、センチメント分析、パーソナライズされた広告、生産後のプロセスの強化など、アプリケーションの範囲は膨大です。



TSA、OCI、およびETIQMEDIA


TelefónicaServicios Audiovisuales(TSA)は、AIを使用したマルチメディアコンテンツの分析にOCIおよびETIQMEDIAテクノロジを使用して、視聴覚部門における先駆的な概念実証(POC)を推進しました。イノベーションラボであるLABTSAを通じて、TSAは、Telefónicaの視聴覚サービスの範囲内で、メディア、オーディオ、およびビデオ分析のためのAIソリューションの探索と適用における大手企業として統合されています。ETIQMEDIAは、AIベースのソリューションの開発を専門とするスペインの企業で、ほとんどの国の視聴覚部門に存在しています。そのソリューションの中には、コンピュータビジョン、マルチメディアコンテンツインデックス作成、自動音声転写などがあります。


2つの主要な転写技術の機能がテストされています。1つはConvolutional Neural Networks、もう1つはTransformersに基づいています。Convolutional Neural Networksベースのアプローチは、CPU上で評価されるように設計されており、音響面とコンテキスト面の両方で、各ドメインにモジュラーでカスタマイズ可能な文字を備えているため、アプリケーションの柔軟性が向上します。また、リアルタイム処理も可能です。


一方、Transformersに基づくテクノロジーは、録音条件が悪い環境や、テレビシリーズや映画など、より自発的なスピーチを持つコンテンツにおいて、より堅牢な音響処理能力を提供します。さまざまなタイプのコンテンツ(機関、ニュース、フィクション)に対してテストが行われ、両方のシステムのコンピューティング速度を包括的に検証しています。


OCIは、推論やモデル・トレーニングなど、機械学習(ML)のワークロードに適した豊富なNVIDIA GPU搭載コンピュート・シェイプを提供しています。


たとえば、NVIDIA A10 Tensor Core GPUに基づくシェイプは、経済的なメリットをもたらします。OCI製品には、1つのGPUを搭載した仮想マシン(VM)、2つのGPU、さらに4つのA10 GPUを搭載したベアメタル・シェイプも含まれています。A10ベースのVMは、リソースを可変需要に柔軟に適応させるために、迅速に起動および停止できます。


中規模および大規模モデルのトレーニングおよび推論については、NVIDIA A100 Tensor Core GPUおよびNVIDIA H100 Tensor Core GPUに基づくシェイプと、NVIDIA L40S GPUに基づく新しく発表されたシェイプを検討してください。加速されたRoCEプロトコルとNVIDIA ConnectX NICに基づくOCIの高パフォーマンス・ネットワークを使用することで、トレーニング・ジョブを数千のGPUに拡張できます。小規模モデルの場合でも、A10ベースのシェイプをトレーニングすることは有益です。



テスト開発


1日当たりの処理時間数(スループット/日)を最大化することを目的として、記述されたシステムを評価した。この目的のために、OCIでテストを実施し、リソースを最大限に活用しました。


これらのテストでは、単一のA10 GPU、15個の物理CPUコア(OCPU)および240 GBのRAMメモリーを含むVM.GPU.A10.1シェイプを使用しました。この設定により、バランスのとれたコンピュートVMが提供され、GPUベースとCPUベースの推論の両方が実行されます。CPUとGPUの両方の処理タイプに同じシェイプでアクセスすることで、異なるソースから異なる特性を持つオーディオストリームを含む複雑なタスクを効率的に実行できます。さらに、クラウド・インフラストラクチャの管理を最適化できるため、さまざまなタイプの処理のために複数のインスタンスを維持および管理する必要がなくなり、運用コストが削減されます。


これらのテストに使用されている動画の平均所要時間は約2時間です。CPUを使用するコンボリューションASRでは、2つのスレッド(Conv-1)を持つ1つのアプリケーション・インスタンス、それぞれ5つのスレッド(Conv-5)を持つ5つのアプリケーション・インスタンス、およびインスタンスごとに2つのスレッド(Conv-10)を持つ10個のアプリケーション・インスタンスという3つの構成を採用しました。次の表に、各構成で取得されるスループットを示します。


Test (Thread count)

Conv-1 (2)

Conv-5 (25)

Conv-10 (20)

hours/day of video
(improvement over Conv-1)

144.93

449.18 (3.09 times)

440.29 (3.03 times)


アプリケーション・インスタンスの数を並行して増やすことで、CPU使用率を最大化できるため、スループットが大幅に向上します。具体的には、Conv-1と比較して、3.09x(Conv-5)および3.03x(Conv-10)の効率が向上します。また、並行して実行するアプリケーション・インスタンスの数は少なく(Conv-5)、各インスタンスにより多くのリソース(スレッド)を提供することで、Conv-10と比較して約2%の改善を達成しました。


トランスフォーマの場合、単一のA10 GPUでサポートされているパラレルでのアプリケーション・インスタンスの最大数は3ですが、これはモデル・サイズおよびコンピュート・シェイプ・タイプによって異なります。そのため、パフォーマンスは単一のアプリケーション・インスタンス(TF-1)、2つのアプリケーション・インスタンス(TF-2)および3つのアプリケーション・インスタンス(TF-3)を使用して比較されます。各アプリケーション・インスタンスは、1つのアプリケーション・インスタンスの使用と比較して、TF-3によって達成された改善が2.04回であることを示す、時間/日の次のスループット向上を取得しました。


  • TF-1: 401.67
  • TF-2: 730.01
  • TF-3:818.45(2.04倍改善)


OCIが各システムのニーズに簡単に適応し、必要に応じてCPUまたはGPUの使用を最適化できることを観察します。



まとめ


OCIサーバーで実施されたテストは、Convolutional ASRとTransformersの両方で、得られたスループットの点で肯定的な結果をもたらしました。Convolutional ASRのマシン(15 OCPU 240GBのRAM)に最も適した構成には、インスタンスごとに5つのスレッドを持つ5つのアプリケーション・インスタンスがあり、その結果、ビデオ転写スループットが449時間/日になります。トランスフォーマの場合、処理能力は利用可能なGPUと密接に関連しています。このシェイプ(NVIDIA A10 24 GB)では、3つのアプリケーション・インスタンスを並行して処理できるため、スループットが818.45時間/日となり、1.8xの改善につながります。また、OCIにより、ETIQMEDIAは、同様のハードウェア・リソースを使用して、市場の他のクラウドで実行される以前のテストと比較して、アルゴリズムでより大きなスループットを達成できるようになりました。


AIワークショップやトレーニングで無料のラーニング・リソースを利用して、Oracle AIの開発およびデプロイメント体験を最大限に活用していただけます。Oracle Cloud Infrastructureの機能の詳細は、GPUコンピュートおよびAIインフラストラクチャを参照してください。


詳細は、次のリンクを参照してください。

コメント

このブログの人気の投稿

Oracle RACによるメンテナンスのためのドレインとアプリケーション・コンティニュイティの仕組み (2023/11/01)

Oracle Cloud Infrastructure Secure Desktopsを発表: デスクトップ仮想化のためのOracleのクラウドネイティブ・サービス (2023/06/28)

Oracle Cloudのデータベースをオブジェクト・ストレージにバックアップする3つの方法 (2021/12/13)