Oracle Management Agentを使用したオンプレミスのフル・スタック可観測性データの収集 (2024/04/22)

Oracle Management Agentを使用したオンプレミスのフル・スタック可観測性データの収集 (2024/04/22)

https://blogs.oracle.com/observability/post/collecting-onpremises-full-stack-observability-data-using-management-agent

投稿者: Sandeep Kumar | Principal Product Manager

Piyush Modi | Director, Software Engineering


Oracle Management Agentは、環境をまたがる多様なソースからのフル・スタック可観測性データの汎用性とセキュアな収集をサポートします。これは複数のプラットフォームをサポートするように設計されており、Linux、Windows、AIX、Solaris、MACOSなど、すべてのオペレーティング・システムに様々なインストール・パッケージとともにインストールできます。エージェントはオンプレミス仮想マシンまたはポッドにデプロイされ、データをOCIに安全に送信します。1つ以上のOCI可観測性サービスのかわりに、様々なタイプの可観測性データのスケジュール済またはオンデマンドの収集を実行できます。その拡張可能なアーキテクチャにより、異なるサービス・プラグインから新しいコレクションをデプロイできます。


管理エージェントを介したデータ転送は、OCI Identityの認証および認可によって高度に保護され、強化されています。管理エージェントからOCIへの通信は、エージェントからのみ開始できます。



Oracle Management Agentのデータソースおよび収集方法


Oracle Management Agentは、すべてのインフラストラクチャおよびアプリケーションの可観測性データが確実に収集されるように、豊富なソースおよび取込み方法をサポートしています。次の範囲の取り込みメソッドでは、PrometheusのスクラップやKubernetes APIなど、動的にリアルタイムで収集されます。様々なタイプのコレクションは、管理エージェント機能の汎用性を示します。これにより、アプリケーションとインフラストラクチャ・リソースがデータの送信を継続できるようになり、必要なアクションが中断なくビジネスを運営できるようになります。


図1: データ・ソースと収集方法



Oracle Management Agentがオンプレミス・デプロイメントに適している理由


管理エージェントは、環境の可用性、パフォーマンスおよびセキュリティを確保すると同時に、運用効率を向上させ、管理オーバーヘッドを削減する上で重要な役割を果たします。複数のインフラストラクチャおよびアプリケーション・リソースを監視および管理するための包括的な機能セットを提供します。


オンプレミス環境にデプロイされたOracle Management Agentの主な機能を次に示します。


  • 包括的な収集: 管理エージェントは、Prometheus、JMX、JDBC、REST、O/Sコマンド、O/Sファイル、SQLなどのオープンで標準的な手法を使用して、オンプレミス・リソースの最も包括的なデータ収集を提供します。同じホスト上の複数のソースからデータを収集するか、単一のエージェントを使用してリモートでデータを収集します。1つのエージェントをデプロイして、ホスト自体に様々なタイプのデータを収集できます。これにより、エージェント・フットプリントが削減され、ホストにデプロイされた単一のエージェントを使用してデータをリモートで収集できます。
  • 複数のエンティティのホスト上の収集: エージェントを複数のホストにデプロイし、OCIおよび可観測性および管理サービスのかわりにマルチソース・データを収集できます。大量および高頻度の収集が必要な場合に、複数のエンティティからデータを収集するのに役立ちます。これにより、ホスト上のエージェント・フットプリントが削減され、ファイルからのログの最も広いコレクション・セットに適しています。


図2: 複数のエンティティからのホスト上のデータ収集




  • 複数のターゲットからのリモート・コレクション: この方法は、「ホスト要件にエージェントが不要」で十分であり、複数のエンティティから広範囲の可観測性データをリモートで収集できます。単一エージェントは、100のエンティティからリモートでデータを収集できます。収集のタイプには、SQLベースのメトリックとログ収集、RESTエンドポイント、Syslogベースのログ収集、Prometheusの廃棄が含まれます。


図3: 複数のターゲットからのリモートデータ収集




  • 集中管理: 他の監視ソリューションとは異なり、管理エージェントは、アプリケーションおよびハードウェア・コンポーネントを管理するための集中管理ポイントを提供します。これにより、すべてのインフラストラクチャの管理オーバーヘッドを削減し、メンテナンスのブラックアウトとダウンタイムを短縮することで、監視プラットフォームを強化できます。管理者は、単一のコンソールから複数のインスタンス、データベースおよびホストを監視および管理できます。
  • コミュニケーションの姿勢とセキュリティ: オンプレミスの導入により、組織はインフラストラクチャとデータのセキュリティを完全に制御できます。管理エージェントは、OCI Identityの認証および認可を利用したセキュアなデータ転送を提供します。すべての通信は、OCIがエージェントへの収集通信を開始することはなく、エージェントはOCIとの通信のみを開始できる企業セキュリティと連携しています。


図4: 管理エージェントがOCIへの通信を開始




  • オンデマンド収集: オンデマンド収集タスクをキックオフし、わずか1分でデータを受信します。リアルタイム監視の効率とスケーラビリティの向上をサポートします。
  • バッチ・ログ・アップロード: 管理エージェントは、高い回復性とスケーラビリティを備えたバッチ・ログ・アップロードを可能にする管理ゲートウェイでサポートされています。これは、特に帯域幅が制限された環境でのネットワーク帯域幅の使用率の最適化に役立ちます。
  • エージェントのライフサイクルとダッシュボード: すべてのエージェントの可用性と健全性ステータスを備えた直感的なUI。概要ダッシュボードには、エージェント・アクティビティに関するアラームとインサイトが表示されます。


図5: エージェントの概要ダッシュボード




  • 自動アップグレード: 管理エージェントは、すべてのエージェントの自動アップグレードを処理する自動アップグレード機能をサポートしています。このオプトイン機能は、エージェントを最新バージョンに保ち、パフォーマンスとセキュリティの最適な強化をより効果的に実現します。
  • Prometheusメトリック・スクレイピング: 管理エージェントは、Prometheus形式でメトリック・データを公開するインフラストラクチャ・コンポーネントからメトリック・データを収集します。


全体的に、管理エージェントは、オンプレミス環境のニーズを満たすように特別に設計された堅牢な機能と利点のセットを提供し、完全な制御と柔軟性を維持しながら、Oracleインフラストラクチャを効果的に監視、管理および保護できるようにします。管理エージェントの利点のいくつかは、オンプレミス環境を監視するためのOracleインフラストラクチャとコスト最適化を効率的に管理するというニーズと課題に合せて調整されています。




Oracle Management Agentの利点


  • 高可用性: 管理エージェントはシステム・デーモンとして実行され、システムはエージェントの実行を維持します。管理エージェント・ゲートウェイの高可用性機能では、多様なソースから大量のデータを処理できる自己回復性のあるデータ取込みメカニズムを採用しています。データ・バッファリングと再試行機能により、ネットワークの中断や一時的な障害が発生した場合でも、データの取り込みを保証できます。これは、複数のADを介した冗長インフラストラクチャとフォルト・トレラント・アーキテクチャを利用して、ダウンタイムを最小限に抑えるように設計されています。
  • コスト最適化: ネットワーク帯域幅を効率的に使用すると、特にデータ転送ボリュームに基づいてネットワーク使用量が測定または請求されるシナリオで、コストを削減できます。バッチ機能を使用すると、管理エージェントは、エージェント自体とターゲットOCIサービスの両方で、リソース使用率を最適化できます。大きいバッチでログを処理することで、エージェントはCPU、メモリー、ディスクI/Oなどのシステム・リソースを効率的に使用して、ネットワーク・トラフィックを削減し、OCIへの弾力性と効率的なアップロードを実現できます。
  • 一括エージェント・デプロイメント: 管理エージェントは、大規模な環境モニタリング・ニーズに応じてエージェントの一括デプロイメントを自動化します。


これで、モニタリング・ニーズのために他のOCI Observability and Managementサービスにオンボーディングすることで、管理エージェントを介した統合設計とセキュアなデータ収集を利用できます。また、Prometheusベースのコレクションを使用して有効にすることもできます。詳細は、OCIのドキュメントを参照してください。


オンプレミス環境では、監視データへの安全なアクセスとともに、安全で効率的なデータ転送が不可欠です。上級ユーザーは、管理エージェントおよびゲートウェイのデプロイメント・アーキテクチャの図を参照して、データをエンドツーエンドで安全に送信できます。詳細は、リファレンス・アーキテクチャを参照してください。


図6: 管理エージェントとゲートウェイのアーキテクチャ



リソース



コメント

このブログの人気の投稿

Oracle RACによるメンテナンスのためのドレインとアプリケーション・コンティニュイティの仕組み (2023/11/01)

Oracle Cloud Infrastructure Secure Desktopsを発表: デスクトップ仮想化のためのOracleのクラウドネイティブ・サービス (2023/06/28)

Oracle Cloudのデータベースをオブジェクト・ストレージにバックアップする3つの方法 (2021/12/13)