Redraft: OCI Monitoring JDEへの移行によるジャーニー (2025/06/24)
Redraft: OCI Monitoring JDEへの移行によるジャーニー (2025/06/24)
投稿者: Mahesh Sharma | Consulting Member of Technical Staff
投稿者: Redfaire Ltd、クラウド・インフラストラクチャ・マネージャー、Julian Cox
2023年初頭、OracleはRedfaireに、既存のOracle Management Cloud (OMC)に代わる新しい監視ソリューションであるObservability and Management (O&M)の計画について連絡しました。Oracleは、この新しいソリューションのリリースに関する詳細なタイムラインを提供しました。当時、RedfaireはOMCを使用して30以上のお客様のシステムを監視していました。
Oracleのサポートとガイダンスとしての明確な移行計画により、Redfaireはインストール・プロセスを文書化し、各顧客のO&Mを実装しました。O&Mが実装されている間、RedfaireはOMCの監視を継続することが不可欠でした。Oracleは、このことが可能であることを確認し、両方のシステムが相互に連携して動作できるようにすることで、移行中の顧客のシステムを可視化しました。このシームレスな配置により、Redfaireはフルディスクや高いCPUイベントなどの問題を解決でき、サービス中断は発生しません。
O&Mモニタリングの実装計画は、各顧客のJD Edwardsシステムのニーズに合せて4つのステージで構成されています。
OCIスタック・モニタリングおよびロギング・アナリティクスを使用した実装:
1. 標準メトリックのコレクション(Oracle提供)
2. アプリケーション・ログのコレクション
3.Redfaireによってコーディングされ、顧客のユース・ケースに固有のメトリック拡張のコレクション
O&M可用性の監視:
4. レスポンスおよびレスポンスのタイミングをヘルス・チェックとしてチェックするためのURLのコール
最初の3つのステージでは、監視対象のサーバーにインストールされたOCI管理エージェントを使用します。第4段階の可用性監視では、JDEシステムのURLへのアクセスが必要です。Oracleが最初に提供した場所は、Redfaireのニーズに適していないか、実装が複雑すぎます。Oracleは、オプションを確認し、ソリューションでRedfaireに戻ることを約束しました。
いくつかのトレーニングの後、当社のRedfaire CNCチームは、管理エージェントの設置プロセスを実施しました。完了すると、ホスト、Webおよびデータベース・サーバー・メトリックのフローが開始されます。これにより、Redfaireは、各顧客の特定のシステム・ニーズに合わせて微調整されたO&Mアラーム定義を作成できるようになりました。これらのアラームは、メトリックに基づいてアラートを生成し、システムの停止が発生する前に問題をRedfaireに通知します。
図1: スタック・モニタリング: WebLogic管理サーバーのメトリックの例
RedfaireがエンタープライズおよびWebサーバーからJDEシステム・ログを収集するために使用するロギング分析には、適切な構成にさらに時間がかかりました。多数の構成オプションによって提供される柔軟性には、十分に理解するのに時間がかかりました。Redfaireは、実装のベストプラクティスを確立しました。当初は、特定のログ・エントリのアラートを開発しました。ただし、いくつかの重要なケースについてのみアラートを維持するようになりました。その他のログの問題は、調査が必要なが差し迫ったシステム停止を脅かさない関心のある項目であるダッシュボードに警告として表示されます。
OCI Logging Analyticsは、顧客のシステムのJDEログにすばやくアクセスするための優れたツールであるログ・エクスプローラを提供します。ログ・エクスプローラには、簡単なチェック・ボックスの選択により、既知の問題のログをフィルタリングできるツールが含まれています。検索は簡単で、サーバー、ログ・ソースまたは特定のログ・ファイルでフィルタするオプションとともに、選択した期間のすべてのログ・ファイルの行を返します。ログ・エントリのタイプごとにサマリーを生成し、類似したエントリをグループ化することもできます。これにより、反復的なログ・エントリ間で一意のログ・エントリを識別できます。これは本当に貴重な機能です。
4番目のステージである可用性モニタリングの実装は、Oracleがオンプレミス・バンテージ・ポイント(OPVP)を提供した後に可能になりました。顧客のテナンシにOPVPが作成されます。Redfaireでは、Redfaire Approval Connectなどのソリューションのステータスをチェックする可用性モニターを定義します。たとえば、OPVPは可用性モニターの詳細(URLを含む)を使用して、4つのRedfaire Approval Connectサービスのそれぞれのステータスを確認します。サービスが停止している場合、アラーム定義により、テクニカルスタッフによるフォローアップのためにサポートシステムにチケットが作成されます。
「カスタム・アラート処理コードでO&Mの重複除外機能を活用することで、当社のチームがアラートを管理する方法を変革しました。この統合により、アラート状態に基づいてチケットを作成、更新、または自動的にクローズするインテリジェント・チケット処理が可能になり、オープン・チケットが80%削減されました。「アクティブ・アラーム定義」ダッシュボードによって補完されたチームは、チケットのオーバーフローを管理するのではなく、重要なアクティブな問題に専念できるようになりました。クラウド・インフラストラクチャ・マネージャJulian Cox氏
図2: 2つのURLテストを示すOPVPモニタリングのAPM例
OMCからObservability and Managementへの移行には課題がありましたが、Oracleのサポートとフィードバックへの応答性(必要に応じて新しいソリューションを開発)のおかげで、Redfaireは可観測性と管理の実装に成功しました。
今日、Redfaireは、この新しい監視ソリューションのメリットを、お客様の構成ニーズに応じて微調整できる強力な立場にあります。Oracle Cloud Infrastructureソリューションに組み込まれているオラクルは、今後の課題の進化とサポートを継続できると確信しています。
リソース
- Redfaire,the leading Oracle JD Edwards & Oracle Cloud Partner
- Oracle Stack Monitoring
- Oracle Log Analytics
コメント
コメントを投稿