大規模なOracle Databaseフリートを管理するための可観測性と管理サービス (2023/12/22)
大規模なOracle Databaseフリートを管理するための可観測性と管理サービス (2023/12/22)
https://blogs.oracle.com/observability/post/large-oracle-database-fleet-management
投稿者:Erika Sciunzi | Principal Domain Specialist Cloud Engineer - Data Management
Sriram Vrinda | Director of Product Management
可観測性戦略を実装するには、メトリック、ログ、イベント、トレースなどのIT環境データを収集する必要があります。優れた堅実な可観測性とは、データとアセットを賢く使用して、停止、リソースの過剰な使用、またはアプリケーションのパフォーマンス低下を発生前に簡単に予測できることを意味します。
分散環境ではプロアクティブである必要があり、リソースの節約は予算と直接相関しています。OCI Observability & Management(O&M)は、DBAとITマネージャーの両方で日々の活動を容易にするための戦略を提供します。DBAは、ボタンをクリックするだけで、PDBのプロビジョニング、接続/切断、およびテスト環境と開発環境の作成ができる必要があります。ITマネージャは、現在のリソース使用率およびトレンド分析に基づいて予算の予測を提供できる必要があります。
O&Mサービスは、インタラクションを最適化するための単一画面のオプションを提供することで、チームと部門間のコミュニケーションを改善します。また、それぞれのコストを関連付けることで、必要なリソースが明確になります。基本的なモニタリング・ツールとは異なり、O&Mソリューションは、リソース使用率を予測し、リソースが停止するまでの日数を顧客に通知する機能を提供します。すべてのデータベースのCPU使用率の予測の例を次に示します。
図1: CPU使用率の予測
エンジニアド・システム環境では、イベントとデータを類似度でクラスタリングし、クリティカル・パターンを識別し、トレンドを比較してエラー伝播を防止することで、停止を削減できます。
図2: エラー伝播を防ぐためのイベントとデータのクラスタリング
このブログでは、O&Mのニーズ(特にデータベース環境)に対して、様々なOracleツールとサービスを活用する方法について説明します。
一般的なデータベース環境によるO&Mツールの活用
オンプレミス/ハイブリッドの可観測性
ハイブリッド・シナリオでは、一部のデータベースはオンプレミスで、一部はOCIです。
図3: ハイブリッド・シナリオの例
オンプレミス・データベースおよびクラウド・データベースを使用するハイブリッド環境では、Enterprise Manager (EM)は次の理由から最適なソリューションです。
- EMはオンプレミスであるため、ターゲットの検出が容易になります。
- EMには、データベース・ターゲットを監視および管理するための豊富なインタフェースがあります。
- EMトポロジを最初から検出せずに、EMトポロジを利用できます。これらはエンタープライズ・マネージャのログですでに検出されています。
OCI Operations Insightsおよび次のようなLogging Analyticsサービス機能を使用してEMを拡張することで、可観測性プラットフォームをエンリッチすることを検討してください。
- 予算割当のリソース使用予測
- チャージバックの部門/チーム別稼働率トレンド
- リソース使用率制限早期警告
- SQLの低下分析
- 根本原因分析のデータベース・アラートおよびトレース・ログ管理
OCI Compute VMにEMをデプロイし、OCI Marketplaceで提供されるフル・スタックを使用することを選択します。オンプレミスEMと同様に、OMSおよびリポジトリのメンテナンスは制御下にあります。
ExaCCの可観測性
次の例のように、すべてデータ・センターにあります。
図4: オンプレミスの例
このシナリオでは、データベース管理はデータベース・レイヤーに制限されます。ただし、EM機能は、OCI Operations Insights、Exadata Insights、およびLogging Analyticsサービスで強化できるため、次の利点があります。
- 予算割当のリソース使用予測
- チャージバックのVMクラスタ/デパートメント/チーム別使用率トレンド
- リソース使用率制限早期警告
- SQLの低下分析
- 根本原因分析のデータベース・アラートおよびトレース・ログの管理(アプリケーション・ログのインポートの提案)
OCI ExaCS/DBCSの可観測性
この場合、すべてがOCIで実行されます。
図5: OCI ExaCS/DBCSの可観測性
ネイティブOCIサービスを使用して、EMコンポーネントのメンテナンスを節約します。
データベース管理やオペレーション・インサイトなどのネイティブOCIサービスは、OCIベースのOracle Databaseのエージェントレス(エージェントなしで作成)です。Logging Analyticsサービスは、セキュリティ上の理由から管理エージェントとともに使用でき、事前定義済のログ・ソースに加えて、データベース表から任意のファイルまたはデータを取り込むことができます。
プロビジョニングおよびデータベース・リソース管理
プロビジョニングには、リソースの作成、終了、定義、割当て、およびデータベースの作成と使用を可能にするその他のすべてのアクティビティが含まれます。これには、様々なチームがリソースを共有する場合のリソース制限の設定も含まれます。プロビジョニング・ニーズに使用される様々なソリューションを次に示します。
Service/Product Name |
Target |
Description |
More resources |
Enterprise Manager Cloud Management Pack |
On-premises, Autonomous, DBCS, ExaCS, ExaCC |
Cloud Management Pack for Oracle Database delivers capabilities spanning the entire database lifecycle. Cloud administrators can set up the Self-Service Portal to identify pooled resources, configure role-based access, define service catalogs, and configure chargeback plans |
|
OCI DBaaS/Exa service console |
Autonomous, DBCS, ExaCS, ExaCC |
Is it possible to use OCI DBaaS/Exa service console to provision the Oracle database in OCI |
|
OCI Resource Manager |
Autonomous, DBCS, ExaCS, ExaCC |
Resource Manager is an Oracle Cloud Infrastructure service that allows you to automate the process of provisioning your Oracle Cloud Infrastructure resources. Using Terraform, Resource Manager allows installing, configuring, and managing resources through the “infrastructure-as-code” model. |
リアルタイム監視
リアルタイム監視とは、システム、プロセスまたはイベントに関する最新データを継続的に提供することを意味します。このような監視は、ゼロまたは低レイテンシで情報のストリーミングを提供し、データの収集と分析の間には最小限の遅延があります。これにより、異常、パフォーマンスの問題およびクリティカル・イベントを迅速に検出できます。
Oracleでは、リアルタイム監視のために次の製品/サービスを提供しています。
Service/Product Name |
Target |
Description |
Additional resources |
Monitoring |
Autonomous, DBCS, ExaCS, ExaCC |
OCI Monitor collects PaaS/IaaS OCI services metrics. Is enabled by default for all the OCI services |
|
OCI DBaaS/Exa service console |
Autonomous, DBCS, ExaCS, ExaCC |
Service Console offers a list of graphs and basic information about critical metrics like CPU, Memory, and Storage |
OCI DBaaS/Exa service console for DBCS and EXACS ExaCC Resource Usage Tracking |
Enterprise Manager - ADDM |
On-premises, Autonomous, DBCS, ExaCS, ExaCC |
Custom-managed solution, on-premises or in OCI. It is usually used for diagnostic and admin but it also provides real-time metrics |
|
OCI Database Management (opt to Enterprise Manager) |
On-premises, DBCS, ExaCS |
OCI managed service, provides complete monitoring, management, and performance tuning of databases across the hybrid fleet |
|
Stack Monitoring |
On-premises, Autonomous, DBCS |
Stack Monitoring lets you proactively monitor an application and its underlying tech stack, including application servers, databases and hosts. Extend monitoring by creating custom metrics with Metric Extensions. |
Stack Monitoring for Oracle Database
|
OCI Logging Analytics |
On-premises, Autonomous, DBCS |
It is possible to create metrics based on the alert and trace logs. OCI Logging analytics offers a list of predefined Label based on the alert and trace message |
Enhancing OCI metrics and creating Alerts using Logging Analytics
|
Third-Party Tools - Service Connector Hub |
Autonomous, DBCS, ExaCS, ExaCC |
OCI offers full O&M capabilities but in the case the customers want to use their tools allows high integration using Service Connect Hub |
データベース・システムを評価するためのパフォーマンスおよびチューニング・ソリューション
パフォーマンス診断およびチューニングは、どのIT環境でも重要です。データベース・システムの場合、このアクティビティはプロアクティブまたはリアクティブになります。たとえば、増加したワークロードへの対応は、停止が発生する可能性があるため、サブシステムをチューニングするために重要です。パフォーマンス・チューニングは、システム・リソース・レベル(CPU/メモリー/ストレージ使用率)またはSQL文のレスポンス時間のように高いレベルで行うことができます。ボトルネックを正しく識別するには、情報を分析および関連付けておくことが重要です。パフォーマンスの評価およびチューニングに役立つOracleソリューションを次に示します。
Service/Product Name |
Target |
Description |
Additional resources |
Enterprise Manager - Diagnostic and Tuning Pack |
On-premises, Autonomous, DBCS, ExaCS, ExaCC |
Custom managed solution is enabled at DB level, on-premises, or in OCI. It provides functionalities like Tuning Advisor or TopSqlStatment detection |
|
OCI Database Management - PerfHub (opt to Enterprise Manager) |
On-premises, Autonomous, DBCS, ExaCS |
OCI managed service, offers the same Performance and Tuning capabilities offered by Enterprise Manager Performance and Tuning Pack but in a completed managed solution |
|
Operation Insights SQL Insights and Capacity Planning |
On-Premises, Autonomous, DBCS, ExaCS, ExaCC by Enterprise Manager |
OCI Operations Insights allows tracking of metrics charts and data collection. It allows the correlation of resources from different infrastructure layers. It allows us to predict resources high utilization |
データベース・フリート管理ソリューション
データベース管理者は、会社のデータベースの管理とメンテナンスを担当します。その職務には、データ管理ポリシーの遵守を維持し、これらの重要な機器が機能していることを確認することが含まれます。アクティビティには、インスタンスの起動と停止、データベースのバックアップとリストア、キー管理、および固定ストレージ・レベルまでのリソース割当てが含まれます。
次のOracleツールおよびソリューションは、データベース・フリート管理者の鍵です。
Service/Product Name |
Target |
Description |
Additional resources |
Enterprise Manager |
On-premises, Autonomous, DBCS, ExaCS, ExaCC |
Custom-managed solution on-premises or in OCI. It provides administration tools from the database to the infrastructure level |
|
OCI Database Management(opt to Enterprise Manager) |
On-premises, Autonomous, DBCS, ExaCS |
OCI managed service; it offers a comprehensive list of administrative capabilities and new ones are being introduced in an agile manner. |
|
OCI DBaaS/Exa service console |
Autonomous, DBCS, ExaCS, ExaCC |
OCI DBaaS/Exa service console is embedded in all Cloud PaaS services. It allows basic task list start/stop/terminate instances, backup and restore connection and wallet |
データベース・フリートへの安全なパッチ適用
パッチ適用は、製品ライフサイクルの重要なステージの1つです。これにより、ソフトウェア製品をバグ修正で更新しておくことができます。Oracleは、セキュアでバグのないスタックを維持するために、いくつかのタイプのパッチを定期的にリリースします。OCIは簡素化していますが、パッチ適用は複雑で時間がかかり、ダウンタイムが発生する可能性があるため、ライフサイクルの困難なフェーズとなっています。これらのOracleツール/サービスは、リスクを軽減し、データベース管理者がデータベース・フリートに安全にパッチを適用できるようにします。
Service/Product Name |
Target |
Description |
Additional resources |
Enterprise Manager Lifecycle Management Pack |
On-premises, Autonomous, DBCS, ExaCS, ExaCC |
Database Lifecycle Management Pack supports the entire Patch Management Lifecycle including, patch advisories, pre-deployment analysis, rollout, and reporting. It is linked with My Oracle Support to provide a synchronized view of available and recommended patches. It manages drift and version comparison |
|
OCI DBaaS/Exa service console |
Autonomous, DBCS, ExaCS, ExaCC |
It is possible to use the OCI DBaaS/Exa service console to patch OCI databases and other OCI services |
コスト管理とチャージバックにより、ITサービスを可視化
原価管理は、利益を増やすために事業費を特定および削減する手法であり、予算編成プロセスから開始します。原価管理は、収益性の維持と向上において重要な要素です。ITチャージバックは、ITサービスのコストとインフラストラクチャの使用状況の可視性を高めることができるため、組織はコスト最適化の機会を特定し、無駄な支出を削減できます。コスト管理とチャージバックは、クラウドまたは新しいFinOpsチャレンジを採用する企業にとって重要なトピックです。このシナリオでは、消費の削減はビジネスに直接接続されます。
Service/Product Name |
Target |
Description |
Additional resources |
Enterprise Manager Chargeback |
On-premises, Autonomous, DBCS, ExaCS, ExaCC |
Custom-managed solution on-premises or in OCI. It offers a deep drill-down and metric correlation |
|
Operations Insights Capacity Planning |
On-Premises, Autonomous, DBCS, ExaCS, ExaCC (by Enterprise Manager) |
OCI managed service, allows to predict the resource consumption for one year. Using tagging and other grouping built-in functionality, it is possible to associate the forecast and consumption to specific departments, users, applications, and/or VM clusters. |
|
Cost Analysis |
Autonomous, DBCS, ExaCS, ExaCC |
Cost Analysis is an easy-to-use visualization tool to help you track and optimize your Oracle Cloud Infrastructure spending. It allows to generation of charts and download of accurate, reliable tabular reports of aggregated cost data. Using tagging is also possible to associate the forecast and the consumption to a specific VM Cluster or DBCS (no DB or PDB visibility) |
根本原因を特定し、停止を防止するためのトラブルシューティング
データベースの問題は、いくつかのレベルで発生する可能性があります。問題の根本原因を特定するには、リソースの関連付け、問題へのドリルダウン、およびシステムの傾向の分析ができることが重要です。根本的な原因はアプリケーションである可能性があるため、この情報を可視化することも重要です。トラブルシューティングは、エラー伝播を回避するためにも役立ちます。そのため、問題をできるだけ早く認識することが重要です。
これらすべてのOracleツールは、停止のトラブルシューティングと防止に重要です。
Service/Product Name |
Target |
Description |
Additional resources |
Enterprise Manager |
On-premises, Autonomous, DBCS, ExaCS, ExaCC |
Custom-managed solution on-premises or in OCI. It offers a deep drill down and metric correlation. For example, it allows retrieving the Top SQL statement or the blocking session. It is possible to see and manage tablespace and data files, users, and DB parameters. Enterprise manager allow to drill down from the database until the physical host or the user domain (it depends on which system are you monitoring). |
|
OCI Database Management (opt to Enterprise Manager) |
On-premises, Autonomous, DBCS, ExaCS |
OCI managed service, allows us to drill down and correlate metrics and data from different layers. There is built-in integration to other O&M services (ex. Operations Insights). For example, it is possible to compare SQL Statement response time with the baseline to check whether there has been a performance degradation. |
|
Logging Analytics |
On-premises, Autonomous, DBCS, ExaCS, ExaCC |
OCI Logging analytics can handle log events generated by all software applications and infrastructure on the Cloud or on-premises. For Databases log messages severity is pre-classified based on Oracle expert experience. It is possible to set alerts for critical events to be proactive in case of issues. For example 1407 labels are defined for DB Audit logs, DB 767 labels for Audit (db tbl), 124 labels for DB Alert, 43 labels for DB Trace etc… |
|
Operations Insights |
On-Premises, Autonomous, DBCS, ExaCS, ExaCC by Enterprise Manager |
OCI Operations Insights allows tracking down metrics charts and data collection. It allows correlating resources from different infrastructure layers. It is possible to set an early warning alert to know days in advance if systems are running out of resources. That prevents outages. |
Oracleには、大規模なデータベース・フリートを管理および監視するためのツールがいくつか用意されています。OCIで提供される予測やパターン識別などの診断ツールを使用して、O&M機能でEMを拡張することが重要です。詳細を確認し、Oracle Cloudでハンズオン・ラボ・アクティビティを無料で実行するには、Oracle Cloud Free Tierアカウントを使用します。
リソース:
- Integrating Enterprise Manager with OCI Services
- Oracle Enterprise Manager Cloud Control for Oracle Exadata Cloud
- Enterprise Manager
- Observability & Management
- Oracle Observability and Management blogs
- Oracle named a leader in hybrid cloud management
- Day One and Beyond: Introduction to Observability & Management video
コメント
コメントを投稿