OCI Kubernetes Engine (OKE)がコンピュート・ホスト・グループのサポートを追加し、管理対象ノードにクイック・リサイクルを追加 (2026/06/19)

OCI Kubernetes Engine (OKE)がコンピュート・ホスト・グループのサポートを追加し、管理対象ノードにクイック・リサイクルを追加 (2026/06/19)

https://blogs.oracle.com/cloud-infrastructure/oci-kubernetes-engine-host-groups-quick-recycle

投稿者:Mickey Boxell | Senior Principal Product Manager

Oracle Cloud Infrastructure Kubernetes Engine (OKE)は、マネージドノードプール用のOCI Compute ホストグループを サポートするようになりました。これには、ホストの利用不能時間を最小限に抑えるために、これらのインスタンスを迅速にリサイクルする機能も含まれます。 

顧客は、 Kubernetes クラスター内のワーカー ノードを終了して交換し、健全性の問題に対処したり、アップデートを適用したりすることが一般的です。たとえば、GPU アクセラレータを必要とする AI/ML ワークロードで使用されているような、ベアメタル シェイプをバックとするワーカー ノードを使用している顧客の場合、インスタンスがクリーンで健全、コンプライアンスに準拠し、安全であることを確認するプロセスのため、ノードの終了と交換に時間がかかる場合があります。専用キャパシティを持つ顧客向けに、OCI Compute はインスタンスの「クイック リサイクル」機能をサポートしています。これにより、標準の OCI ホスト プロビジョニング プロセスをスキップして、インスタンス終了後すぐにホストを再利用可能にすることができます。

OKE マネージドワーカーノード配置構成ワークフローでホストグループを有効にする

ワーカーノードの終了と交換

Kubernetes環境では、インスタンスはノードプールのスケーリング、アップデートの適用、異常ノードの復旧、イメージの更新など、日常的な操作の一環として頻繁に終了され、置き換えられます。終了したワーカーノードをより迅速に置き換えることができれば、クラスターはより早く容量を回復し、ワークロードを本来の状態に戻すことができます。

例えば、AI/MLワークロードでGPUインスタンスを使用してモデルトレーニングのパフォーマンスを最大化しているなど、ベアメタル構成を使用している顧客も、ノードのアップデートを適用したり、健全性の問題に対処したりする必要があります。しかし、これまでは、ベアメタルインスタンスを消去し、物理的に修復し、再起動のためにプールに移動するのに時間がかかるため、新しいインスタンスを再起動するまでに長いリサイクル時間が必要でした。 

クイックリサイクル

インスタンスを迅速に終了して置き換える機能は、ワーカーノードの交換時間が重要な大規模でパフォーマンス重視のワークロードやインフラストラクチャ集約型のワークロードを実行している顧客にとって特に価値があります。クイックリサイクルは、ダウンタイムの短縮に役立ちます。クイックリサイクルは、コンピュートホストグループの機能であり、ホスト上のワーカーノードインスタンスが終了した後、ホストをより迅速に再利用可能にすることができます。OKEの場合、これは、管理対象のワーカーノードインスタンスが終了した際に、コンピュートホストグループの構成に応じて、基盤となるホストをより早く代替のワーカーノードインスタンスに使用できるようになることを意味します。

クイックリサイクルは、ホストを再利用するために返却する前に、標準の OCI ホストプロビジョニングプロセスをスキップすることで機能します。これにより、インスタンスの終了後にホストが利用できなくなる時間を最小限に抑えることができます。ただし、標準のホストプロビジョニングプロセスが存在するのには理由があります。それは、ホストがクリーンで、健全で、コンプライアンスに準拠し、安全であることを保証するためです。そのため、クイックリサイクルは、専用容量でのみ使用することをお勧めします。専用容量とは、事前に料金を支払うことで、一定量のコンピューティング容量を専用で予約するものです。共有されているホストや本番環境で使用されるホストは、完全なリサイクルを実行する必要があります。

従来、OKE マネージド ノード プールは、迅速なリサイクルに必要なホスト グループでのインスタンス起動をサポートしていなかったため、顧客は ホスト グループを活用するために自己管理ワーカー ノードを使用するしかありませんでした 。この方法ではインスタンスを迅速にリサイクルできましたが、不要な管理オーバーヘッドが発生しました。顧客は、OKE マネージド ノード プールが提供するネイティブなメリットを享受することなく、イメージのアップグレード、ブートストラップ、スケーリングなど、すべてのノード ライフサイクル タスクを手動で管理する必要がありました。このオプションは、ワーカー ノードのライフサイクルを詳細に制御したいチームにとっては依然として有用です。しかし、多くの顧客は、マネージド ノード プールが提供する運用上の簡便性も求めています。 

マネージドノードホストグループのサポート

OKE でノード プールを作成する際、ワーカー ノードをホストするコンピューティング インスタンスの容量タイプを選択します。オンデマンド容量は、使用したコンピューティング 容量に対して料金を支払うデフォルトです。予約容量を使用すると、将来の使用のために容量を予約できるため、インスタンスを作成する必要があるときにコンピューティング 容量が利用可能であることを保証できます。プリエンプティブ容量は、中断を許容できるワークロードに対して低コストのオプションを提供します。コンピューティング ホスト グループのサポートにより、OKE はマネージド ノード プールにもう 1 つの重要な配置オプションを追加します。マネージド ノード プールにホスト グループのサポートを追加することで、顧客は、ノード プールのスケーリング、ワーカー ノードの交換、アップグレード、ライフサイクル オペレーションなどのマネージド ノード機能のメリットを享受できるだけでなく、インスタンスを迅速にリサイクルできるというメリットも享受できます。 

ノードのサイクリングおよびノー​​ドの削除APIによるノードの終了と置換といった既存の機能と同様に、クイックリサイクルでは、Kubernetesの可用性に関するベストプラクティスに準拠し、ノードが強制的に停止され、リソースが枯渇するまでの猶予期間(エビクショングレース期間)を設定するオプションが提供されます。このオプションは、 ワークロードに設定されているPodの中断予算を尊重し 、ノードに対してアクションが実行される時点でPodがまだ実行されている場合に発生する可能性のある中断を回避します。エビクショングレース期間の終了までにPodが強制的に停止されなかった場合、操作をキャンセルするか、アクションを続行するかを選択できます。

前提条件と開始方法

OKE で管理されるノード プールでコンピュート ホスト グループを使用する前に、いくつかの前提条件があります。まず、Compute サービスでコンピュート ホスト グループを作成して構成し、ライフサイクル ステートが ACTIVE であることを確認してください。コンピュート ホスト グループは、ノード プールの配置構成と同じ可用性ドメインにある必要があり、ノード プールの形状はコンピュート ホスト グループの形状と一致している必要があります。クイック リサイクルを行うには、クイック リサイクルをサポートする形状を使用し、OKE でホスト グループを選択する前に、Compute サービスでホスト グループのリサイクル レベルを構成してください。また、Kubernetes Engine が管理対象のワーカー ノード インスタンスを起動する際にコンピュート ホスト グループを使用できるように、必要な IAM ポリシーも必要です。

これらの要件を満たしたら、OKE ノード プール配置構成でホスト グループを選択します。OKE が管理対象のワーカー ノード インスタンスを起動すると、Compute サービスは選択したホスト グループ内のホストにそれらのインスタンスを配置します。配置構成の Compute ホスト グループを変更すると、その変更は新しいワーカー ノード インスタンスに影響することに注意してください。既存のワーカー ノードは自動的に移動されません。更新された Compute ホスト グループを既存のノードに使用するには、それらのワーカー ノード インスタンスを終了して置き換え、Compute サービスが更新されたグループ内のホストに置き換えられるようにするか、ノード プール配置構成エントリのいずれのホスト グループとも一致しないホスト グループを持つワーカー ノード インスタンスを、破壊的なノード プール サイクリングを使用して置き換えます。

ホストグループIDが設定されたノードプールの詳細ページ

まとめ

Kubernetes クラスターでベアメタルインスタンス群を運用するチームにとって、コンピューティング ホスト グループ向けのマネージド ノード サポートと迅速なリサイクル機能は、OKE のお客様が OCI 上で回復力が高く高性能な Kubernetes プラットフォームを構築するための新たなツールとなります。これにより、チームは容量をより迅速に回復し、ホスト配置をより正確に制御し、本番環境で OKE を簡単に運用できるマネージド ノード操作を引き続き利用できます。ホスト配置の精度とマネージド ノードの利便性のどちらかを選択するのではなく、両方を活用できます。

もっと詳しく知る

コメント

このブログの人気の投稿

Oracle Database 19cサポート・タイムラインの重要な更新 (2024/11/20)

ミリ秒の問題: BCCグループとOCIが市場データ・パフォーマンスを再定義する方法(AWSに対するベンチマークを使用) (2025/11/13)

Oracle Enterprise Manager 24aiの概要 (2024/12/18)