Kubernetesを一緒に学ぶ: 自動スケーリング

Kubernetes では、現在のリソース要件に基づいてワークロードをスケーリングできます。これにより、クラスターはリソース需要の変化に対してより柔軟かつ効率的に反応できるようになります。

ワークロードをスケーリングする場合、ワークロードに使用できるリソースを増減したり、レプリカのサイズを変更したりできます。

最初の方法は水平スケーリングと呼ばれ、2 番目の方法は垂直スケーリングと呼ばれます。

水平スケーリング: アプリケーションの複数のインスタンスを実行する
垂直スケーリング: コンテナに割り当てられたCPUとメモリリソースのサイズを調整します

ワークロードをスケーリングする方法には手動と自動がありますが、自動方法が重視されます。

ワークロードを手動でスケーリングする

Kubernetes はワークロードの手動スケーリングをサポートしています。水平スケーリングは kubeclt CLI を使用して実行できます。垂直スケーリングには、パッチワークロードのリソース定義。

ワークロードを自動的にスケーリング

Kubernetes は、ワークロードの自動スケーリング、つまり自動水平スケーリングと自動垂直スケーリングもサポートしています。

Kubernetes での自動スケーリングとは、一連の Pod を管理するオブジェクトを自動的に更新することを指します。

ワークロードを水平に拡張する

Kubernetesでは、水平ポッドオートスケーラー (HPA) はワークロードを水平方向に自動的にスケーリングします。

これは Kubernetes API リソースおよびコントローラーとして実装され、CPU やメモリ使用量などの観測されたリソース使用率に合わせてレプリカの数を定期的に調整します。

HPAワークフロー

ＨＰＡ

ワークロードを垂直に拡張する

機能ステータス: Kubernetes v1.25 [安定版]

Kubernetesでは、垂直ポッドオートスケーラー (VPA) ワークロードの自動垂直スケーリング。しかし、HPA とは異なり、VPA はデフォルトで Kubernetes に付属しておらず、別のプロジェクトです。

 VPA项目地址https://github.com/kubernetes/autoscaler/tree/9f87b78df0f1d6e142234bb32e8acbd71295585a/vertical-pod-autoscaler。

インストールが完了すると、管理対象レプリカのリソースをいつどのようにスケーリングするかを定義する CustomResourceDefinitions (CRD) を作成できます。

注: HPA が適切に動作するには、クラスターに Metrics Server をインストールする必要があります。

VPA ワークフロー:

ＶＰＡ

現在、VPA は次の 4 つのモードで動作できます。

モデル	説明する
オート	現在、再作成を使用していますが、将来的にはインプレース更新に変更される可能性があります。
再現する	VPA は、ポッドの作成時にリソース要求を割り当て、要求されたリソースが新しい推奨事項と大幅に異なる場合は既存のポッドを 1 つずつ更新します。つまり、ポッドを再構築してリソースを更新します。
イニシャル	VPA は、ポッドの作成時にのみリソース要求を割り当て、その後は変更しません。
オフ	VPA は Pod のリソース要件を自動的に変更しません。

インプレースサイズ変更の制限

機能ステータス: Kubernetes v1.27 [アルファ]

再起動せずにポッドとコンテナのワークロードのサイズを変更するには、現在、Kubernetes バージョン 1.27 以降が必要です。
さらに、機能ゲート「InPlaceVerticalScaling」を有効にする必要があります。

クラスターサイズに基づく自動スケーリング

クラスターのサイズ (またはその他のシステムコンポーネントなど) に基づいてスケーリングする必要があるワークロードの場合は、Cluster Proportional Autoscaler (CPA) を使用できます。

VPA と同様に、CPA は Kubernetes コアの一部ではありませんが、GitHub に独自のプロジェクトがあります。

 CPA项目地址https://github.com/kubernetes-sigs/cluster-proportional-autoscaler。

クラスター比例オートスケーラーは、スケジュール可能なノードとコアの数を監視し、それに応じてターゲットワークロードのレプリカの数をスケーリングします。

レプリカの数を一定に保つ必要がある場合は、クラスター比例垂直オートスケーラーを使用して、クラスターのサイズに基づいてワークロードを垂直にスケーリングできます。プロジェクトは現在テスト段階にあります。

クラスター比例オートスケーラーはワークロードのレプリカの数をスケーリングしますが、クラスター比例垂直オートスケーラーは、クラスター内のノードまたはコアの数に基づいてワークロード (デプロイメントや DaemonSet など) のリソース要求を調整します。

イベント駆動型自動スケーリング

また、イベントに基づいてワークロードをスケールすることもできます。 Kubernetes イベント駆動型オートスケーラー (KEDA)。

ケダ

KEDA は、DevOps、SRE、および Ops チームが外部イベントまたはトリガーに基づいて Pod を水平方向にスケーリングするために使用する、軽量のオープンソース Kubernetes イベント駆動型オートスケーラーです。 KEDA は、CPU やメモリなどの標準リソースメトリックに依存するネイティブ Kubernetes 自動スケーリングソリューションの機能を拡張するのに役立ちます。 KEDA を Kubernetes クラスターにデプロイし、カスタムリソース定義 (CRD) を使用してポッドのスケーリングを管理できます。

KEDA は、キュー内のメッセージ数など、処理するイベント数に基づいてワークロードをスケーリングできる CNCF 卒業プロジェクトです。さまざまなイベントソースに合わせて、さまざまなアダプターを選択できます。