クラスターノードの弾性スケーリング

クラスターノードの弾性スケーリング

弾性スケーリングには主に 3 つの側面があります。

  • HPAは使用率に基づいてポッドの数を自動的に調整します
  • VPAは履歴データに基づいてポッドのリクエストと制限を自動的に設定します
  • CAは、使用状況に応じてノードの数を自動的に調整します

この記事では主にノードの拡張と削減の部分について説明します。

1. オートスケーラー

オートスケーラーは、Kubernetes コミュニティによって管理されているプロジェクトです。現在、オートスケーラー コンポーネントは、VPA と CA のスケーリング機能をすでに提供しています。 EKS、CCE、ACK、TKE などの主流メーカーはすべて、CA エラスティック拡張にこのコンポーネントに依存しています。公式データは見つかりませんでしたが、同僚と話したところ、CA 拡張が完了するまでに約 2 ~ 3 分かかると言われました。

1.1 VPAの垂直拡張

HPA と同様に、デプロイメント用に VPA オブジェクトを作成する必要があります。

 apiVersion :自動スケーリング.k8s .io / v1
種類: VerticalPodAutoscaler
メタデータ:
名前: my - app - vpa
仕様:
ターゲットリファレンス:
apiバージョン: "apps/v1"
種類:デプロイメント
名前:私のアプリ
更新ポリシー:
更新モード: 「自動」

VPA と HPA はどちらも、監視インジケーター データを取得するために Metrics サーバーに依存します。オートスケーラーの VPA には、複数のリソース設定用の推奨機能が組み込まれており、リソース設定を制限することもできます。

VPA によって設定されたリソース値は、名前空間内の制限範囲の制約を超える可能性があることに注意してください。

また、VPA と HPA を同時に使用しないでください。これら 2 つの方法は互いに矛盾します。 Pod 数の水平方向の拡張と Pod 制限の垂直方向の拡張が同時にトリガーされる場合があります。

1.2 CA ノードのスケーリング

トリガー条件:

  • 容量拡張中、ノードはポッド要求の要件を満たすことができず、保留状態になります。
  • スケールダウンすると、ノードの負荷が低くなり、ノード上のポッドを他のノードに移動できるようになります。

対応メーカー:

  • アリクラウド
  • AWS
  • アズール
  • 百度クラウド
  • グーセ
  • ファーウェイクラウド
  • リノード
  • テンセントクラウド
  • ...

多くのメーカーがコンポーネントにプロバイダーを提供しています。オートスケーラーは定期的な検出を使用して、スケールアップとスケールダウンのためのメーカーのインターフェースアクションをトリガーします。

また、CA とメーカーが提供するノード垂直スケーリングを同時に使用しないでください。水平スケーリングと垂直スケーリングは、連携して機能するためのバランスポイントを見つける必要があります。

2. クラウドファクトリーホスティングクラスターの弾力的なスケーリング

EKS、CCE、ACK、TKE はすべて、ノードの弾力的なスケーリングを実現するために、独自の IaaS サービスと組み合わせてオートスケーラー コンポーネントを使用します。

基礎レイヤーではオートスケーラー コンポーネントが使用されるため、これは製品レベルのプレゼンテーションにも反映されます。以下に示すように、EKS を例に挙げます。

EKS クラスターには複数のノード グループがあり、各ノード グループが弾力的にスケーラブルなユニットを構成します。次の図に示すように、ノード グループには少なくとも 1 個、最大 7 個のノードが含まれます。

EKS ノードの弾力性はノード グループ用です。同じノード グループ内のノードには、同じマシン構成、テイント、ラベル、およびホスト起動テンプレートがあります。 EKS はノード拡張が必要であると判断すると、ノード グループで許可されるノードの最大数に基づいて容量を拡張します。これにより、拡張されたノードが正しく汚染され、ラベル付けされ、Kubernetes スケジューラによって直接使用できるようになります。

さらに、ノード グループの概念は、製品レベルおよび使用レベルでスーパー ノードにパッケージ化することもできます。ノード数の上限が十分に大きい限り、ノード グループは非常に大きなコンピューティング リソースとメモリ リソースのプールを提供できます。

3. ノード予備戦略

クラウド ファクトリーの使用範囲に応じて、クラスターは次の 3 つのカテゴリに分類されます。

  • 完全に管理されており、クラスタ内のホストを直接管理することはできません。
  • セミマネージド、マスターノードを管理できない、クラウドファクトリーがコントロールプレーンを維持
  • 非管理型、クラウドファクトリーIaaSセルフデプロイクラスタをベースとし、完全に自律制御

完全に管理されたクラスターの場合、クラウド ファクトリーはスケールアップとスケールダウンの機能を提供します。以下では、主にセミマネージド クラスターとアンマネージド クラスターについて説明します。

3.1 コールドスタンバイ

新しいノードが必要な場合は、新しいマシンを申請して構成を初期化します。

利点:

  • 低コスト、オンデマンドで新しいノードを申請
  • 適応性に優れ、クラスタのバージョンを考慮する必要がなく、必要に応じて依存関係をインストールします。
  • インストールツールが提供する機能を使用した簡単な操作により、スムーズで完全な拡張が可能になります。
  • 可用性ゾーンやファイアウォールなどを考慮する必要はありません。

欠点:

  • 速度は遅く、通常は 10 分以上かかりますが、依存ソースが遅い場合はさらに時間がかかることがあります。
  • 標準化が不可能、メンテナンスされたクラスタが単一のツールでインストールされていない、または Kubeadm を自分でパッケージ化する必要がある

3.2 ホットスタンバイ

ホット リソース プールを作成し、一定数のリソースを維持します。ホスト リソースが必要な場合は、クラスターに直接追加されます。

利点:

  • 速い

欠点:

  • コストが高く、クラスター バージョンごとに予備ノード (1.16、1.20、1.21 など) が必要です。
  • ホット スタンバイ プールは複雑です。異なる IDC、異なるリージョン、異なる AZ のノードにはアクセスできないネットワークやファイアウォールが存在する可能性があり、ホット スタンバイ プールが複雑になります。

3.3 セミホットスタンバイ

リージョン ホット スタンバイ プールを作成し、マシンを起動して、containerd、chrony、conntrack などの基本的な依存パッケージのみをインストールします。 Kubelet など、クラスター バージョンに関連する依存関係をインストールしないでください。同時に、リソースプールへの予備領域のファイアウォールを事前に解除し、ホットスタンバイプール内のホスト数を維持するためのコントローラが必要となります。

アドバンテージ:

  • コストと効率のトレードオフ

欠点:

  • ファイアウォールは比較的オープンになるため、セキュリティ上の問題が発生する可能性があります。安全性の問題を考慮すると、コストは再び増加します。

4. 参考文献

  • https://github.com/kubernetes/autoscaler
  • https://docs.aws.amazon.com/zh_cn/eks/latest/userguide/autoscaling.html
  • https://support.huaweicloud.com/productdesc-cce/cce_productdesc_0015.html
  • https://help.aliyun.com/document_detail/119099.html
  • https://cloud.tencent.com/document/product/457/43719

<<:  Java クラウド ネイティブの実践におけるメモリの問題の解釈

>>:  クラウド ネイティブでの観測可能なデータ収集の実践については、この記事をお読みください。

推薦する

SEOで見落とされがちな詳細

SEO で見落とされがちな詳細。SEO の最適化は時間がかかり、手間のかかる作業です。作業の効率と方...

適切なクラウド移行アプローチを選択する方法

近年、多くの企業がテクノロジー企業になることに注力しています。競合他社に遅れをとることを恐れて、これ...

Milvusの探査とストレステスト分析

1. 背景最近ベクトル検索を使用したので、milvus でストレス テストを実行する必要があります。...

キーワードのランキングを決定するものは何ですか?

最近、新しいウェブサイトの準備と開発に忙しく、宿題を提出できない日が続いています。最近、友人からウェ...

Baidu のアルゴリズムの改善がウェブサイトにどのような影響を与えるかをまとめた 3 つのポイント

ユーザーエクスペリエンスが向上し続ける中、Baidu は一方では対応戦略を提案し、低品質のコンテンツ...

SEOを避けてウェブサイトのトラフィックを増やす方法

はじめに: 今日私が共有したいのは、SEO の技術的な手段ではなく、他の手段でウェブサイトのトラフィ...

SEO が緑色のパイナップルに遭遇した場合、SEO は何をすべきでしょうか?

百度緑大根アルゴリズム1.0のリリース発表は2013年2月19日に行われ、このアルゴリズムの発効日は...

サイトマップを使用して検索ランキングを向上させる方法は?

ウェブサイトの構造は、検索エンジンのランキングにおいて重要な役割を果たします。サイトの構造が非常に複...

SAP は支出管理をデジタル化し、不確実な状況でも成功するためにグローバルリーダーと提携

SAPは先日、世界経済の不確実性が企業のデジタル変革を加速させ続ける中、2020年第3四半期に280...

初心者が注目すべきウェブサイト最適化アンカーテキスト

ウェブサイトの最適化の過程で、アンカーテキストという言葉が頻繁に登場します。誰もがよく話題にする高品...

ミクロデータの謎:彼はどのようにして一夜にしてWeiboセレブリストの6位に躍り出たのか?

数日前、私の友人の季秉建さんの新浪微博のアカウントが、突然、新浪微博の有名人影響力ランキングで6位に...

licloud: 月額 39 ドル、香港物理サーバー、30M 帯域幅、e3-1230v3/16G メモリ/1T ハードディスク

licloud からの公式ニュース: 現在、香港データセンターの約 100 台の物理マシン (香港サ...

Baiduの新アルゴリズムによる最適化意識の分析

検索エンジンのアルゴリズムが継続的に改善され、インテリジェンスが深まるにつれて、ますます多くの最適化...