クラスターノードの弾性スケーリング

クラスターノードの弾性スケーリング

弾性スケーリングには主に 3 つの側面があります。

  • HPAは使用率に基づいてポッドの数を自動的に調整します
  • VPAは履歴データに基づいてポッドのリクエストと制限を自動的に設定します
  • CAは、使用状況に応じてノードの数を自動的に調整します

この記事では主にノードの拡張と削減の部分について説明します。

1. オートスケーラー

オートスケーラーは、Kubernetes コミュニティによって管理されているプロジェクトです。現在、オートスケーラー コンポーネントは、VPA と CA のスケーリング機能をすでに提供しています。 EKS、CCE、ACK、TKE などの主流メーカーはすべて、CA エラスティック拡張にこのコンポーネントに依存しています。公式データは見つかりませんでしたが、同僚と話したところ、CA 拡張が完了するまでに約 2 ~ 3 分かかると言われました。

1.1 VPAの垂直拡張

HPA と同様に、デプロイメント用に VPA オブジェクトを作成する必要があります。

 apiVersion :自動スケーリング.k8s .io / v1
種類: VerticalPodAutoscaler
メタデータ:
名前: my - app - vpa
仕様:
ターゲットリファレンス:
apiバージョン: "apps/v1"
種類:デプロイメント
名前:私のアプリ
更新ポリシー:
更新モード: 「自動」

VPA と HPA はどちらも、監視インジケーター データを取得するために Metrics サーバーに依存します。オートスケーラーの VPA には、複数のリソース設定用の推奨機能が組み込まれており、リソース設定を制限することもできます。

VPA によって設定されたリソース値は、名前空間内の制限範囲の制約を超える可能性があることに注意してください。

また、VPA と HPA を同時に使用しないでください。これら 2 つの方法は互いに矛盾します。 Pod 数の水平方向の拡張と Pod 制限の垂直方向の拡張が同時にトリガーされる場合があります。

1.2 CA ノードのスケーリング

トリガー条件:

  • 容量拡張中、ノードはポッド要求の要件を満たすことができず、保留状態になります。
  • スケールダウンすると、ノードの負荷が低くなり、ノード上のポッドを他のノードに移動できるようになります。

対応メーカー:

  • アリクラウド
  • AWS
  • アズール
  • 百度クラウド
  • グーセ
  • ファーウェイクラウド
  • リノード
  • テンセントクラウド
  • ...

多くのメーカーがコンポーネントにプロバイダーを提供しています。オートスケーラーは定期的な検出を使用して、スケールアップとスケールダウンのためのメーカーのインターフェースアクションをトリガーします。

また、CA とメーカーが提供するノード垂直スケーリングを同時に使用しないでください。水平スケーリングと垂直スケーリングは、連携して機能するためのバランスポイントを見つける必要があります。

2. クラウドファクトリーホスティングクラスターの弾力的なスケーリング

EKS、CCE、ACK、TKE はすべて、ノードの弾力的なスケーリングを実現するために、独自の IaaS サービスと組み合わせてオートスケーラー コンポーネントを使用します。

基礎レイヤーではオートスケーラー コンポーネントが使用されるため、これは製品レベルのプレゼンテーションにも反映されます。以下に示すように、EKS を例に挙げます。

EKS クラスターには複数のノード グループがあり、各ノード グループが弾力的にスケーラブルなユニットを構成します。次の図に示すように、ノード グループには少なくとも 1 個、最大 7 個のノードが含まれます。

EKS ノードの弾力性はノード グループ用です。同じノード グループ内のノードには、同じマシン構成、テイント、ラベル、およびホスト起動テンプレートがあります。 EKS はノード拡張が必要であると判断すると、ノード グループで許可されるノードの最大数に基づいて容量を拡張します。これにより、拡張されたノードが正しく汚染され、ラベル付けされ、Kubernetes スケジューラによって直接使用できるようになります。

さらに、ノード グループの概念は、製品レベルおよび使用レベルでスーパー ノードにパッケージ化することもできます。ノード数の上限が十分に大きい限り、ノード グループは非常に大きなコンピューティング リソースとメモリ リソースのプールを提供できます。

3. ノード予備戦略

クラウド ファクトリーの使用範囲に応じて、クラスターは次の 3 つのカテゴリに分類されます。

  • 完全に管理されており、クラスタ内のホストを直接管理することはできません。
  • セミマネージド、マスターノードを管理できない、クラウドファクトリーがコントロールプレーンを維持
  • 非管理型、クラウドファクトリーIaaSセルフデプロイクラスタをベースとし、完全に自律制御

完全に管理されたクラスターの場合、クラウド ファクトリーはスケールアップとスケールダウンの機能を提供します。以下では、主にセミマネージド クラスターとアンマネージド クラスターについて説明します。

3.1 コールドスタンバイ

新しいノードが必要な場合は、新しいマシンを申請して構成を初期化します。

利点:

  • 低コスト、オンデマンドで新しいノードを申請
  • 適応性に優れ、クラスタのバージョンを考慮する必要がなく、必要に応じて依存関係をインストールします。
  • インストールツールが提供する機能を使用した簡単な操作により、スムーズで完全な拡張が可能になります。
  • 可用性ゾーンやファイアウォールなどを考慮する必要はありません。

欠点:

  • 速度は遅く、通常は 10 分以上かかりますが、依存ソースが遅い場合はさらに時間がかかることがあります。
  • 標準化が不可能、メンテナンスされたクラスタが単一のツールでインストールされていない、または Kubeadm を自分でパッケージ化する必要がある

3.2 ホットスタンバイ

ホット リソース プールを作成し、一定数のリソースを維持します。ホスト リソースが必要な場合は、クラスターに直接追加されます。

利点:

  • 速い

欠点:

  • コストが高く、クラスター バージョンごとに予備ノード (1.16、1.20、1.21 など) が必要です。
  • ホット スタンバイ プールは複雑です。異なる IDC、異なるリージョン、異なる AZ のノードにはアクセスできないネットワークやファイアウォールが存在する可能性があり、ホット スタンバイ プールが複雑になります。

3.3 セミホットスタンバイ

リージョン ホット スタンバイ プールを作成し、マシンを起動して、containerd、chrony、conntrack などの基本的な依存パッケージのみをインストールします。 Kubelet など、クラスター バージョンに関連する依存関係をインストールしないでください。同時に、リソースプールへの予備領域のファイアウォールを事前に解除し、ホットスタンバイプール内のホスト数を維持するためのコントローラが必要となります。

アドバンテージ:

  • コストと効率のトレードオフ

欠点:

  • ファイアウォールは比較的オープンになるため、セキュリティ上の問題が発生する可能性があります。安全性の問題を考慮すると、コストは再び増加します。

4. 参考文献

  • https://github.com/kubernetes/autoscaler
  • https://docs.aws.amazon.com/zh_cn/eks/latest/userguide/autoscaling.html
  • https://support.huaweicloud.com/productdesc-cce/cce_productdesc_0015.html
  • https://help.aliyun.com/document_detail/119099.html
  • https://cloud.tencent.com/document/product/457/43719

<<:  Java クラウド ネイティブの実践におけるメモリの問題の解釈

>>:  クラウド ネイティブでの観測可能なデータ収集の実践については、この記事をお読みください。

推薦する

#黑5# sharktech: 最低価格の専用サーバー、1Gbps無制限、10Gbps無制限のトラフィック

Sharktech の毎年恒例のブラック フライデー プロモーションが始まりました。Sharktec...

Hostyun US Ryzen9 5950X + ネイティブ IP + 3 ネットワーク cn2 gia シリーズ VPS の簡単な評価

米国ロサンゼルスのHostyun VPSに、AMD Ryzen 9 5950X、Samsung 98...

皆さん落ち着いてください。WeChatストアはWeChat上でマーケティングやビジネスが許可されていることを意味するものではありません

今日、パブリックアカウントの情報を押していたところ、偶然、WeChatパブリックプラットフォームが、...

重要な報告 |今後のデジタル開発における9つの主要トレンド

2月20日、アリババクラウドリサーチセンターは「2019年デジタルトレンドレポート」を発表しました。...

2013 年に医療ウェブサイトのランキングを最適化する方法

医療分野で働いている友人は、自分のウェブサイトのランキングについて非常に心配しているに違いないと思い...

ヤフー、メキシコで27億ドルの訴訟後、低価格で和解

網易科技ニュース、12月6日、ロイター通信によると、メキシコでヤフーに対し27億ドルの損害賠償を求め...

A5 最適化チーム: ランキングが乱高下する中、SEO 最適化はどこに向かっているのでしょうか?

2012年に入ってから、検索エンジンの順位変動が異常に頻繁になった。権威の低いウェブサイトが一夜にし...

需要ポイントの追加は、新しい電子商取引モデルの出現につながるでしょうか?

Velo Cityの簡単な説明: Velocity にシンプルでわかりやすい認知的ラベルを付けるなら...

Baidu: 何を信頼すればいいですか? - A5 Webmaster Network

10月16日にウェブサイトのトラフィックが急減して以来、著者は状況を改善するためにさまざまな対策を講...

3 分で Python Web アプリケーションをデプロイします。クラウド開発について知りたいですか?

Web アプリケーションを開発する場合、初心者は Linux システムに慣れていないために、展開の困...

Baidu検索の最適化の概要の程度と量を把握する

私は何かを書くときは、たいてい、余計なことは言わずに、すぐに本題に入るようにしています。これは、昨年...

virmach: 安価な VPS、2 年間購入すると 1 年間無料、Windows をサポート、Alipay 支払いに対応!

virmach は 4 月にスーパープロモーションを実施します。すでに超格安の 4 つの VPS を...

2019 年はエンタープライズ クラウド サービスにとって画期的な年となるでしょうか?

クラウド コンピューティングにおける革新は引き続き生まれています。拡大する市場を背景に、クラウド コ...

SEOERの究極の混乱

最近、ウェブサイトの最適化に取り組んでいますが、SEO についてますます混乱を感じています。 SEO...