Kubernetes リソース制限を調整する方法

Kubernetes のリソース制限は、制限が厳しすぎることと緩すぎることの間の適切なバランスを見つける必要があるため、調整が難しい構成になることがよくあります。

この記事では、無制限のコンテナの検出から、クラスターで正しく構成する必要がある Kubernetes リソース制限の確認まで、正しい Kubernetes リソース制限を設定する方法を学習できます。 Kubernetes クラスターを監視するために Prometheus を使用することを前提としています。そのため、この記事の各ステップでは、PromQL クエリを使用した例が説明されています。

Kubernetes リソース制限のないコンテナの検出

正しい Kubernetes リソース制限を設定するための最初のステップは、制限のないコンテナを検出することです。 Kubernetes リソース制限のないコンテナは、ノードに非常に深刻な結果をもたらす可能性があります。最良の場合、ノードは順番に、またはスコアによってポッドの排除を開始します。また、CPU スロットリングによるパフォーマンスの問題も発生します。最悪の場合、メモリ不足によりノードが終了します。

Kubernetes リソースの制約のないコンテナを見つける

名前空間でCPU制限のないコンテナを検索する

 (名前空間) で合計します ((名前空間、ポッド、コンテナ) でカウントします (kube_pod_container_info{container!=""}) ただし、(名前空間、ポッド、コンテナ) で合計しない場合は (kube_pod_container_resource_limits{resource="cpu"}))

名前空間で無制限のメモリを持つコンテナを検索する

 (名前空間) で合計((名前空間、ポッド、コンテナ) でカウント(kube_pod_container_info{container!=""})、ただし (名前空間、ポッド、コンテナ) で合計(kube_pod_container_resource_limits{resource="memory"}) の場合は除く)

Kubernetes リソース制限のないコンテナが多すぎると感じましたか?

Kubernetes リソース制限のないコンテナが多数見つかったかもしれません。それでは、最も危険なものに焦点を当ててみましょう。どうやって確認するんですか？簡単です。リソースを最も多く使用し、Kubernetes リソース制限のない上位 10 個のコンテナを見つけるだけです。

CPU 制限なしで CPU を最も多く使用しているコンテナのトップ 10

 topk(10、(名前空間、ポッド、コンテナ)(rate(container_cpu_usage_seconds_total{container!=""}[5m])) による合計、ただし、(名前空間、ポッド、コンテナ)(kube_pod_container_resource_limits{resource="cpu"}) による合計を除く)

メモリ制限なしでメモリを最も多く使用しているコンテナトップ 10

 topk(10、(名前空間、ポッド、コンテナ)(container_memory_usage_bytes{container!=""}) で合計、ただし、(名前空間、ポッド、コンテナ)(kube_pod_container_resource_limits{resource="memory"}) で合計しない場合)

Kubernetes リソース制限が過度に厳しいコンテナを検出する

過度に厳しいCPU制限を持つコンテナの検出

コンテナが CPU 制限に非常に近い場合、通常よりも多くの CPU 操作を実行する必要があるときに CPU スロットリングによりパフォーマンスが低下します。

CPU 使用率が制限に近いコンテナを見つけるには、次のクエリを使用します。

 ((名前空間、ポッド、コンテナ)(レート(container_cpu_usage_seconds_total{container!=""}[5m])) による合計 / (名前空間、ポッド、コンテナ)(kube_pod_container_resource_limits{resource="cpu"})) による合計 > 0.8

メモリ制限が過度に厳しいコンテナの検出

コンテナがメモリ制限に近づき、それを超過すると、コンテナは終了します。

このグラフは、コンテナが制限に達して終了するまで、メモリ使用量がどのように増加するかを示しています。

メモリ使用量が制限に近いコンテナを見つけるには、次のクエリを使用します。

 ((名前空間、ポッド、コンテナ)(container_memory_usage_bytes{container!=""}) による合計 / (名前空間、ポッド、コンテナ)(kube_pod_container_resource_limits{resource="memory"}) による合計) > 0.8

適切な Kubernetes リソース制限を設定するにはどうすればよいでしょうか?

1 つのアプローチは、制限したいコンテナのリソース使用量を時間の経過とともに観察することです。これを行うには、同じタイプとワークロード (デプロイメント、デーモンセット、ステートフルセットなど) のコンテナに焦点を当てる必要があります。ここでは 2 つの戦略があります。

保守的な戦略

各期間に最も多く消費されるコンテナの値を選択します。制限をこの値に設定すると、コンテナのリソースが不足することはありません。

保守的な戦略を使用して適切なCPU制限を見つける

最大 (namespace、owner_name、container)((rate(container_cpu_usage_seconds_total{container!="POD",container!=""}[5m])) * on(namespace、pod) group_left(owner_name) 平均 (namespace、pod、owner_name)(kube_pod_owner{owner_kind=~"DaemonSet|StatefulSet|Deployment"}))

適切なメモリ制限を見つけるために保守的な戦略を使用する

最大値 (namespace、owner_name、container)((container_memory_usage_bytes{container!="POD",container!=""}) * on(namespace、pod) group_left(owner_name) 平均 (namespace、pod、owner_name)(kube_pod_owner{owner_kind=~"DaemonSet|StatefulSet|Deployment"}))

積極的な戦略

制限として 99 パーセンタイルを選択します。これにより、制限外の 1% の値が除去されます。これは、望ましくない異常や急増が時々発生する場合に適した戦略です。

積極的な戦略で適切なCPU制限を見つけましょう

 (namespace、owner_name、container) による分位値 (0.99、(rate(container_cpu_usage_seconds_total{container!="POD",container!=""}[5m])) * on(namespace、pod) group_left(owner_name) による平均 (namespace、pod、owner_name)(kube_pod_owner{owner_kind=~"DaemonSet|StatefulSet|Deployment"}))

積極的な戦略を使用して適切なメモリ制限を見つけます

 (namespace、owner_name、container) による分位値 (0.99、(container_memory_usage_bytes{container!="POD",container!=""}) * on(namespace、pod) group_left(owner_name) による平均 (namespace、pod、owner_name)(kube_pod_owner{owner_kind=~"DaemonSet|StatefulSet|Deployment"}))

クラスターには十分な容量がありますか?

Kubernetes では、ノードは、各ポッドのコンテナ要求に基づいて、そのノードにスケジュールされているポッドに十分なリソースがあることを確認します。これは、ノードが各コンテナに制限内で設定された量の CPU とメモリを提供することを約束することも意味します。

非常に緩い制限を持つコンテナについて議論することは、過度の制限について議論することと同じです。これは、すべての Kubernetes リソース制限の合計がそのリソースの容量を超えた場合に発生します。

クラスター内のリソースをオーバーコミットすると、通常の状況ではすべてが正常に実行される可能性がありますが、負荷が高い場合は、コンテナーが CPU とメモリを消費し始め、限界に達する可能性があります。これにより、ノードはポッドの削除を開始し、非常に重大なケースでは、クラスター内の使用可能なリソースが不足しているためにノードが終了します。

クラスター上のオーバーコミットの検出

メモリと CPU のクラスターのオーバーコミット率を確認するには、次のコマンドを使用します。

クラスターメモリのオーバーコミット率

 100 * 合計(kube_pod_container_resource_limits{コンテナ!="",リソース="メモリ"}) / 合計(kube_node_status_capacity_memory_bytes)

クラスターCPUオーバーコミット率

 100 * 合計(kube_pod_container_resource_limits{コンテナ!="",リソース="cpu"}) / 合計(kube_node_status_capacity_cpu_cores)

通常、すべてのコンテナが同時にすべてのリソースを消費するわけではないため、リソースの観点からは 100% のオーバーコミットメントが理想的です。一方、これでは、決して使用されないインフラストラクチャに追加コストが発生します。

クラスターのサイズをより適切に設定するには、オーバーコミットメントが 125% 未満になるように保守的な戦略を選択するか、オーバーコミットメントがクラスター容量の 150% に達するようにする場合は積極的な戦略を選択します。

オーバーコミットノードの検出

各ノードのオーバーコミットを確認することも重要です。ノードがオーバーコミットされる例としては、ポッドが 2 つの CPU を要求しているが、8 つの CPU に制限されている場合が挙げられます。ポッドは 4 コアのノードでスケジュールできますが、ポッドのコア数は 8 個に制限されているため、ノードのオーバーコミットメントは 8 - 4 = 4 コアになります。

ノードメモリのオーバーコミット率

 (ノード)(kube_pod_container_resource_limits{container!=””,resource=”memory”} ) による合計 / (ノード)(kube_node_status_capacity_memory_bytes) による合計

ノードCPUオーバーコミット率

 (ノード)(kube_pod_container_resource_limits{container!=””,resource=”memory”} ) による合計 / (ノード)(kube_node_status_capacity_memory_bytes) による合計

リソース制限を適切に調整した後の最終結果

*原文: https://sysdig.com/blog/kubernetes-resource-limits/*この記事の一部の写真はインターネットから引用したものです。著作権侵害があった場合は削除いたしますのでご連絡ください。

<<: Kube-Mgmt を使用して OPA を Kubernetes クラスターに統合する

>>: 中小企業のオフィスセキュリティ管理の3大課題をどう解決するか？

米国のドメイン名プロバイダーGoDaddyは、ユーザーの逃亡を防ぐために技術的な障壁を設けたと非難されている。

Kubernetes リソース制限を調整する方法

Kubernetes リソース制限のないコンテナの検出

Kubernetes リソースの制約のないコンテナを見つける

Kubernetes リソース制限のないコンテナが多すぎると感じましたか?

Kubernetes リソース制限が過度に厳しいコンテナを検出する

過度に厳しいCPU制限を持つコンテナの検出

メモリ制限が過度に厳しいコンテナの検出

適切な Kubernetes リソース制限を設定するにはどうすればよいでしょうか?

保守的な戦略

積極的な戦略

クラスターには十分な容量がありますか?

クラスター上のオーバーコミットの検出

オーバーコミットノードの検出

リソース制限を適切に調整した後の最終結果

米国のドメイン名プロバイダーGoDaddyは、ユーザーの逃亡を防ぐために技術的な障壁を設けたと非難されている。

APP チャネルプロモーション: チャネル評価を効率的に行うには?

簡単な分析: ウェブサイトをオンラインにする前にどのような準備が必要か

2019年に役に立つSEOランキング手法、絶対に知りたくないとは思わない

Dockerコンテナ実践：コンテナセキュリティ分析

推奨: buyvm - メモリの在庫がいっぱい - 更新日: 1 月 23 日

ウェブマスターネットワークからの毎日のレポート：Baidu 360は国境紛争に直面し、Xiaomi Boxは生き残るために腕を切り落とす

inceptionhosting - 月額 7.27 ドル - 2GB RAM XEN、素晴らしい

onetechcloud: すべての VPS が 20% オフ、月額 21 元、ネイティブ US cn2 gia+ 高防御、大帯域幅香港 CMI、無制限トラフィック香港 CN2

ArmorShark-openstack/1g メモリ/3 コア/30g SSD/2T トラフィック/月間 6 ナイフ/年間 48 ドル

推薦する

数百のWordPressサイトとブログが脆弱性によりハッキングされる

サイトSEO最適化で注意すべき4つのポイント

スパイダーSEO：Baiduの包含が減少した理由と解決策！

Huawei Cloud GaussDBはクラウドネイティブを実践し、極めて高い弾力性、グローバルな可用性、そしてミニマリストなエクスペリエンスを実現します。

ウェブマスターネットワークニュース：CCTVは価格比較ソフトウェアWochachaが恐喝に関与していたことを暴露しました。私たちはCCTVに無料広告に感謝することで対応しました。

Virpus-Seattle Xen 仮想 VPS が 40% 割引で販売中です。512M のメモリが月額約 1.7 ドルです。

48時間以内に百度のトップ3に入るメカニズムについての個人的な分析

Xiaohongshu は電子商取引のライブストリーミングで良い成果を上げることができるでしょうか?

SEOにおけるキーワードの基本的な最適化手法をユーザー視点から理解する - A5 Webmaster Network

hostsolutions: 50 ユーロ/3 年、KVM/512M メモリ/1 コア/1T ハードディスク/5T トラフィック、ノルウェー、ルーマニア

ガートナー：中国のクラウド価格戦争はインフラと運用のクラウド戦略を変える

HEMA Freshがいかにして生鮮食品の障壁を築いたか

ウェブマスターツールのいわゆる「百度重み」の簡単な分析

リアルタイムの洞察を強化: コンピュータービジョンとエッジコンピューティングの相乗効果

Namecheap-新しいサーバー/E3-1240v3/最低99ドル/フェニックス