本番環境でKubernetesの大規模な管理を自動化する7つの方法

本番環境でKubernetesの大規模な管理を自動化する7つの方法

[51CTO.com クイック翻訳] Kubernetes オープンソース コンテナ オーケストレーション エンジンは管理プラットフォームではないので、管理プラットフォームと間違えないようにしてください。オーケストレーションのポイントは、自動化されたシステムを確実に有効にして、あらゆるステップで人間の介入を必要とせずに、大規模なアプリケーションの展開と管理を容易にすることです。 Kubernetes に使用するツールが自動化をサポートしていない場合、オーケストレーションのメリットを十分に活用できていません。

[[218766]]

そのために、本番環境の Kubernetes クラスターの管理を自動化する 7 つの方法を紹介します。

1. ログ

Kubernetes の本番環境は、ログに大きく依存します。 Kenzan では、通常、プラットフォーム ログとアプリケーション ログを分離するように努めています。これは、さまざまなツールやアプリケーションを通じて実行することも、ログ自体のフィルタリングやタグ付けを通じて実行することもできます。他の分散システムと同様に、ログは、異なるマイクロサービスを対象としている場合でも、特定の呼び出しを正確に追跡するための重要な証拠を提供し、根本原因を特定できるようにします。

2. 自己治癒

私たちは、自己修復機能がなければ、特に分散環境において、システムの高稼働率を達成することはほぼ不可能だと考えています。 Kubernetes は、ポッドとコンテナの状態を定期的に監視し、発生した問題を解決するために即座にアクションを実行できます。 Kubernetes が直接認識する 2 つのオブジェクト タイプは、ポッド ステータスとコンテナ ステータスです。

コンテナ プローブ (livenessProbe および readinessProbe) を使用すると、コンテナが稼働中であり準備ができているかどうかを Kubernetes で監視する方法を定義できます。準備プローブは、プローブが失敗した場合にポッドは実際に実行され続けるものの、トラフィックは渡されないため、特に便利です。

ただし、30 分ごとに再起動するなどの自己修復機能は便利ですが、アプリケーションの問題を隠す可能性もあることに注意してください。発生した問題を検出できるほど堅牢な監視およびログ記録機能が必要です。

3. 弾性テスト

アプリケーションの要件 (例: 99.999% の稼働時間) に応じて、耐障害性テストをプラットフォームの一部にする必要があります。アプリケーションのどのレベルでも障害が発生しても、ダウンタイムが発生しないように回復可能である必要があります。私たちの経験では、開発チームが開発作業に広範な耐性テストが行​​われることを事前に知っていれば、信頼性の高いアプリケーションを開発できる可能性が高くなります。

データベースを手動でシャットダウンしたり、ポッドをランダムに強制終了するなど、最も単純な手動の方法で回復力テストを実行することもできますが、私たちの経験では、これらの方法は自動化するとはるかに効果的であることがわかっています。 Netflix の Chaos Monkey は、Amazon Web Services で実行される非常に強力で非常に便利な回復力テスト ツールですが、Kubernetes 用に構築されたものではありません。幸いなことに、Kubernetes 分野では回復力テスト フレームワークが登場しており、そのうちの 2 つは fabric8 Chaos Monkey (fabric8 IDE の一部) と kube-monkey です。

4. 定期監査

チェックとバランスをいくつ導入したとしても、Kubernetes の運用環境は定期的なメンテナンスと監査の恩恵を受けることができます。定期的な監査では、通常の監視ではカバーされない領域もカバーされます。監査は従来、手作業で行われてきましたが、この分野の自動化ツールは急速かつ劇的に改善されています。

5. 自動スケーリング

Kubernetes の場合、スケーリングとは通常、次の 2 つのいずれかを意味します。

  • ポッドのスケーリング
  • クラスター内のノードのスケーリング

ポッドのスケーリングは、間違いなく最も一般的なスケーリング形式です。これにより、サービス インスタンスが追加され、トラフィックの受け入れを開始する準備が整います。通常、ポッドレベルのスケーリングは、Heapster メトリックを使用して実行され、新しいインスタンスを作成する必要があるかどうかが判断されます。私たちは通常、ポッドの最小数をかなり低く設定し、Kubernetes Horizo​​ntal Pod Autoscaler にレプリカの最小数を正しく設定させます。単一障害点のシナリオを回避するために、クラスターあたりのレプリカの最小数を常に 1 つより大きく設定します。

ノードのスケーリングは比較的まれなケースですが、回復力の高いアプリケーションにとっては非常に便利なスケーリング メカニズムです。ノードを拡張するには、基盤となる IaaS (AWS、GCP など) を拡張して Kubernetes クラスターに登録する必要があります。このプロセスは手動で実行できますが、推奨されません。通常、単一のノードを自動的にスケーリングできるツールを使用します。ノード レベルのオートスケーラーは、主に 2 つのアクションを実行します。1 つ目は、必要に応じてノードを追加すること、2 つ目は、十分に活用されていないノードを削除することです。

6. リソース割り当て

リソース クォータを使用すると、Kubernetes プラットフォーム内の名前空間を制限して、1 つのアプリケーションがすべてのリソースを占有して他のアプリケーションに影響を与えないようにすることができます。リソースクォータの設定は少し難しい場合があります。私たちの経験では、名前空間を予想される負荷で分割し、比率を使用してクラスターの割合を計算するのが最も安全です。 Heapster が実行中になったら、 kubectl top {node | を使用できます。 pod} コマンドは、現在のノードまたはポッドのリソース使用量を表示し、クォータの管理に役立つ場合があります。その後、監視と監査を使用して、パーティショニングが正しいかどうかを確認します。

7. コンテナリソースの制約

単一のコンテナまたはポッドに必要なリソースの数を把握することは、ある種の芸術になっています。これまで、開発チームは実際に必要なリソースよりもはるかに多くのリソースを見積もっていました。私たちは、ある程度の負荷テストを実行し、フェイルオーバーがどのように機能するかを観察し、リソースを適切に割り当てようとしています。 Netflix はこの方法を「スクイーズ テスト」と呼んでいます。

本番環境でKubernetesを大規模に自動化する7つの方法

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください。

<<:  クラスターとは何ですか?何が配布されますか? SOAとは何ですか?

>>:  中国SaaSアプリケーションカンファレンス、企業のデジタル変革への新たな道の開拓を支援

推薦する

クラウドコンピューティング業界の発展の現状分析、オペレーターはレイアウトの課題に直面している

国内事業者はクラウドコンピューティング市場の開拓に多大な努力を払っている国内事業者はクラウドコンピュ...

BaiduのクレイジーKステーションウェブサイトの重みが0から1に増加

6月18日から28日までの10日間は、ちょうど百度Kステーションブームが起こった時期だった。ほとんど...

今後10年間、私たちはTo Bに注力していきます。 UCloudが「エンタープライズクラウド・エンジョイクラウドホワイトペーパー」を共同リリース

過去1年間、中国のインターネット市場は大きな変化を遂げ、To Bが新たなトレンドとなりました。産業用...

ハイブリッド クラウドは本当に私たちに適しているのでしょうか?企業はハイブリッドクラウドをどのように活用する予定ですか?

1. ハイブリッド クラウドは当社のビジネスに適していますか?近年、クラウド技術の活発な発展に伴い、...

myserverplanet - 10 ポンド/年/メモリ 1g/ハードディスク 150g/トラフィック 10T

myserverplanet (2009 年設立、会社番号 09159619、VAT 登録番号 GB...

7月のBaiduのメジャーアップデートに関する私の個人的な意見

2月に「青大根アルゴリズム」がリリースされて以来、多くのウェブマスターがBaiduがリリースしたこの...

Fanstong | 戦略戦争ゲームの実践的な共有開始

「Invasion」はtap4funが開発・運営する3D戦略戦争ゲームです。2015年9月2日より全...

ウェブサイトは重大な岐路に立たされている: APP 時代を受け入れるか、それとも排除されるか

【捜狐ITニュース】北京時間6月11日現在、従来のパソコンではなく、スマートフォンやタブレットでイン...

SEO アクセラレータが Web ページの検索ランキングを加速する方法

最初のは興味深い新しいウェブサイトの所有者は皆、興味深い事実を発見しました。それは、訪問者数が数十人...

中間レビュー: 2020 年に注目を集めたクラウド コンピューティング スタートアップ 10 社

新型コロナウイルス感染症のパンデミックにより、クラウドコンピューティングが人々の生活、仕事、学習にと...

Pacificrack: 新しい Windows VPS シリーズ「Simple Application Server」、超高構成 8G メモリで月額 6.18 ドルから

2017 年 6 月 17 日、pacificrack は「NoKVM」仮想化パネルを使用し、Win...

U-Mail 電子メール マーケティング: ゴミ箱に捨てられにくい電子メール コンテンツの種類は何ですか?

製品やサービスを宣伝するために大量のメールを送信する過程で、送信したメールの多くがスパム フォルダー...

virpus-Xen pvはDAとCPを送信します

Virpus の XEN PV ベースの VPS が特別プロモーション中です。半年分支払うと、DA ...

企業のウェブサイトの 90% は営利目的で立ち上げられていますが、その半数以上が収益を上げる方法を見つけられていないのはなぜでしょうか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています企業のウェ...

SEOは最適化の初期データ分析を無視してはならない

ナイフを研いでも薪割りは遅れないということは誰もが知っていますが、これはウェブサイトの最適化にも当て...