DevOps の最前線にいる場合、Kubernetes は急速に実稼働クラウド環境に不可欠な要素になりつつあります。コンテナ オーケストレーションはコンテナ化されたアプリケーションのデプロイ、スケーリング、管理に不可欠であるため、Kubernetes の監視は監視戦略の重要な部分である必要があります。 コンテナ環境は従来の環境とは異なる方法で動作します。したがって、アプリケーションとインフラストラクチャを監視する場合は、それらを実行するコンテナ環境を監視する方法を考慮する必要があります。考慮すべき 5 つのベスト プラクティスを以下に示します。 1. ログとメトリックを一元管理します。 Kubernetes を介してコンテナ化されたサービスとワークロードをオーケストレーションすると秩序がもたらされますが、環境は依然として分散されていることに注意してください。ログとメトリックを一元化すると、処理がはるかに簡単になります。 2. 一時的なコンテナを検討します。コンテナ オーケストレーションの利点は、コンテナの起動、停止、強制終了、クリーンアップを短時間で簡単に実行できることです。ただし、それらを監視することは簡単ではないかもしれません。サービスが実行されている場合でも、問題をデバッグし、クラスターのアクティビティを監視する必要があります。秘訣は、ログとメトリックが消えてしまう前に取得することです。これを行わないと、メトリックは右側のグラフよりも左側のグラフに似たものになります。 3. シンプルに、シンプルに、シンプルに。コンテナ環境内のすべての可動部分 (サービス、API、コンテナ、オーケストレーション ツール) を、不必要な複雑さを導入することなく監視する必要があります。さまざまな監視エージェントを使用してコンテナをスケーリングするのではなく、監視および管理対象から監視および管理ツールを抽象化します。これにより、エンジニアは配信プラットフォームの運用ではなく、ソフトウェアの構築と配信に集中できるようになります。 4. 各レイヤーを明示的に監視します。環境のすべてのレイヤー (ポッド、コンテナ、コントローラー マネージャー) でログを収集し、エラー、障害、パフォーマンスの問題を監視する必要があります。たとえば、ポッドのトラブルシューティング、コンテナが適切に実行されているかどうかの確認、コントローラ マネージャーでのランタイム メトリックの収集などを行う必要があります。 5. レイヤー間でデータの一貫性を確保します。迅速かつ正確にデバッグするには、コンテナ環境内のすべての層にわたってデータの一貫性を確保する必要があります。正確なタイムスタンプ、一貫した測定単位 (ミリ秒と秒など)、アプリケーションとコンポーネント全体での共通のメトリックとログのセットの収集などは、すべてのレイヤーで迅速かつ正確にトラブルシューティングとデバッグを行うのに役立ちます。 これらの ToDo 項目をシンプルかつ簡単に達成する最善の方法は、アプリケーション コンテナに触れることなく、Kubernetes 環境内のコンテナを監視することです。これは、コンテナ化されたサービスと並んで配置され、ログ記録およびメトリック収集エージェントを含む DaemonSet またはサイドカーを Kubernetes 環境に導入することで実現できます。このデプロイメント アプローチを使用すると、データ収集の一貫性が確保され、アプリケーション コンテナーに必要な変更が最小限に抑えられ、最も重要な点として、運用環境でのブラインド選択の可能性が排除されます。 実装方法には次のようなものがあります。 1. Fluentd ログ エージェントで DaemonSet を使用します (これによりログは記録されますが、メトリックは記録されません)。 ELK クラスターがすでに構成されている場合は、これがオプションになります。 2. Prometheus メトリクス エージェントで DaemonSet またはサイドカーを使用します (CoreOS は Prometheus と Kubernetes の統合に優れています)。 Kubernetes クラスターで Prometheus を実行すると、メトリックの計測、クエリ、アラート機能が提供されます。 3. Heapster、DataDog、cAdvisor、New Relic、Weave/VMware などの多くのメトリックおよびパフォーマンス監視ツールも、Kubernetes 監視用の DaemonSet またはサイドカー オプションを提供します。 |
<<: 白洋製薬とオラクルがクラウド協力を強化し、製薬業界に新たな活力を注入
>>: クラウド コンピューティングの一般的な 7 つのアプリケーション シナリオ
労働者の日、おそらく中国の労働者の日に相当するのでしょうか? Hostcat の詳細については触れま...
2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています従来のセル...
[51CTO.com からのオリジナル記事] 「1.0 時代のクラウドは、実行に複雑なコード命令のセ...
今年はまさに地獄の始まりだ。おそらく 404+404+404+404+404 です。404 で構成さ...
1. リベートウェブサイトがねずみ講にリンクされており、業界に衝撃を与えており、規制当局は厳しい調査...
前にも述べたように、ウェブサイトが中期段階に入った後は、トラフィックを次のレベルに引き上げるために微...
10月19日、共同購入サイト「24quan」は突然公式サイトで声明を発表し、同社が一時的に「長期休暇...
ウェブサイトが良いランキングを獲得したい場合、Baidu での重みを高める方法を見つける必要がありま...
今後数年間は、トラフィック モデルのエコ化 (複数の場所、複数の形式) とシナリオベースのトラフィッ...
「大晦日にネットで服を買ったのですが、今朝になってやっと届きました。配達が本当に遅いです!」昨日の朝...
[[343429]] [51CTO.com クイック翻訳] 実践により、データセンターは、複雑なデジ...
2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています甲はいつで...
ご存知のとおり、今はデータを駆使することでチャンスを掴める時代です。データの爆発的な増加は、新しいテ...
ウェブサイトの最適化とは何ですか?ウェブサイトの最適化は検索エンジン最適化(検索エンジンランキングと...
今日のニュース: Linode は、10 番目のデータ センターがカナダのトロントにあることを正式に...