ハイブリッド クラウド環境で K8S の可観測性を実装するための 6 つの戦略

ハイブリッド クラウド環境で K8S の可観測性を実装するための 6 つの戦略
サヴァン・カロッド著

徐潔成編纂

2023 年には、ネイティブ クラウド アプリケーションとプラットフォームが急速に発展します。多くの企業は、優れたユーザー エクスペリエンスを確保し、ビジネスの成長を促進するために、アプリケーションの可能性を最大限に引き出すことに努めています。

ハイブリッド クラウド環境の台頭と Kubernetes などのコンテナ化テクノロジの採用により、最新のアプリケーションの開発、展開、拡張の方法に革命が起こりました。

このデジタル分野では、K8S はほとんどのクラウドネイティブ アプリケーションとワークロードに最適なプラットフォームであり、この人気の高いオープン ソース ツールは、コンテナのオーケストレーションと検出、負荷分散、その他の機能を容易に実現します。あるレポートによると、現在 96% の企業がクラウド システムで K8S を使用しているか、実装を評価しています。

写真

しかし、これによって新たな課題も生じます。アプリケーションの複雑さが増すにつれて、コンテナ化されたワークロードに関する詳細な情報を企業に提供し、ハイブリッド クラウド環境でコンテナ化されたアプリケーションを管理および最適化するための重要な前提条件となる、効果的な可観測性ソリューションの必要性も高まります。

この記事では、K8S の可観測性について詳しく説明し、企業がハイブリッド クラウド環境でコンテナ化されたアプリケーションの潜在能力を最大限に引き出すことができる 6 つの効果的な戦略について説明します。

1. クラスターログとログ集約を使用する

クラスター ロギングは、分散システムに関する洞察を得るための基本的な戦略です。 K8S 環境では、アプリケーションは複数のコンテナとノードにまたがるため、さまざまなソースからログを収集して分析することが重要になります。

クラスター ログ記録は、さまざまなコンポーネントのログを 1 つの簡単にアクセスできる場所に統合するものです。クラスター ログの重要性は、システムの動作とパフォーマンスの全体的なビューを提供できる点にあります。

K8S クラスター ログを使用すると、K8S クラスター内のイベントを相関させてパターンを識別できるため、効率的なトラブルシューティングと障害原因分析が可能になります。

K8S でクラスター ログを実装するには、強力なログ集約ツールや、Amazon Observable Logs や Google Cloud Logs などのクラウドネイティブ ソリューションを活用できます。これらのツールは、K8S クラスターからログを収集、保存、分析するためのスケーラブルで効率的な方法を提供します。

2. 分散トレースを使用してエンドツーエンドの可視性を実現する

マイクロサービスが複数のコンテナとノードに分散されている複雑な K8S 環境では、リクエストのフローとさまざまなコンポーネント間の相互作用を理解することは困難です。ここで、分散トレースが役立ちます。分散トレースは、リクエストがさまざまなサービスを通過するときに、リクエストの実行パスをエンドツーエンドで可視化します。

分散トレースを使用すると、イングレスからそれが関係するすべてのマイクロサービスまでのリクエストのフローを追跡し、各ステップに関する貴重な情報を取得できます。トレース ライブラリまたはプロキシ インストルメンテーション アプリケーションを使用すると、各サービスの期間、待機時間、潜在的なボトルネックを示すトレース データを生成できます。

Kubernetes で分散トレースを活用することの利点は非常に大きいです。

まず、サービス間の依存関係を理解するのに役立ち、トラブルシューティングとパフォーマンスの最適化が向上します。リクエストが遅延したりエラーが発生した場合、問題のあるサービスまたはコンポーネントを迅速に特定し、修正措置を講じることができます。

2 番目に、分散トレースを使用すると、個々のサービスのパフォーマンスとそれらの相互作用を測定および監視できます。

トレース データを分析することで、パフォーマンスのボトルネックを特定し、非効率的なリソース使用を検出し、システム全体の応答性を最適化できます。この情報は、コンテナの計画と Kubernetes 環境でのスケーラビリティの確保に重要です。

企業向けには、いくつかの人気のある分散トレース ソリューションから選択できます。これらのツールは、追跡データを効果的に収集および視覚化するために必要なツールとインフラストラクチャを提供します。これらのソリューションを K8S デプロイメントに統合することで、マイクロサービスの動作を包括的に可視化し、継続的な改善を推進できます。

3. K8SをAPMソリューションと統合する

K8S で包括的な可観測性を実現するには、環境をアプリケーション パフォーマンス監視 (APM) ソリューションと統合する必要があります。 APM ソリューションは、従来のメトリックやログを超える高度な監視機能を提供し、個々のアプリケーション コンポーネントのパフォーマンスと動作に関する洞察を提供します。

APM 統合の主な利点の 1 つは、K8S アプリケーションのパフォーマンスのボトルネックを検出して診断できることです。

APM ソリューションを使用すると、さまざまなサービスを通過するリクエストを追跡し、レイテンシが高い期間やリソース競合が発生している期間を特定できます。この情報を使用すると、クリティカル パスを最適化し、アプリケーションの全体的なパフォーマンスを向上させるためのターゲットを絞ったアクションを実行できます。

多くの APM ソリューションは、特殊な K8S 統合を提供し、コンテナ化されたアプリケーションの監視と管理を簡素化します。これらの統合により、K8S 環境での APM データのキャプチャと分析を簡素化する、事前構成されたダッシュボード、アラート、ツールのライブラリが提供されます。

4. メトリクスベースのモニタリングを使用する

メトリクスベースのモニタリングは、K8S における可観測性の基盤を形成します。これには、K8S クラスターとアプリケーションの健全性、パフォーマンス、リソース使用率に関する洞察を提供する主要なメトリックの収集と分析が含まれます。

Kubernetes でのメトリックベースの監視に関しては、考慮すべき重要なコンポーネントがいくつかあります。

ノード レベルのメトリック: Kubernetes クラスター内の個々のノードのリソース使用率を監視することは、容量計画とインフラストラクチャの最適化にとって重要です。 CPU 使用率、メモリ使用率、ディスク I/O、ネットワーク帯域幅などのメトリックは、潜在的なリソースのボトルネックを特定し、最適な割り当てを確保するのに役立ちます。

ポッドレベルのメトリクス: ポッドは Kubernetes の基本的なデプロイメント ユニットです。ポッドに関連付けられたメトリックを監視することで、ポッドのリソース消費、健全性、全体的なパフォーマンスを評価できます。主要なポッドレベルのメトリックには、CPU とメモリの使用量、ネットワーク スループット、リクエストの成功率が含まれます。

コンテナ レベルのメトリック: ポッド内のコンテナは、個々のアプリケーション コンポーネントをカプセル化します。コンテナ レベルのメトリックを監視すると、特定のアプリケーション サービスまたはプロセスのリソース消費と動作を理解するのに役立ちます。 CPU 使用率、メモリ使用率、ファイル システム使用率などのメトリックにより、コンテナのパフォーマンスに関する洞察が得られます。

  • アプリケーション固有のメトリック: アプリケーションのニーズに応じて、特定のビジネス ロジックまたは領域のカスタム メトリックを監視する必要がある場合があります。これらのメトリックには、インタラクション率、エラー率、キャッシュ ヒット率、その他の関連するパフォーマンス メトリックが含まれる場合があります。

写真

5. Kubernetesイベントをカスタマイズして可観測性を高める

カスタム イベントは、K8S コンポーネント間、および K8S と外部システム間で通信します。デプロイメント、スケーリング操作、構成の変更、さらにはコンテナ内のアプリケーション固有のイベントなどの重要なイベントを通知できます。

カスタム イベントを活用することで、監視可能性に関していくつかの利点が得られます。

  • プロアクティブな監視: カスタム イベントを使用すると、注意が必要な特定の条件を定義して監視できます。たとえば、リソースが不足しているとき、ポッドに障害が発生したとき、または特定のしきい値を超えたときを示すイベントを作成できます。これらのイベントをキャプチャすることで、問題が拡大する前に積極的に検出して解決することができます。
  • コンテキスト情報: カスタム イベントには、トラブルシューティングと根本原因の分析に役立つ追加のコンテキスト情報が含まれます。エラー メッセージ、タイムスタンプ、影響を受けるリソース、その他のメタデータなどの関連する詳細を添付して、イベントの重要性についての洞察を提供できます。この追加のコンテキストは、問題をより効果的に理解して解決するのに役立ちます。
  • 外部システムとの統合: K8S カスタム イベントは、監視プラットフォームやインシデント管理ツールなどの外部システムで使用できます。これらのシステムを統合すると、特定のイベントに基づいて自動応答や通知をトリガーできるようになります。これにより、インシデント対応プロセスが合理化され、重大な問題がタイムリーに解決されるようになります。

カスタム K8S イベントを使用すると、K8S イベント フックやカスタム コントローラーを使用したり、K8S API を使用してイベント駆動型アプリケーションを開発したりすることもできます。イベント トリガーを定義し、関連情報をキャプチャし、イベントに反応することで、従来の監視アプローチを補完する堅牢な可観測性フレームワークを構築できます。

6. 包括的な監視を統合して、可観測性の積極的な検出を実現する

合成モニタリングは、アプリケーションとの日常的なやり取りを表すユーザーの動作や特定のトランザクションをシミュレートします。これらの合成モニターは、さまざまな場所で定期的に実行するように設定でき、ユーザーの行動をシミュレートし、主要なパフォーマンス指標を測定します。

K8S 環境に合成モニタリングを統合すると、いくつかの重要な利点があります。

  • 事前の問題検出: 合成モニタリングにより、実際のユーザーが影響を受ける前に問題を検出できます。定期的にユーザー操作をシミュレートすることで、劣化したコンポーネント、エラーが発生したコンポーネント、応答しないコンポーネントを特定できます。この早期検出により、問題をプロアクティブに解決し、アプリケーションの高い可用性を維持できます。
  • パフォーマンス ベンチマーク: 合成モニタリングは、パフォーマンス ベンチマークと SLA コンプライアンスのベースラインを提供します。さまざまな場所から一貫したテストを実行することで、通常の状況下での応答時間、待ち時間、可用性を測定できます。これらのベンチマークは、異常を検出し、最適なパフォーマンスを確保するための基準として機能します。
  • ロケーション モニタリング: 合成モニタリングはさまざまな場所から実行するように構成できるため、さまざまなリージョンでのアプリケーションのパフォーマンスに関する詳細な分析情報が得られます。これにより、ユーザー エクスペリエンスに影響を与える可能性のある遅延の問題や場所の違いを特定できます。この情報を使用してアプリのパフォーマンスを最適化することで、世界中で一貫したユーザー エクスペリエンスを確保できます。

専門的なツールを使用して、包括的な監視を K8S 環境に統合できます。これらのツールは、合成モニタリングの作成と展開、パフォーマンス メトリックの監視、レポートの生成を行う機能を提供します。

マイクロサービスベースのアプリケーションで K8S の可観測性を実現する 1 つの方法は、Datadog、Splunk、Middleware、Dynatrace などのサードパーティ ツールを使用することです。これらのツールはメトリックとイベントをキャプチャし、すぐに使用できる複数のレポート、グラフ、アラートを提供して時間を節約します。

7. まとめ

上記の 6 つの戦略を活用することで、K8S 展開の動作とパフォーマンスに対する理解を深めることができます。これらの戦略を実装することで、分散システムに関する包括的な洞察が得られ、効率的なトラブルシューティング、パフォーマンスの最適化、問題のプロアクティブな検出、およびユーザー エクスペリエンスの向上が可能になります。

小規模な K8S 環境を運用する場合でも、複雑なハイブリッド クラウド展開を管理する場合でも、これらの戦略を適用すると、アプリケーションの成功と信頼性が向上します。

オリジナルリンク: https://dzone.com/articles/6-effective-strategies-for-kubernetes-observability

<<:  5 分間の技術講演 |都市プラットフォームにおける Kafka プッシュの実装の分析

>>:  クラウドネイティブの可観測性プラットフォームである OpenObserve の初体験

推薦する

優れたUXデザイナーがすべき5つのこと

[編集者注] この記事は、ブログ「Usability Counts」から @C7210 によって翻訳...

クモがウェブサイトの橋を架けるようになる

スパイダーは最適化担当者にとっての「マスコット」のようなものであり、スパイダーを引き付けて Web ...

サイトに1件のトラフィックしかもたらさないキーワードを無視しないでください

ウェブサイトを構築するとき、私たちは皆、重量とトラフィックを求めます。多くの人は、重量が重いほどトラ...

スタートラインで勝つために競合他社のウェブサイトを調査・分析する

インターネットの発展に伴い、企業間でのオンラインマーケティングがますます普及し、業界間の競争もますま...

オンラインショッピング体験:タオバオのマーケティングサービスは整っておらず、死のリズムです

今日はTaobaoのサービスについてお話したいと思います。きっかけはTaobaoで商品を購入したので...

ネットワークマーケティングについての簡単な説明:QQグループランキングマーケティング

QQをよく使う人にとって、QQグループは馴染みのないものではなく、QQグループの使い方を知っている人...

エッジコンピューティングのセキュリティ上の懸念: ローカル IT の脅威を軽減する

コンピューティング デバイスをデータ ソースの近くに配置することで IT の脅威の状況が変わり、エッ...

メイン、セカンダリ、ボトムナビゲーションリンクを設定してスマートなスパイダーウェブを形成する方法について説明します。

今日のスパイダーは敏感です。注意を払わないと、ウェブサイトが破滅する可能性があります。著者にはウェブ...

アジア太平洋クラウドコンピューティング市場レポート:テンセントがトップ5にランクイン、市場シェアが初めてグーグルを上回る

米国の市場調査会社シナジー・リサーチ・グループは最近、2018年第4四半期および通年の世界のクラウド...

VMware CEOがクラウドコンピューティング開発計画を議論するため初めて中国を訪問

2010 年 3 月 5 日の午後、VMware 社長兼 CEO のポール マリッツは中国訪問中に北...

Dapr の可観測性メトリックとログ

この記事では、インジケーターとログのサポートについて紹介します。索引メトリクスにより、アプリのパフォ...

2018年杭州雲旗が終了し、「新杭州物語」がデジタル中国の未来ビジョンを明らかにした

9月22日、2018年杭州雲奇会議が終了しました。この会議には6大陸81カ国・地域から計12万人が参...

例の議論: キーワードの競争力を判断する方法

キーワードの競争力を判断することは、すべての有能な SEO 担当者にとって必須のスキルの 1 つです...

200億ドルの価値を持つ小紅書は無事に離陸したのか?

11月8日、小紅書は5億ドルの新たな資金調達ラウンドを完了し、投資後の評価額は200億ドルを超えた。...