K8S監視およびアラームプラットフォームの選択に役立つ記事

K8S監視およびアラームプラットフォームの選択に役立つ記事

序文

現在、K8S の監視およびアラーム プラットフォームの選択に取り組んでいます。 2 つの人気のオープン ソース プラットフォーム、kube-prometheus と Nightingale を比較し、私の経験をいくつか共有しました。

kube-プロメテウス

プロジェクトアドレス: https://github.com/prometheus-operator/kube-prometheus

写真

現在、最も広く使用されている k8s 用のオープンソース監視およびアラーム プラットフォームは、Prometheus に基づいており、k8s のさまざまなインジケーターの監視を追加し、カプセル化に Kubernetes Operator を使用しています。ほぼワンクリックで展開できます。デプロイ後、Grafanaにログインして、次の図に示すようにさまざまな指標を確認します。

写真

写真

アドバンテージ

1. Prometheus をベースにした優れたエコシステムで、mysql-exporter や redis-exporter などの関連するオープンソース コンポーネントが多数あります。

2. k8s関連コンポーネントの包括的な監視

3. 大規模なユーザーベース

欠点

1. 展開パッケージのミラーアドレスの一部を変更する必要があります。変更しないと、国内でダウンロードできなくなります。

2. PrometheusデータはPVC経由でマウントする必要があります。そうしないと再起動時にデータが失われます。

3. Grafana の時間を変更する必要があります。デフォルトの時間は UTC 時間です。

4. 監視インジケーターは非常に便利ですが、アラーム設定は比較的弱いです。テンプレートは自分で実装する必要があります。同時に、アラーム通知はFeishu、DingTalk、WeChatなどに接続されていません。幸いなことに、サードパーティの実装があります:PrometheusAlert

5. サードパーティのミドルウェアの監視は面倒であり、統一されたソリューションはありません。たとえば、MySQL を監視する場合は、MySQL Helm パッケージをダウンロードしてデプロイする必要があります。 Redis についても同様です。各ミドルウェアを設定してデプロイする必要があり、少し時間がかかります。

ナイチンゲール

プロジェクトアドレス: https://github.com/ccfos/nightingale

写真

Nightingale Monitoring は、オールインワン設計コンセプトを採用したオープンソースのクラウドネイティブ監視および分析プラットフォームです。データ収集、可視化、監視とアラーム、データ分析を統合します。クラウドネイティブ エコシステムと密接に統合されており、すぐに使用できるエンタープライズ レベルの監視、分析、アラーム機能を提供します。 Nightingale は 2020 年 3 月 20 日に github でバージョン v1 をリリースしました。現在の最新バージョンは V6 です。

Nightingale は、Open-Falcon チームによってクラウド ネイティブに基づいて新たに開発された観測および分析プラットフォームです。これまでの経験をまとめた内容で、とても良い内容だと言えます。 Helm ベースの公式インストール パッケージを迅速に展開できます。アドレスは https://github.com/flashcatcloud/n9e-helm です。

写真

写真

アドバンテージ

1. すぐに使用でき、Docker、Helm Chart、クラウド サービスなどの複数のデプロイメント方法をサポートします。データの収集、監視、警告、視覚化を統合します。

2. 統合監視データの収集。 NightingaleのコレクションエンドはCategrafで、K8、ミドルウェア、サーバー、スイッチなど、何百ものコレクションオブジェクトをカバーしてサポートしています。収集するアドレスを設定するだけで済みます。

写真

3. 完璧なアラーム メカニズム。これは、他のプラットフォームと比較した Nightingale の最大の利点です。シンプルなグラフィカル構成、共通コンポーネント用の組み込みアラームルールを提供し、Feishu、DingTalk、WeChat、電話、電子メール、電報など、さまざまな国内通知メディアをサポートします。

写真

写真

4. Prometheus、Es、Loki、TDengine などの複数のデータ ソースをサポートしているため、kube-prometheus プロジェクトと統合できます。

写真

欠点

1. k8sの監視は比較的弱く、kube-prometheusほど完璧ではなく、対応するコレクションインジケーターを自分で設定する必要がありますが、幸いなことに公式ドキュメントにガイドラインがあります。

2. Grafana のサポートが不十分です。公式サイトでは Grafana レポートのインポートをサポートできると記載されていますが、使用中に互換性がないコンポーネントがいくつか見つかりました。現在も徐々に改良中です。

3. Nightingale からエクスポートされたレポートは、Grafana に直接インポートできません。これはナイチンゲールの商業化においても考慮すべき事項かもしれません。ユーザーに定着させる必要があります。

4. エコシステムは Prometheus+Grafana ほど良くありません。 Prometheus は CNCF によって承認されており、Grafana はすでにデータ視覚化のデフォルトの選択肢となっているため、多くのオープンソース システムがこのソリューションに基づいて実装されています。

要約する

上記では、2 つの監視およびアラーム プラットフォームを比較しました。どちらにも長所と短所があります。ニーズに応じて選択できます。完璧なアラーム管理と Grafana、そして完璧な K8S インジケーター監視が必要な場合は、これら 2 つを組み合わせることができます。現在多くの企業がこれを行っています。

<<:  年末レビュー: 2023 年に注目すべきクラウド セキュリティ スタートアップ 10 社

>>:  Docker コンテナはアプリケーションのコードと依存関係をどのようにパッケージ化するのでしょうか?

推薦する

検索エンジンを使ってSEOを行うためのヒント

私たちはさまざまな SEO テクニックを学ぶことに熱心ですが、最も重要なことを無視しています。SEO...

実践的な共有: 企業ウェブサイトを運営するために必要な 7 つのステップとは

インターネットが私たちの生活に深く浸透するにつれて、インターネットが変えることができる領域はますます...

ユーザーに広告を見て夢中になってもらうにはどうすればいいでしょうか?

月収10万元の起業の夢を実現するミニプログラム起業支援プラン広告やマーケティングは、ユーザーの心に決...

事例分析:企業ウェブサイトのターゲットキーワードの見つけ方

SEO ランキングが必要なウェブサイトの場合、ウェブサイトのキーワードの位置付けが初期段階で不正確で...

Kubernetes を 2500 ノードに拡張する際に発生する問題と解決策

Kubernetes はバージョン 1.6 以降、5,000 を超えるノードをサポートできると主張し...

gfrack: 香港サーバー、e3+20M 帯域幅 399 元、50M 帯域幅 599、8C 香港クラスター 1000 元

gfrack は香港独立サーバー事業(8C 香港クラスターサーバーを含む)を開始しました。マシンは香...

NFV と VNF の現状はどうなっていますか?

ネットワーク機能仮想化 (NFV) は、負荷分散、ゲートウェイ、ファイアウォールなどのハードウェアま...

Baidu Wenkuが審査に合格できなかった主な理由と解決策

Baidu Wenku 内のリンクは重みを直接転送することはできませんが、ユーザーはこのリンクを通じ...

済南小児病院:XEOS は分散オブジェクト アクティブ アクティブ ストレージを構築し、容量とパフォーマンスの両方を実現

各レベルの医療機関における事業の継続的な発展に伴い、さまざまな健康診断のために多数の画像診断装置が病...

新興クラウド技術は、伝染病の予防と制御にどのような貢献をしてきましたか?

最近、各地で流行の第2波の状況がますます深刻になり、世間の注目と白熱した議論を集めています。 201...

武漢 SEO ブログ: ウェブサイトを再構築する際に既存のランキングを保護する方法

最近、武漢 SEO ブログは、パフォーマンスを向上させるためにウェブサイトを再構築してほしいという友...