K8S監視およびアラームプラットフォームの選択に役立つ記事

K8S監視およびアラームプラットフォームの選択に役立つ記事

序文

現在、K8S の監視およびアラーム プラットフォームの選択に取り組んでいます。 2 つの人気のオープン ソース プラットフォーム、kube-prometheus と Nightingale を比較し、私の経験をいくつか共有しました。

kube-プロメテウス

プロジェクトアドレス: https://github.com/prometheus-operator/kube-prometheus

写真

現在、最も広く使用されている k8s 用のオープンソース監視およびアラーム プラットフォームは、Prometheus に基づいており、k8s のさまざまなインジケーターの監視を追加し、カプセル化に Kubernetes Operator を使用しています。ほぼワンクリックで展開できます。デプロイ後、Grafanaにログインして、次の図に示すようにさまざまな指標を確認します。

写真

写真

アドバンテージ

1. Prometheus をベースにした優れたエコシステムで、mysql-exporter や redis-exporter などの関連するオープンソース コンポーネントが多数あります。

2. k8s関連コンポーネントの包括的な監視

3. 大規模なユーザーベース

欠点

1. 展開パッケージのミラーアドレスの一部を変更する必要があります。変更しないと、国内でダウンロードできなくなります。

2. PrometheusデータはPVC経由でマウントする必要があります。そうしないと再起動時にデータが失われます。

3. Grafana の時間を変更する必要があります。デフォルトの時間は UTC 時間です。

4. 監視インジケーターは非常に便利ですが、アラーム設定は比較的弱いです。テンプレートは自分で実装する必要があります。同時に、アラーム通知はFeishu、DingTalk、WeChatなどに接続されていません。幸いなことに、サードパーティの実装があります:PrometheusAlert

5. サードパーティのミドルウェアの監視は面倒であり、統一されたソリューションはありません。たとえば、MySQL を監視する場合は、MySQL Helm パッケージをダウンロードしてデプロイする必要があります。 Redis についても同様です。各ミドルウェアを設定してデプロイする必要があり、少し時間がかかります。

ナイチンゲール

プロジェクトアドレス: https://github.com/ccfos/nightingale

写真

Nightingale Monitoring は、オールインワン設計コンセプトを採用したオープンソースのクラウドネイティブ監視および分析プラットフォームです。データ収集、可視化、監視とアラーム、データ分析を統合します。クラウドネイティブ エコシステムと密接に統合されており、すぐに使用できるエンタープライズ レベルの監視、分析、アラーム機能を提供します。 Nightingale は 2020 年 3 月 20 日に github でバージョン v1 をリリースしました。現在の最新バージョンは V6 です。

Nightingale は、Open-Falcon チームによってクラウド ネイティブに基づいて新たに開発された観測および分析プラットフォームです。これまでの経験をまとめた内容で、とても良い内容だと言えます。 Helm ベースの公式インストール パッケージを迅速に展開できます。アドレスは https://github.com/flashcatcloud/n9e-helm です。

写真

写真

アドバンテージ

1. すぐに使用でき、Docker、Helm Chart、クラウド サービスなどの複数のデプロイメント方法をサポートします。データの収集、監視、警告、視覚化を統合します。

2. 統合監視データの収集。 NightingaleのコレクションエンドはCategrafで、K8、ミドルウェア、サーバー、スイッチなど、何百ものコレクションオブジェクトをカバーしてサポートしています。収集するアドレスを設定するだけで済みます。

写真

3. 完璧なアラーム メカニズム。これは、他のプラットフォームと比較した Nightingale の最大の利点です。シンプルなグラフィカル構成、共通コンポーネント用の組み込みアラームルールを提供し、Feishu、DingTalk、WeChat、電話、電子メール、電報など、さまざまな国内通知メディアをサポートします。

写真

写真

4. Prometheus、Es、Loki、TDengine などの複数のデータ ソースをサポートしているため、kube-prometheus プロジェクトと統合できます。

写真

欠点

1. k8sの監視は比較的弱く、kube-prometheusほど完璧ではなく、対応するコレクションインジケーターを自分で設定する必要がありますが、幸いなことに公式ドキュメントにガイドラインがあります。

2. Grafana のサポートが不十分です。公式サイトでは Grafana レポートのインポートをサポートできると記載されていますが、使用中に互換性がないコンポーネントがいくつか見つかりました。現在も徐々に改良中です。

3. Nightingale からエクスポートされたレポートは、Grafana に直接インポートできません。これはナイチンゲールの商業化においても考慮すべき事項かもしれません。ユーザーに定着させる必要があります。

4. エコシステムは Prometheus+Grafana ほど良くありません。 Prometheus は CNCF によって承認されており、Grafana はすでにデータ視覚化のデフォルトの選択肢となっているため、多くのオープンソース システムがこのソリューションに基づいて実装されています。

要約する

上記では、2 つの監視およびアラーム プラットフォームを比較しました。どちらにも長所と短所があります。ニーズに応じて選択できます。完璧なアラーム管理と Grafana、そして完璧な K8S インジケーター監視が必要な場合は、これら 2 つを組み合わせることができます。現在多くの企業がこれを行っています。

<<:  年末レビュー: 2023 年に注目すべきクラウド セキュリティ スタートアップ 10 社

>>:  Docker コンテナはアプリケーションのコードと依存関係をどのようにパッケージ化するのでしょうか?

推薦する

Baiduに静かに聞いてください、なぜいつも私のウェブサイトのコンテンツを掲載しないのですか

私は毎日精力的に記事を更新し、ウェブサイトのコンテンツを精力的に更新し、毎分高品質の外部リンクのため...

同じサーバー、同じ業界の検索エンジンにおける不正行為の問題を排除する方法

お金を節約し、検索エンジンのランキングを独占するために、一部のウェブマスターは、1つの業界向けに複数...

オンラインドメイン名の投機的登録は絶え間ない紛争を引き起こし、裁判所は取り消し期限を設定

著名な企業ドメイン名の投機的かつ悪意のある登録は、指定された期間内に取り消されます。重慶市第五中級人...

bitaccel-7 USD/512 MB RAM/500 GB HDD/無制限 VPS/1000 MB ポート

多くの人は、データのバックアップなどのために、大容量のハードドライブを備えた VPS を見つけたいと...

edgenat: 全製品 30% オフ、韓国専用サーバー、10 か月分を 24 か月分、VPS オプション - US AS4837\Korea CN2\US CN2 GIA ネットワーク

edgenatは現在、すべてのVPSと韓国のハイエンド独立サーバーに30%割引と生涯継続割引を提供し...

新たな戦場を見据え、WeChatはQRコード決済を導入するのか?

昨日、インターネットでWeChat決済に関する記事を見ました。正午、淄博明瑞の劉さんが再びWeCha...

小さくて美しい O2O ビジネス事例 8 つ

国内のインターネットは王子たちの戦いのようで、BAT は世界を 3 つに分割し、インターネットのあら...

losangelesvps: 40% 割引コード、ロサンゼルス VPS、1Gbps 帯域幅、無制限トラフィック、Windows 付き

losangelesvps が HostCat にメッセージを送信しました: 公式が HostCat...

マルチクラウドデータガバナンスをより管理しやすく一貫性のあるものにする方法

マルチクラウド環境で運用する組織にとって、データ ガバナンスの複雑さと課題は非常に大きいです。データ...

「百度スナップショット問題に関するいくつかの説明」の解釈

「Baidu スナップショットの問題に関するいくつかの説明」の元のテキストの一部: 「新しくクロール...

企業のウェブサイトはどうすればユーザーを維持できるのでしょうか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています今日、イン...

マーケティングの徹底分析:なぜ Pinduoduo はわずか 3 年で 3 億人のユーザーを獲得できたのか?

月収10万元の起業の夢を実現するミニプログラム起業支援プラン競争が激しいレッドオーシャンで生き残るの...

Leica Cloudはいかがでしょうか?鎮江クラウドサーバーの簡単な評価

ライカクラウド(lcayun)は、国内外の多くのデータセンターでクラウドサーバーと独立サーバー事業を...

「SEO のいくつかの重大な犯罪」を反論する SEO を本当に理解する方法

最近、ある業界のウェブサイトで「SEO のいくつかの重大な犯罪」というタイトルの記事を見ましたが、そ...

ウェブサイトの最適化におけるキーワードの選択は非常に重要です - A5 Webmaster Network

ウェブサイトの最適化において、最初に考慮するのはキーワードの選択です。ほとんどのユーザーは、必要な情...