インフラストラクチャ監視: 課題とベストプラクティス

インフラストラクチャ監視: 課題とベストプラクティス

インフラストラクチャ監視とは、テクノロジー スタック全体のパフォーマンスと可用性の問題を自動的に診断するためのソフトウェア ツールを導入することです。

[[270567]]

インフラストラクチャ監視には、ネットワークの最適化から診断、侵入検知まで、さまざまな用途と問題が含まれます。インフラストラクチャ監視により、ルータがダウンしているかどうか、サーバーが異常な使用率で稼働しているかどうかをスタッフに知らせることができ、適切なセキュリティが確保されていれば、企業データを盗んでいる侵入者を見つけることもできます。

インフラストラクチャ監視はインフラストラクチャ管理をサポートしますが、この 2 つは異なります。インフラストラクチャ管理とは、監視ツールの調査結果に基づいて企業が実行する是正措置です。インフラストラクチャ監視では、社内データセンターからプライベート クラウド、パブリック クラウドまで、IT プラットフォームのさまざまな要素を継続的にチェックできます。

ネットワークがより複雑になり、デバイスの種類が増え、ハイブリッド クラウドが登場するにつれて、ネットワークの整合性の重要性が増します。 SMB 内の基本的なネットワークでもインフラストラクチャの監視を行う必要がありますが、大企業の複雑なシステムでは、インフラストラクチャの監視は運用の重要な部分となります。

インフラストラクチャ監視について学ぶ

日常的な運用の観点から見ると、インフラストラクチャ監視とは、テクノロジー スタック全体のパフォーマンスと可用性の問題を自動的に診断し、問題が重大になる前に検出するためのソフトウェア ツールを導入することです。

「フルスタック」とは、ハードウェア、オペレーティング システム、仮想化環境、ネットワーク、ストレージ、コンピューティング、アプリケーションを指します。大規模なインフラストラクチャのほとんどは複数の場所にまたがり、パブリック クラウドとプライベート クラウドの両方が含まれるため、自動化が重要になり、IT 部門にとって大きな課題が生じます。

この複雑さを考えると、次の理由から自動化が重要です。

  • 自動化は人間よりも速く応答できます。
  • 人間の介入を待つよりも早く問題を処理できます。
  • 企業が応答を正しくプログラムしていれば、自動化によってエラーを減らすことができます。
  • 人間とは異なり、24時間365日活動でき、睡眠を必要としません。

自動化により、組織はサーバーの使用率やネットワーク帯域幅などのしきい値を設定し、ネットワークが設定されたしきい値を超えたり下回ったりした場合の応答をプログラムできます。また、サーバーがフリーズしたり停止したりした場合に自動的に再起動することもできます。

インフラストラクチャの監視には、監視対象デバイスの追加と削除、パフォーマンス、ヘルスの監視、ネットワークとデータの移動の監視、レポート/ログ記録、問題発生時のアラート システムが含まれます。ネットワークのボトルネックに関するアラートは発見されてから 6 時間後には意味がなくなるため、これらはリアルタイムであることが多いです。

インフラストラクチャの監視は、多くの場合、ダッシュボードを通じて行われます。ダッシュボードでは、視覚的なレイアウト (ゲージなど) を通じて、企業のすべての情報が 1 か所に表示されます。画面にリアルタイムの更新が表示され、一定期間にわたってレポートを生成できます。

なぜインフラストラクチャ監視が必要なのでしょうか?

インフラストラクチャ監視により、管理者はインフラストラクチャの状態をリアルタイムで把握するために必要なデータと、組織の目標に向けた進捗状況を測定する機能が提供されます。監視では、インフラストラクチャに関するデータを継続的に収集して確認することにより、ネットワークの現在の状態と進行状況を測定できます。

たとえば、経営陣が一定レベルのネットワーク応答性を達成するという目標を設定している場合、監視ツールを使用すると、応答性に関してネットワークがどの程度の状態にあるのかを表示できます。レイテンシの急増を識別し、おそらく原因も特定できます。

ネットワークが最高の効率で動作することを保証するには、組織が IT インフラストラクチャを構成するデバイスを理解し、それらのデバイスの健全性とパフォーマンスを監視する必要があります。 IT システムをプロアクティブに分析することで、深刻な停止を引き起こす前に差し迫った障害を検出できる可能性が高まります。

適切なインフラストラクチャ管理を行わないと、問題が発生する可能性がある例が数多くあります。一例としては、誰も使用していないままアイドル状態になっている物理サーバーである「ゾンビ サーバー」が挙げられます。 Anthesis Group とスタンフォード大学の研究者による 2017 年の調査では、大規模データセンターのサーバーの 30% がゾンビ サーバー、つまり常時電源が入っているものの何も動作していないサーバーであることが判明しました。これは適切な監視の失敗であり、インフラストラクチャ モニターはこれらのサーバーがトラフィックを生成していないか、サイクルをまったく使用していないことを記録するはずです。

もう 1 つの例は、マルウェアの侵入です。長年にわたり、マルウェアが企業ネットワークに侵入し、企業ネットワークを使用して悪意のあるペイロードを配信したり、スパムをトリガーしたり、分散型サービス拒否 (DDOS) 攻撃を開始したり、ネットワーク トラフィックをスニッフィングして有用な情報を探したりするという話や研究がありました。ここでも、監視が役立ちます。監視により、未知のアプリケーションが何千もの電子メールを送信したり、ロシアのサーバーと通信したりしていることに気付くからです。

インフラストラクチャ監視のベストプラクティス

インフラストラクチャ監視ツールを最大限に活用するためのヒントをいくつか紹介します。

優先順位付け – 最も重要な通知を降順で事前に決定します。これには、電子メールの処理よりも少し時間がかかる場合があります。

アラート解決プロセスを作成する – アラートの種類ごとに、最良かつ最速の解決プロセスを提供する必要があります。繰り返しになりますが、これは CEO に通知する必要があり、スタッフが対応できるため、ビジネス上の優先事項です。

構築するのではなく購入する – 構築するか購入するかは、昔から議論されている IT の問題です。独自に構築するべきか、ベンダーに頼るべきか?この場合、IT システムの複雑さが増すため、監視ツールを購入することをお勧めします。良いニュースは、選択肢がたくさんあることです。

監視システムと警報システムのテスト – 企業は実際の緊急事態の際に初めて警報システムが作動するのを見るべきではないため、システムに何らかの調整が必要になる場合があります。パイロットは、企業が必要に応じてシステムを調整できるようにするのに役立ちます。

詳細かつ包括的なアラートを設定する – 車に「チェック エンジン」ライトが点灯しても、何が問題なのか分からないとイライラします。ここでも同じことが当てはまります。優れたアラートは包括的、詳細、かつ実用的なものでなければなりません。

複数の場所から監視する – 企業に複数のデータ センターがある場合は、各場所からすべてのデータ センターを監視します。 3 つある場合は、A から B と C を監視し、B から A と C を監視します。冗長性により、企業ビジネスの正常な運用が保護されます。

サポートを受ける – 監視ツールのベンダーには、企業を支援するサポート スタッフとコンサルタントがいます。

オンプレミスとクラウドベースの両方の監視ツールを組み合わせて使用​​します。特にハイブリッド クラウド環境の場合は、両方を使用してください。

アラームが鳴らないことは必ずしも良い兆候ではありません。システム障害を意味している可能性があります。これは避けられないことだ。帯域幅が詰まったり、侵害されたりする可能性があります。時々何かが見逃されることがあります。警告が数週間出ないからといって、何も問題がないと決めつけないでください。問題はモニター自体にある可能性があります。

メトリックを定期的に確認する – パフォーマンス メトリックの設定は 1 回限りのことではありません。組織が CPU しきい値を高く設定しすぎているか、ネットワーク帯域幅アラートを狭く設定しすぎている可能性があります。指標は定期的に見直す必要があります。

インフラストラクチャ監視ツール

現在、監視ツールには 2 種類あります。オンプレミスで展開される監視ソフトウェア ツールと、ネットワーク外部から実行される SaaS サーバー監視ツールです。決定はビジネスニーズに基づいて行う必要がありますが、現時点ではネイティブ ツールはほとんど残っていません。ほぼすべてのツールがクラウドに移行しました。

CloudRadar: すべてのサーバー、ホスト、サービスを統合アプリケーションにまとめます。何か問題が発生した場合(停止、容量、パフォーマンスの問題など)、ソフトウェアは電子メール、SMS、Slack、WhatsApp、Telegram、Pushover、Webhook 経由で通知します。

CA Technologies: CA は、DX アプリケーション パフォーマンス管理、DX アプリケーション エクスペリエンス分析、DX インフラストラクチャ マネージャー、ネットワーク運用と分析など、オンプレミスとクラウド向けのさまざまなエンタープライズ クラスのフルスタック監視および管理ソリューションを提供しています。

VMware vRealize Hyperic: 70 を超えるアプリケーション テクノロジから最大 50,000 のメトリックに関するパフォーマンス データを収集し、ハードウェア、オペレーティング システム、アプリケーション、ミドルウェア スタック内のあらゆるコンポーネントを監視します。

New Relic: APM とインフラストラクチャ用の 2 つのアプリケーション。これらを組み合わせると、オンプレミスでもクラウドでも、システムとアプリケーションのパフォーマンスをカバーします。

BMC Digital Enterprise Management: Digital Experience Monitoring (DEM) は、IT 運用、不正な IT アクティビティの監視、メインフレームのメンテナンス、アプリケーションの監視、不正なアプリケーションを含む 6 つのフルスタック監視ソリューションのスイートです。

Dynatrace: 同社は、パフォーマンス管理、運用 AI、クラウド インフラストラクチャ監視、デジタル エクスペリエンス管理のための監視ツールを開発しています。

Opsview: 主力製品であるモニターは、すべての IT 資産とシステム、およびクラウドベースのサービスを単一のビューで提供します。

SolarWinds: 同社の主力製品である Server and Application Monitor (SAM) ツールを使用すると、企業はオンプレミスとクラウドの両方でアプリケーションとサーバー インフラストラクチャの状態、可用性、パフォーマンスを監視できます。 SAM は 1,200 を超えるアプリケーションおよびシステム テンプレートをサポートしており、カスタム アプリケーションや自社開発アプリケーションに簡単に監視を拡張できます。

<<:  支払処理と経費管理を自動化することで、企業は負担を軽減できます。

>>:  VRRP、スタッキング、M-LAG について 3 分で学ぶ

推薦する

実践的な共有: 外部リンクをクエリする方法

昨日の作業を確認するのは本当に面倒です。外部リンクを少し投稿しただけならいいのですが、たくさん投稿し...

WeChat Momentsに広告を掲載している携帯電話ブランド、ゲーム、観光産業の例!

1. 携帯電話ブランドケーススタディ: WeChat モーメント広告は、WeChat パブリックアカ...

セキュリティ分野でクラウドコンピューティングができること、できないこと

今日の IT 時代では、セキュリティ問題についてあまり気にしないユーザーもいます。確かに、セキュリテ...

ただし、ほとんどのオプションは役に立ちません。

オプションは、取引可能なデリバティブ金融商品の一種です。簡単に言えば、オプションとは、一定期間内の取...

SEO リーダーはどのようにして効率的なチームを構築すべきでしょうか?

シニア SEO として、まだシニア SEO でない場合は、シニア SEO になるための夢と準備も必要...

推奨: vexxhost-openstack/$5/2 コア/512m メモリ/20g SSD/2T トラフィック/カナダ

Vexxhost は、7 年間運営している企業で、VPS 構成をアップグレードおよび増加し、価格を下...

検索環境が再び変化しました。ウェブマスターの運用上の考え方はどのように変革すべきでしょうか?

インターネット技術の世界では、理解するのが本当に難しいことが時々ある。かつて360とのスキャンダルに...

ウェブマスターのユーザーエクスペリエンスに対する理解は時代に合わせていく必要がある

ウェブサイトが Baidu で良いランキングを獲得するにはどうすればよいでしょうか? この質問に対す...

Linode-13周年、VPS価格は据え置き、メモリは「なんとも言えないほど」倍増

Linode.com は、今年で 13 周年を迎えたと発表しました。これまでとは異なり、同社はお金を...

locvpsはどうですか?香港大埔データセンターのVPSテストデータの共有

locvps は香港の大埔で香港 VPS や香港独立サーバー事業など、独自の事業を展開しています。公...

仮想ホスティングとクラウドサーバーのどちらが優れていますか?エンタープライズ Web サイト サーバーの購入に関するヒントは何ですか?

企業の Web サイトを構築する場合、最初に取り組む必要があるのはサーバーの選択です。市場におけるウ...

サウジアラビアのVPSの推奨、いくつかの人気のある「サウジアラビアのVPSクラウドサーバー」販売業者

サウジアラビアは中東の国です。サウジアラビアの VPS、サウジアラビアのクラウド サーバー、サウジア...

申し訳ありませんが、インターネット上で見つかったすべての Redis 分散ロックには脆弱性があります。

Redis ベースの分散ロックは誰もが知っているものですが、分散ロックが失敗したことはありますか?障...

私は SEO 市場でクライアントを探しています。あなたはどうですか?

ネットワーク関係者というのは、私が今自分につけている肩書きです。インターネットマーケティングプランナ...

ファーウェイクラウドがSIP Expoでデビュー、製薬・ヘルスケア業界のデジタル変革に向けた提案を提供

2021年9月23日、第14回中国健康産業(国際)生態会議(以下、「中国健康産業(国際)生態会議」)...