インフラストラクチャ監視: 課題とベストプラクティス

インフラストラクチャ監視: 課題とベストプラクティス

インフラストラクチャ監視とは、テクノロジー スタック全体のパフォーマンスと可用性の問題を自動的に診断するためのソフトウェア ツールを導入することです。

[[270567]]

インフラストラクチャ監視には、ネットワークの最適化から診断、侵入検知まで、さまざまな用途と問題が含まれます。インフラストラクチャ監視により、ルータがダウンしているかどうか、サーバーが異常な使用率で稼働しているかどうかをスタッフに知らせることができ、適切なセキュリティが確保されていれば、企業データを盗んでいる侵入者を見つけることもできます。

インフラストラクチャ監視はインフラストラクチャ管理をサポートしますが、この 2 つは異なります。インフラストラクチャ管理とは、監視ツールの調査結果に基づいて企業が実行する是正措置です。インフラストラクチャ監視では、社内データセンターからプライベート クラウド、パブリック クラウドまで、IT プラットフォームのさまざまな要素を継続的にチェックできます。

ネットワークがより複雑になり、デバイスの種類が増え、ハイブリッド クラウドが登場するにつれて、ネットワークの整合性の重要性が増します。 SMB 内の基本的なネットワークでもインフラストラクチャの監視を行う必要がありますが、大企業の複雑なシステムでは、インフラストラクチャの監視は運用の重要な部分となります。

インフラストラクチャ監視について学ぶ

日常的な運用の観点から見ると、インフラストラクチャ監視とは、テクノロジー スタック全体のパフォーマンスと可用性の問題を自動的に診断し、問題が重大になる前に検出するためのソフトウェア ツールを導入することです。

「フルスタック」とは、ハードウェア、オペレーティング システム、仮想化環境、ネットワーク、ストレージ、コンピューティング、アプリケーションを指します。大規模なインフラストラクチャのほとんどは複数の場所にまたがり、パブリック クラウドとプライベート クラウドの両方が含まれるため、自動化が重要になり、IT 部門にとって大きな課題が生じます。

この複雑さを考えると、次の理由から自動化が重要です。

  • 自動化は人間よりも速く応答できます。
  • 人間の介入を待つよりも早く問題を処理できます。
  • 企業が応答を正しくプログラムしていれば、自動化によってエラーを減らすことができます。
  • 人間とは異なり、24時間365日活動でき、睡眠を必要としません。

自動化により、組織はサーバーの使用率やネットワーク帯域幅などのしきい値を設定し、ネットワークが設定されたしきい値を超えたり下回ったりした場合の応答をプログラムできます。また、サーバーがフリーズしたり停止したりした場合に自動的に再起動することもできます。

インフラストラクチャの監視には、監視対象デバイスの追加と削除、パフォーマンス、ヘルスの監視、ネットワークとデータの移動の監視、レポート/ログ記録、問題発生時のアラート システムが含まれます。ネットワークのボトルネックに関するアラートは発見されてから 6 時間後には意味がなくなるため、これらはリアルタイムであることが多いです。

インフラストラクチャの監視は、多くの場合、ダッシュボードを通じて行われます。ダッシュボードでは、視覚的なレイアウト (ゲージなど) を通じて、企業のすべての情報が 1 か所に表示されます。画面にリアルタイムの更新が表示され、一定期間にわたってレポートを生成できます。

なぜインフラストラクチャ監視が必要なのでしょうか?

インフラストラクチャ監視により、管理者はインフラストラクチャの状態をリアルタイムで把握するために必要なデータと、組織の目標に向けた進捗状況を測定する機能が提供されます。監視では、インフラストラクチャに関するデータを継続的に収集して確認することにより、ネットワークの現在の状態と進行状況を測定できます。

たとえば、経営陣が一定レベルのネットワーク応答性を達成するという目標を設定している場合、監視ツールを使用すると、応答性に関してネットワークがどの程度の状態にあるのかを表示できます。レイテンシの急増を識別し、おそらく原因も特定できます。

ネットワークが最高の効率で動作することを保証するには、組織が IT インフラストラクチャを構成するデバイスを理解し、それらのデバイスの健全性とパフォーマンスを監視する必要があります。 IT システムをプロアクティブに分析することで、深刻な停止を引き起こす前に差し迫った障害を検出できる可能性が高まります。

適切なインフラストラクチャ管理を行わないと、問題が発生する可能性がある例が数多くあります。一例としては、誰も使用していないままアイドル状態になっている物理サーバーである「ゾンビ サーバー」が挙げられます。 Anthesis Group とスタンフォード大学の研究者による 2017 年の調査では、大規模データセンターのサーバーの 30% がゾンビ サーバー、つまり常時電源が入っているものの何も動作していないサーバーであることが判明しました。これは適切な監視の失敗であり、インフラストラクチャ モニターはこれらのサーバーがトラフィックを生成していないか、サイクルをまったく使用していないことを記録するはずです。

もう 1 つの例は、マルウェアの侵入です。長年にわたり、マルウェアが企業ネットワークに侵入し、企業ネットワークを使用して悪意のあるペイロードを配信したり、スパムをトリガーしたり、分散型サービス拒否 (DDOS) 攻撃を開始したり、ネットワーク トラフィックをスニッフィングして有用な情報を探したりするという話や研究がありました。ここでも、監視が役立ちます。監視により、未知のアプリケーションが何千もの電子メールを送信したり、ロシアのサーバーと通信したりしていることに気付くからです。

インフラストラクチャ監視のベストプラクティス

インフラストラクチャ監視ツールを最大限に活用するためのヒントをいくつか紹介します。

優先順位付け – 最も重要な通知を降順で事前に決定します。これには、電子メールの処理よりも少し時間がかかる場合があります。

アラート解決プロセスを作成する – アラートの種類ごとに、最良かつ最速の解決プロセスを提供する必要があります。繰り返しになりますが、これは CEO に通知する必要があり、スタッフが対応できるため、ビジネス上の優先事項です。

構築するのではなく購入する – 構築するか購入するかは、昔から議論されている IT の問題です。独自に構築するべきか、ベンダーに頼るべきか?この場合、IT システムの複雑さが増すため、監視ツールを購入することをお勧めします。良いニュースは、選択肢がたくさんあることです。

監視システムと警報システムのテスト – 企業は実際の緊急事態の際に初めて警報システムが作動するのを見るべきではないため、システムに何らかの調整が必要になる場合があります。パイロットは、企業が必要に応じてシステムを調整できるようにするのに役立ちます。

詳細かつ包括的なアラートを設定する – 車に「チェック エンジン」ライトが点灯しても、何が問題なのか分からないとイライラします。ここでも同じことが当てはまります。優れたアラートは包括的、詳細、かつ実用的なものでなければなりません。

複数の場所から監視する – 企業に複数のデータ センターがある場合は、各場所からすべてのデータ センターを監視します。 3 つある場合は、A から B と C を監視し、B から A と C を監視します。冗長性により、企業ビジネスの正常な運用が保護されます。

サポートを受ける – 監視ツールのベンダーには、企業を支援するサポート スタッフとコンサルタントがいます。

オンプレミスとクラウドベースの両方の監視ツールを組み合わせて使用​​します。特にハイブリッド クラウド環境の場合は、両方を使用してください。

アラームが鳴らないことは必ずしも良い兆候ではありません。システム障害を意味している可能性があります。これは避けられないことだ。帯域幅が詰まったり、侵害されたりする可能性があります。時々何かが見逃されることがあります。警告が数週間出ないからといって、何も問題がないと決めつけないでください。問題はモニター自体にある可能性があります。

メトリックを定期的に確認する – パフォーマンス メトリックの設定は 1 回限りのことではありません。組織が CPU しきい値を高く設定しすぎているか、ネットワーク帯域幅アラートを狭く設定しすぎている可能性があります。指標は定期的に見直す必要があります。

インフラストラクチャ監視ツール

現在、監視ツールには 2 種類あります。オンプレミスで展開される監視ソフトウェア ツールと、ネットワーク外部から実行される SaaS サーバー監視ツールです。決定はビジネスニーズに基づいて行う必要がありますが、現時点ではネイティブ ツールはほとんど残っていません。ほぼすべてのツールがクラウドに移行しました。

CloudRadar: すべてのサーバー、ホスト、サービスを統合アプリケーションにまとめます。何か問題が発生した場合(停止、容量、パフォーマンスの問題など)、ソフトウェアは電子メール、SMS、Slack、WhatsApp、Telegram、Pushover、Webhook 経由で通知します。

CA Technologies: CA は、DX アプリケーション パフォーマンス管理、DX アプリケーション エクスペリエンス分析、DX インフラストラクチャ マネージャー、ネットワーク運用と分析など、オンプレミスとクラウド向けのさまざまなエンタープライズ クラスのフルスタック監視および管理ソリューションを提供しています。

VMware vRealize Hyperic: 70 を超えるアプリケーション テクノロジから最大 50,000 のメトリックに関するパフォーマンス データを収集し、ハードウェア、オペレーティング システム、アプリケーション、ミドルウェア スタック内のあらゆるコンポーネントを監視します。

New Relic: APM とインフラストラクチャ用の 2 つのアプリケーション。これらを組み合わせると、オンプレミスでもクラウドでも、システムとアプリケーションのパフォーマンスをカバーします。

BMC Digital Enterprise Management: Digital Experience Monitoring (DEM) は、IT 運用、不正な IT アクティビティの監視、メインフレームのメンテナンス、アプリケーションの監視、不正なアプリケーションを含む 6 つのフルスタック監視ソリューションのスイートです。

Dynatrace: 同社は、パフォーマンス管理、運用 AI、クラウド インフラストラクチャ監視、デジタル エクスペリエンス管理のための監視ツールを開発しています。

Opsview: 主力製品であるモニターは、すべての IT 資産とシステム、およびクラウドベースのサービスを単一のビューで提供します。

SolarWinds: 同社の主力製品である Server and Application Monitor (SAM) ツールを使用すると、企業はオンプレミスとクラウドの両方でアプリケーションとサーバー インフラストラクチャの状態、可用性、パフォーマンスを監視できます。 SAM は 1,200 を超えるアプリケーションおよびシステム テンプレートをサポートしており、カスタム アプリケーションや自社開発アプリケーションに簡単に監視を拡張できます。

<<:  支払処理と経費管理を自動化することで、企業は負担を軽減できます。

>>:  VRRP、スタッキング、M-LAG について 3 分で学ぶ

推薦する

、WeChatでお金を稼ぐための基本的な公式

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス01草の根起業家が成功す...

簡単な説明: 1 週間で新しいウェブサイトのキーワードをホームページに表示する方法

以前、著者のXiaodanの近くでインターネットマーケティングサミットがありました。そのサミットで、...

中小規模の販売業者が陥りやすい検索トラップ

中小規模の販売者にとって、ダイヤモンドブースを設置する資金があまりない場合、電車やタオバオの顧客を通...

2020年はクラウドコンピューティングの年

年末から年明けにかけて、2020年を振り返ると、「新型コロナ流行」は私たちにとって忘れられない思い出...

bigbrainglobal-$35/X3440/8g メモリ/4T ハードディスク/10T トラフィック/G ポート/IPMI/ノースカロライナ

bigbrainglobal.com は、バージニア州に拠点を置く正式に登録されたホスティング会社で...

inxy: 世界26の国と地域で「専用サーバー」やVPS、CDNサービスを超低価格で運営

INXY についてご紹介します。2005 年に設立され、「キプロス共和国」に登録されています。主に独...

SEO の犠牲になった人は何人いるでしょうか?

SEO 初心者、あるいは永遠に SEO 初心者である人々がいます。彼らは目覚めない限り、決して成長で...

推奨: vpsnet - 10% オフ、メモリ「説明できない」時間/XEN/ONAPP

感謝祭、ブラックフライデー、サイバーマンデーが重なるので、プロモーションには最適な時期です。まだ素晴...

#blackfriday# raksmart - 900 元/香港専用サーバー/E3-1230/16G/1T/無制限トラフィック

raksmart では、ブラックフライデー プロモーションとして、香港独立サーバー事前予約イベントも...

私は自分のニッチを誇りに思っています。インターネットニッチ製品にも独自の春があります

ニッチ製品の将来については楽観的ではないと言う人もいます。一部のニッチ製品の創造性とデザインを心から...

経済学者の郎先平が分析:なぜタオグンは人気があるのか​​?

今年の「ダブル11」の24時間で、タオバオとアリペイの売上高は合計191億元に達し、そのうち天猫(タ...

クラウド技術特許出願ランキングが発表され、テンセント、アリババ、360がトップ3にランクイン!

1月10日、知的財産出版社i Think Tankは「中国インターネットクラウド技術特許分析レポート...

新たな常態がレノボを持続可能な成長サイクルへと導く

2月3日、レノボグループは2020/21会計年度の第3四半期決算を発表し、春節が近づく中、素晴らしい...

ブランド マーケティング: 製品のセールス ポイントを見つける 4 つのステップ!

誰もが同じ疑問を抱いています。「製品をもっとよく売るにはどうすればいいでしょうか?」より良い買い物を...

マイクロビジネス「血に染まった」小紅書

小紅書が厳選したブランドの「白くてお金持ちで美しい」セレブたちは、華やかなアウターを脱ぐと、実は潜在...