インフラストラクチャ監視: 課題とベストプラクティス

インフラストラクチャ監視: 課題とベストプラクティス

インフラストラクチャ監視とは、テクノロジー スタック全体のパフォーマンスと可用性の問題を自動的に診断するためのソフトウェア ツールを導入することです。

[[270567]]

インフラストラクチャ監視には、ネットワークの最適化から診断、侵入検知まで、さまざまな用途と問題が含まれます。インフラストラクチャ監視により、ルータがダウンしているかどうか、サーバーが異常な使用率で稼働しているかどうかをスタッフに知らせることができ、適切なセキュリティが確保されていれば、企業データを盗んでいる侵入者を見つけることもできます。

インフラストラクチャ監視はインフラストラクチャ管理をサポートしますが、この 2 つは異なります。インフラストラクチャ管理とは、監視ツールの調査結果に基づいて企業が実行する是正措置です。インフラストラクチャ監視では、社内データセンターからプライベート クラウド、パブリック クラウドまで、IT プラットフォームのさまざまな要素を継続的にチェックできます。

ネットワークがより複雑になり、デバイスの種類が増え、ハイブリッド クラウドが登場するにつれて、ネットワークの整合性の重要性が増します。 SMB 内の基本的なネットワークでもインフラストラクチャの監視を行う必要がありますが、大企業の複雑なシステムでは、インフラストラクチャの監視は運用の重要な部分となります。

インフラストラクチャ監視について学ぶ

日常的な運用の観点から見ると、インフラストラクチャ監視とは、テクノロジー スタック全体のパフォーマンスと可用性の問題を自動的に診断し、問題が重大になる前に検出するためのソフトウェア ツールを導入することです。

「フルスタック」とは、ハードウェア、オペレーティング システム、仮想化環境、ネットワーク、ストレージ、コンピューティング、アプリケーションを指します。大規模なインフラストラクチャのほとんどは複数の場所にまたがり、パブリック クラウドとプライベート クラウドの両方が含まれるため、自動化が重要になり、IT 部門にとって大きな課題が生じます。

この複雑さを考えると、次の理由から自動化が重要です。

  • 自動化は人間よりも速く応答できます。
  • 人間の介入を待つよりも早く問題を処理できます。
  • 企業が応答を正しくプログラムしていれば、自動化によってエラーを減らすことができます。
  • 人間とは異なり、24時間365日活動でき、睡眠を必要としません。

自動化により、組織はサーバーの使用率やネットワーク帯域幅などのしきい値を設定し、ネットワークが設定されたしきい値を超えたり下回ったりした場合の応答をプログラムできます。また、サーバーがフリーズしたり停止したりした場合に自動的に再起動することもできます。

インフラストラクチャの監視には、監視対象デバイスの追加と削除、パフォーマンス、ヘルスの監視、ネットワークとデータの移動の監視、レポート/ログ記録、問題発生時のアラート システムが含まれます。ネットワークのボトルネックに関するアラートは発見されてから 6 時間後には意味がなくなるため、これらはリアルタイムであることが多いです。

インフラストラクチャの監視は、多くの場合、ダッシュボードを通じて行われます。ダッシュボードでは、視覚的なレイアウト (ゲージなど) を通じて、企業のすべての情報が 1 か所に表示されます。画面にリアルタイムの更新が表示され、一定期間にわたってレポートを生成できます。

なぜインフラストラクチャ監視が必要なのでしょうか?

インフラストラクチャ監視により、管理者はインフラストラクチャの状態をリアルタイムで把握するために必要なデータと、組織の目標に向けた進捗状況を測定する機能が提供されます。監視では、インフラストラクチャに関するデータを継続的に収集して確認することにより、ネットワークの現在の状態と進行状況を測定できます。

たとえば、経営陣が一定レベルのネットワーク応答性を達成するという目標を設定している場合、監視ツールを使用すると、応答性に関してネットワークがどの程度の状態にあるのかを表示できます。レイテンシの急増を識別し、おそらく原因も特定できます。

ネットワークが最高の効率で動作することを保証するには、組織が IT インフラストラクチャを構成するデバイスを理解し、それらのデバイスの健全性とパフォーマンスを監視する必要があります。 IT システムをプロアクティブに分析することで、深刻な停止を引き起こす前に差し迫った障害を検出できる可能性が高まります。

適切なインフラストラクチャ管理を行わないと、問題が発生する可能性がある例が数多くあります。一例としては、誰も使用していないままアイドル状態になっている物理サーバーである「ゾンビ サーバー」が挙げられます。 Anthesis Group とスタンフォード大学の研究者による 2017 年の調査では、大規模データセンターのサーバーの 30% がゾンビ サーバー、つまり常時電源が入っているものの何も動作していないサーバーであることが判明しました。これは適切な監視の失敗であり、インフラストラクチャ モニターはこれらのサーバーがトラフィックを生成していないか、サイクルをまったく使用していないことを記録するはずです。

もう 1 つの例は、マルウェアの侵入です。長年にわたり、マルウェアが企業ネットワークに侵入し、企業ネットワークを使用して悪意のあるペイロードを配信したり、スパムをトリガーしたり、分散型サービス拒否 (DDOS) 攻撃を開始したり、ネットワーク トラフィックをスニッフィングして有用な情報を探したりするという話や研究がありました。ここでも、監視が役立ちます。監視により、未知のアプリケーションが何千もの電子メールを送信したり、ロシアのサーバーと通信したりしていることに気付くからです。

インフラストラクチャ監視のベストプラクティス

インフラストラクチャ監視ツールを最大限に活用するためのヒントをいくつか紹介します。

優先順位付け – 最も重要な通知を降順で事前に決定します。これには、電子メールの処理よりも少し時間がかかる場合があります。

アラート解決プロセスを作成する – アラートの種類ごとに、最良かつ最速の解決プロセスを提供する必要があります。繰り返しになりますが、これは CEO に通知する必要があり、スタッフが対応できるため、ビジネス上の優先事項です。

構築するのではなく購入する – 構築するか購入するかは、昔から議論されている IT の問題です。独自に構築するべきか、ベンダーに頼るべきか?この場合、IT システムの複雑さが増すため、監視ツールを購入することをお勧めします。良いニュースは、選択肢がたくさんあることです。

監視システムと警報システムのテスト – 企業は実際の緊急事態の際に初めて警報システムが作動するのを見るべきではないため、システムに何らかの調整が必要になる場合があります。パイロットは、企業が必要に応じてシステムを調整できるようにするのに役立ちます。

詳細かつ包括的なアラートを設定する – 車に「チェック エンジン」ライトが点灯しても、何が問題なのか分からないとイライラします。ここでも同じことが当てはまります。優れたアラートは包括的、詳細、かつ実用的なものでなければなりません。

複数の場所から監視する – 企業に複数のデータ センターがある場合は、各場所からすべてのデータ センターを監視します。 3 つある場合は、A から B と C を監視し、B から A と C を監視します。冗長性により、企業ビジネスの正常な運用が保護されます。

サポートを受ける – 監視ツールのベンダーには、企業を支援するサポート スタッフとコンサルタントがいます。

オンプレミスとクラウドベースの両方の監視ツールを組み合わせて使用​​します。特にハイブリッド クラウド環境の場合は、両方を使用してください。

アラームが鳴らないことは必ずしも良い兆候ではありません。システム障害を意味している可能性があります。これは避けられないことだ。帯域幅が詰まったり、侵害されたりする可能性があります。時々何かが見逃されることがあります。警告が数週間出ないからといって、何も問題がないと決めつけないでください。問題はモニター自体にある可能性があります。

メトリックを定期的に確認する – パフォーマンス メトリックの設定は 1 回限りのことではありません。組織が CPU しきい値を高く設定しすぎているか、ネットワーク帯域幅アラートを狭く設定しすぎている可能性があります。指標は定期的に見直す必要があります。

インフラストラクチャ監視ツール

現在、監視ツールには 2 種類あります。オンプレミスで展開される監視ソフトウェア ツールと、ネットワーク外部から実行される SaaS サーバー監視ツールです。決定はビジネスニーズに基づいて行う必要がありますが、現時点ではネイティブ ツールはほとんど残っていません。ほぼすべてのツールがクラウドに移行しました。

CloudRadar: すべてのサーバー、ホスト、サービスを統合アプリケーションにまとめます。何か問題が発生した場合(停止、容量、パフォーマンスの問題など)、ソフトウェアは電子メール、SMS、Slack、WhatsApp、Telegram、Pushover、Webhook 経由で通知します。

CA Technologies: CA は、DX アプリケーション パフォーマンス管理、DX アプリケーション エクスペリエンス分析、DX インフラストラクチャ マネージャー、ネットワーク運用と分析など、オンプレミスとクラウド向けのさまざまなエンタープライズ クラスのフルスタック監視および管理ソリューションを提供しています。

VMware vRealize Hyperic: 70 を超えるアプリケーション テクノロジから最大 50,000 のメトリックに関するパフォーマンス データを収集し、ハードウェア、オペレーティング システム、アプリケーション、ミドルウェア スタック内のあらゆるコンポーネントを監視します。

New Relic: APM とインフラストラクチャ用の 2 つのアプリケーション。これらを組み合わせると、オンプレミスでもクラウドでも、システムとアプリケーションのパフォーマンスをカバーします。

BMC Digital Enterprise Management: Digital Experience Monitoring (DEM) は、IT 運用、不正な IT アクティビティの監視、メインフレームのメンテナンス、アプリケーションの監視、不正なアプリケーションを含む 6 つのフルスタック監視ソリューションのスイートです。

Dynatrace: 同社は、パフォーマンス管理、運用 AI、クラウド インフラストラクチャ監視、デジタル エクスペリエンス管理のための監視ツールを開発しています。

Opsview: 主力製品であるモニターは、すべての IT 資産とシステム、およびクラウドベースのサービスを単一のビューで提供します。

SolarWinds: 同社の主力製品である Server and Application Monitor (SAM) ツールを使用すると、企業はオンプレミスとクラウドの両方でアプリケーションとサーバー インフラストラクチャの状態、可用性、パフォーマンスを監視できます。 SAM は 1,200 を超えるアプリケーションおよびシステム テンプレートをサポートしており、カスタム アプリケーションや自社開発アプリケーションに簡単に監視を拡張できます。

<<:  支払処理と経費管理を自動化することで、企業は負担を軽減できます。

>>:  VRRP、スタッキング、M-LAG について 3 分で学ぶ

推薦する

BandwagonHostとは?BandwagonHost VPSの紹介

初心者の中には、友人から BandwagonHost について聞いた人もいるかもしれません。Band...

まだオナニーしてるの? WeChatが教育ウェブサイトに与えた影響

2013 年 8 月 9 日の WeChat 5.0 の正式リリース以来、「Shoot the Pl...

アリババクラウドの3人の社長が同じ舞台で対談:10年間の継承とテクノロジーの未開地への参入

9月25日、アリババクラウドの3人の社長、王建、胡暁明、張建鋒が2019年杭州雲奇カンファレンスで素...

百度には現象を通して本質を見るときに従うべきルールがある

Baidu の数回のアップデートにより、SEO 担当者はパニックに陥り、混乱し、しばらくの間、何をす...

特別オファーホスト: ipage - 年間 12 ドルの支払い/ドメイン名の無料登録/無制限の Web サイト構築/無制限のトラフィック

ipage.com の素晴らしいところは、年間 12 ドルで無制限のホスティングが利用でき、ドメイン...

インテルが新しいプロセッサロゴとパフォーマンス評価システムを発表

海外メディアの報道によると、北京時間4月7日正午、インテルはプロセッサの新しいロゴと5つ星の性能評価...

ソフト商品プロモーションとは?ソフト商品プロモーションでは何に注意すべきでしょうか?

多くのウェブマスターがソフト記事のプロモーションを行っていますが、私たちXiaofeng Lotte...

百度シェアはウェブサイトの百度ランキングに影響を与えるだろう

百度は数年前に新製品「百度シェア」を発売しました。これはウェブサイトのスナップショットの背後に表示さ...

中国サイバースペース管理局、ネット上の噂に対抗する対策を展開

新華網、北京、5月2日 - 記者は今日、国家インターネット情報局から、インターネットを利用してデマを...

myserverplanet-$5/kvm/1g メモリ/80g ハードディスク/3T トラフィック/Windows

myserverplanet は、2009 年に設立された小規模なホスティング会社で、イングランドお...

Pacificrack: イースター VPS、年間 14.55 ドル、2G メモリ/2 コア/100g SSD/7T トラフィック

Pacificrack は今年のイースターに安価な VPS をお送りします。これは、Cloudcon...

AWS が新しい Amazon EC2 インスタンスを発表

[51CTO.com からのオリジナル記事] 本日の re:Invent カンファレンスで、AWS ...

SEOポータブルトレンドの提唱者:ウェブサイトを持ち歩くことが主流に

SEO が絶えず進化している今日の世界では、単純な Web サイトではもはやユーザーのニーズを満たす...

poweruphosting-10.5USD/KVM/2IP/1GB RAM/20GB SSD/無制限トラフィック/Gポート/ロサンゼルス

poweruphosting についてご紹介します。2006 年にロサンゼルスで設立され、現在は主に...

alwyzon: 月額 5.79 ユーロ、オーストリアのストレージ VPS、2G メモリ/2 コア/1T ハードディスク/5T トラフィック/2.5Gbps 帯域幅

オーストリアの企業 alwyzon は、ウィーンにデフォルトのデータセンターを備えたストレージ型 V...