クラウド コンピューティングの複雑さの中での可観測性を成功させるための 5 つのヒント

クラウド コンピューティングの複雑さの中での可観測性を成功させるための 5 つのヒント

クラウド コンピューティングと急速なデジタル化によって増大した複雑さを制御するための新しい方法を IT リーダーが模索する中、IT 運用における可観測性の概念は 2020 年に注目を集めています。

可観測性は、アプリケーションと豊富なツールの開発に重点を置いている点で IT 監視とは異なり、運用スタッフがソフトウェアの動作や運用環境での動作について有意義な質問をできるようにします。新しい質問をする機能により、IT 部門はアプリケーションの動作に関するさまざまな洞察を得て、顧客にとっての成果を最適化および改善することができます。

[[384508]]

可観測性について考える別の方法は、それが完全にユーザーの視点に基づいているということであり、そのためにはユーザー中心の考え方とアプローチが必要です。従来の(ブラックボックス)監視では、システムが稼働しているかどうかを示すメトリックが提供されますが、可観測性では、システムが実際にビジネス要件とユーザー要件を満たしているかどうかを示すことで、この機能をさらに一歩進めます。

可観測性の実践

可観測性は、次の質問に答えることで、インフラストラクチャ監視のビジネス価値とのより密接なつながりを生み出します。

  • サーバーはオンラインで利用可能ですが、サポートしているアプリケーションはダウンしています。
  • ネットワーク接続は機能していますが、ユーザーのトランザクションが実行されなかったり、Web サイトが予期しない動作をしたりする可能性があります。
  • ウェブサイトは、あるブラウザでは正常に動作しますが、別のブラウザでは動作しません。

ユーザーが不満を言い出したり、より良いサービスを求めて Web サイトやアプリを離れたりする前に、IT 組織はこうした種類の問題を認識する必要があります。これらは顧客や従業員にとって悪い体験であり、コストがかかり安全でないシャドー IT につながる可能性があります。

いずれにしても、可観測性が欠如していると、企業はユーザー満足度の低下とサポートコストの高騰を経験する可能性が高くなります。可観測性には監視に対する最新のアプローチが必要であり、開発者は監視アクティビティを受け入れて参加することでより成功します。

2021 年に可観測性の実践を強化するためのアイデアをいくつか紹介します。

1. 拡張データ

CPU 使用率やネットワーク遅延などの従来のリソース監視メトリックを超えます。すべてのインフラストラクチャ コンポーネントからのログ、トレース、メトリック、アラートを含めて、アプリケーションに関する新たな洞察を得ることができます。

チームは適切なルーティングと通信チャネルを用意し、最適な修復システムに迅速にアクセスしたり、追加の環境を提供したりできる必要があります。

2. 開発原則としての可観測性

可観測性は遅かれ早かれ開発者の仕事の一部になるでしょう。開発者は何かをプログラムして、それを運用スタッフに修正させることができなくなります。アプリケーションの健全性は長い間 IT 運用部門が管理してきましたが、論理的には、アプリケーションの健全性を本当に理解しているのは開発者です。なぜなら、彼らはアプリケーションを構築し、そのコードが本番環境でどのように動作するかを知っているからです。多くの場合、スプリント サイクルの後半で、「このサービスを本番環境でどのように監視すればよいですか?」という質問が寄せられます。

開発チームは実行可能な解決策を急いで探し、最終的に誰かがアプリケーション サーバー上でオープン ソース監視ツールのインスタンスを実行することになりました。これは、可観測性を後付けではなく CI/CD パイプラインの重要なステップにすることで回避できます。

3. 観察のための監視ツールを購入する

APM ツール、または Prometheus などのオープンソース監視ツールは、アプリケーションの通常の操作中に発生する可能性のあるアプリケーション、クライアント側、サーバー側のエラーなどの運用メトリックを測定するのに役立ちます。包括的なデジタル エクスペリエンス管理ツールは、システム出力を理解するための別の方法を提供します。これは、次のような質問に答えるのに役立ちます: ユーザーはこのアプリケーションにアクセスできますか? 使用中にトランザクションが失敗することはありませんか?強力なニッチな監視ツールもいくつかありますが、使いにくく、多くの開発者が持っていないネイティブの監視の専門知識が必要になる場合があります。組織側では、ベンダーの誇大宣伝を無視し、スキル レベル、リソースなどの点で組織に適したツールを採用します。導入と管理が容易である必要があります。

4. ツールを簡素化する

ITOps 組織と DevOps 組織に共通する落とし穴は、重複するツールの増加です。これらのツール間のデータは統合されていないことが多く、そのため、観測可能性戦略をシンプルかつ包括的に実装する作業は非常に困難です。これが、単一の制御を実現するのが非常に難しい理由です。ほとんどの場合、監視および観測ツールは、緊急の問題 (リリースの準備、特定のクライアント エラーのトラブルシューティングなど) を解決するために必要であり、使用されます。時間が経つにつれて、重複するユースケースに対応する 20 を超える監視ツールが組織に導入されることは容易に想像できます。組織は保持しているものを統合し、プラットフォーム ソリューションを使用してすべてのデータを管理および統合し、開発者とオペレーターの時間を節約することを検討する必要があります。

5. エンドユーザーエクスペリエンスの向上

可観測性とそれが解決する問題は、開発者、エンジニア、管理者にとってのみ興味深いものではありません。可観測性ツールによって生成される洞察の多くは、営業、マーケティング、サポート、または専門サービスに携わっている、技術にあまり詳しくない同僚に豊富なコンテキストを提供できます。

例としては次のようなものがあります:

  • あなたのサイトへのトラフィックが最も多いのは、一日のうちのどの時間帯ですか、また一年のうちのどの時間帯ですか?
  • ユーザーが最も頻繁にアクセスする特定の Web ページはありますか?
  • ウェブページを公開または変更した後、トランザクションが増加しましたか?
  • Web ページの読み込みが遅いですか?もしそうなら、何が原因なのでしょうか?

これらの質問に答えることで、非技術系のチームが使用できるツールと、アプリケーション自体に対する必要なより深い理解との間のギャップを埋めることができることがよくあります。 DevOps チームと ITOps チームは、技術に詳しくない関係者と協力して、可観測性ツールが解決できるビジネス上の問題とその解決に最適な方法を理解する必要があります。

<<:  クラウドコンピューティングとエッジコンピューティングがデータセンターに与える影響

>>:  クラウドで自動化を適用する 5 つの方法

推薦する

WordPress ホスティングの推奨事項: WordPress が公式に推奨する専用ホスティング

WordPress を使用してブログを構築している多くの友人は、「どの WordPress ホストが...

WeChatパブリックアカウントのプロモーション、WeChatパブリックアカウントのタイトルスキル!

公開アカウントの運営者として、記事の読者数が少なすぎる場合はどうすればよいでしょうか?記事のタイトル...

推奨: iwstack を再チャージして Prometeus XEN/VPS 1 年/10G バックアップ スペースを取得する

過去に Prometeus が攻撃を受けた際、ターゲット IP を無効化することしかできなかったため...

ウェブサイト成功の秘訣:天山七剣士

すべてのウェブマスターは自分のウェブサイトが成功することを望んでいますが、成功の基準は最終的には影響...

budgetvm-サーバーを1台購入すると1台無料、最大150ドル/4台のコンピュータルーム

budgetvm は、ローエンド サーバー市場で一定の評判や規模を持っています。現在、5,000 台...

ストレージ仮想化技術の実装と比較

ホストベースの仮想ストレージホストベースの仮想ストレージ ホストベースの仮想ストレージは、ストレージ...

gfrack: 春節プロモーション、ロサンゼルス VPS 年間支払い 99 元 (1G 帯域幅)、香港 VPS 年間支払い 199 元 (20M 帯域幅)

gfrack は春節の大きなプロモーションを開始しました。米国ロサンゼルスの QN データセンターの...

複雑さの原因である高可用性についてお話ししましょう

高可用性は、システムが継続的かつ中断なく機能を実行する能力として定義され、システムの可用性を測定する...

インターネットマーケティング: 無視できない企業マーケティングツール

現在、ますます多くの企業が自社のマーケティング手法をインターネットと統合しています。従来のマーケティ...

ビッグデータ時代のデジタル・モバイル・インターネット運用におけるビジネス秘訣!

天猫が発表した数字によると、2015年のダブル11ショッピングフェスティバル後、モバイル取引が68%...

実用的なヒント:商人が望む618のテキストメッセージを送信するための完全なガイド

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています618 電...

あらゆるクラウドで実行: クラウドの移植性を検討しましたか?

クラウド ポータビリティは、スケーラブルで回復力のあるクラウド ネイティブ アプリケーションを構築す...

実際の事例:ウェブサイトのホームページが1週間ブロックされ、その後回復した

医療系サイトの場合、ホームページが削除され、ランキングが下がった場合の損失は想像に難くありませんが、...