Alibaba Cloudの可観測性に関する考え方と実践

Alibaba Cloudの可観測性に関する考え方と実践

ゲスト丨周小凡

編纂者:Qianshan

校正:Yun Zhao

クラウドネイティブ アーキテクチャの実装が始まるにつれて、アプリケーション アーキテクチャはモノリシック システムからマイクロサービスへと徐々に変化してきました。可観測性がクラウドネイティブのインフラストラクチャおよび必須の機能になっていることに気付く企業が増えています。

では、最近よく言われる「可観測性」と「モニタリング」「APM」などの用語の違いは何でしょうか?最近、51CTOはAlibaba Cloudのシニア技術専門家である周小凡氏を特別に招待し、観測可能技術の進化などのテーマについてインタビューを行いました。

51CTO: 可観測性はなぜ必要なのでしょうか?クラウドネイティブ時代の必然の産物なのでしょうか?

周 小凡:可観測性は新しい用語ではなく、クラウドネイティブ時代に再び言及されるのは避けられません。クラウドネイティブアーキテクチャが提唱するマイクロサービスやDevOpsモデルは、効率性と可用性の向上と複雑性の増大をもたらし、強化された可観測性が複雑性を軽減する唯一の手段となっています。従来の監視方法では受動的にしか問題を発見できませんが、可観測性では問題を発見するだけでなく、問題現象の背後にある本質を明確に説明する必要があります。可観測性の背後にあるインジケーター、ログ、イベント、リンク データ、診断ツールを組み合わせて使用​​することで、予防的予防、プロセス内処理、イベント後のレビューのための重要な意思決定の基盤が提供されます。可観測性はインフラストラクチャ自動化の基礎であり、優れた可観測性はクラウドネイティブのメリットを効率的に実現するための前提条件です。

業界では「APM は終わり、可観測性が到来した」という言い伝えがよくありますが、私はそれにはあまり同意しません。それどころか、APM という製品形態は、従来の監視をベースにした「進化の第一波」を達成し、アプリケーション層で観測性の 3 つの柱 (インジケーター、リンク、ログ) を統合するというベストプラクティスを初めて実現したと考えています。

クラウド ネイティブ時代の可観測性とは、APM 製品のいくつかの従来のテクノロジーと概念をクラウド全体の技術アーキテクチャと組織にアップグレード、拡張、一般化し、より緊密なコラボレーションを促進し、より多くのシナリオをカバーし、より大きな価値を生み出すことです。企業のデジタル変革により、ビジネスの成否はITインフラの安定性とますます密接に関係するようになり、ビジネスのオンライン化によりユーザーエクスペリエンスの重要性が浮き彫りになりました。開発の歴史が示すように、可観測性は新しい概念ではなく、常にあらゆるところに存在していました。クラウド時代では、あらゆる場所に散在する観測可能なデータが継続的に接続されるため、問題の特定と検出、セキュリティ リスクの特定からグローバルなコスト管理、安定性ガバナンス、さらにはビジネスの成長に至るまで、すべてが観測可能なテクノロジーとデータに依存します。可観測性は、企業の IT ガバナンスのレベルを測定するための重要な指標となっています。

今日誰もが期待している「可観測性製品」のほとんどは、実際には前世代の APM 製品に基づく「進化の第 2 波」です。大量の観測可能なデータを保存および計算し、アプリケーション中心であり、ビジネスの成功と失敗をユーザー エクスペリエンスに上位からリンクし、インフラストラクチャとクラウド サービスの監視を下位までカバーし、IT の安定性以外の複数のコア要求をワンストップで満たす能力が必要です。

マイクロサービスにおける可観測性の課題

51CTO: マイクロサービスで可観測性機能を構築する上での難しさは何ですか?

周小凡:システムの可観測性と障害の根本原因分析は、運用と保守のシナリオとして重要です。システム アーキテクチャ、リソース ユニット、リソース取得方法、通信方法が進化するにつれて、大きな課題に直面します。これらの課題により、可観測性関連のテクノロジーの開発も求められています。マイクロサービスを例に挙げてみましょう。

Spring Cloud や Dubbo などの一般的なマイクロサービス フレームワークが広く使用されるようになり、初期のマシン中心のクラウド サーバー ECS クラウドからコンテナー中心のコンテナー化されたクラウド ネイティブ展開まで、マイクロサービス アーキテクチャの採用が拡大し続けています。より俊敏性を高めるために、アプリケーションを中核とするマイクロサービスが始まりました。クラウド ネイティブ環境におけるマイクロサービスの可観測性には、主に 3 つの課題があります。

  • 検出が困難: クラウド サーバー ECS からコンテナー Kubernetes まで、マイクロサービス アーキテクチャの複雑さが増し、監視対象オブジェクトの複雑さが増し、監視データの範囲が不完全になっています。
  • 難しい位置付け: さまざまなガバナンス機能が深まるにつれて、可観測性の要件が高まり、サービス フレームワークの複雑さが増し、技術的な障壁が高まり、データ自体の複雑さが増し、データの相関性が低下します。
  • 不十分なコラボレーション: 組織の役割が変化すると、可観測性は単なる運用業務ではなくなります。


さらに、マイクロサービスの構成が混乱し、整理が難しいなど、一連の問題があります。 Kubernetes にマイクロサービスを適用した後、スレッド プールがいっぱいになりますが、原因がわかりません。そのため、マイクロサービスの可観測性では、クライアントがリクエストを入力した後、サービス間の収集、送信、処理、保存の状態を把握し、システム運用中に発生する障害を予測、特定、解決できるという問題を解決する必要があります。 Alibaba も独自の可観測性システムを構築する過程でこれらの問題に直面しました。

アリババの可観測性技術への道

51CTO: アリババが観測可能性機能の構築を開始したとき、社内の需要は何でしたか?どのような重要な反復を経験しましたか?

周小凡:クラウドネイティブ変革を最も早く実行したインターネット企業のひとつとして、アリババは可観測性技術の探求と実践の長い歴史を持ち、以下の段階を経てきました。

  • 第一世代 - ワンストップ:アリババの「イーグルアイ」製品から派生したリアルタイムアプリケーション監視サービスであるARMSが誕生し、企業にアプリケーションパフォーマンス管理(APM)機能と、フロントエンド監視やクラウドダイヤリングなどのデジタルエクスペリエンス(DEM)機能を提供しました。
  • 第 2 世代 - 接続されたアプリケーション: アプリケーション ホスティングおよびガバナンス製品とシームレスに統合され、監視、セキュリティ、ビジネスの安定性など、複数の厳格な需要シナリオをカバーします。
  • 第3世代 - ワンストップを超えて:1+1+1>3。Alibaba Cloudは、蓄積した可観測性技術、オープンソースの可観測性ファクト標準、顧客インベントリ、自社開発の可観測性データ資産をシームレスに統合し、Prometheus、Grafana、Opentelemetryなどのオープンソース標準を完全に採用し、クラウドネイティブ時代の完全な可観測性データエコシステムと製品スイートであるAlibaba Cloud Observability Suiteを作成します。

第一世代:アプリケーション向けリアルタイム監視サービスARMSは、アリババの「イーグルアイ」製品から誕生した
キーワード: モノリスからマイクロサービスへ、下から上への爆発的な成長

2013 年、アリババのビジネスが急速に発展し、アプリケーションはモノリシックからマイクロサービスへと進化しました。マイクロサービス システムにより分散型の組織構造が生まれ、ボトムアップで爆発的な成長がもたらされ、DevOps モデルへと急速に進化しました。エンジニアはセルフサービス モデルを使用して、基本的なソフトウェアに対するより多くの答えを見つけました。監視を「観察可能」にするというビジョンが形になり始めたのもこの段階からでした。統合された PaaS レイヤーによって、統合された観測可能なインフラストラクチャがすぐに誕生しましたが、マイクロサービスでの観測可能な機能の初期構築では、次の 2 つの困難に直面しました。指標ベースの相違、マイクロサービスの細分化の行き過ぎ、追跡ポイントの精度の向上などの要因により、「単一トランザクションの観測コスト」が急激に増加しました。第3世代プローブ技術と管理システムの進化によって生じる観測データソースの品質問題、および大規模なプローブ管理と安定性の保証。

キーワード:ビジネスプラットフォームの背後にあるデジタルオペレーション、トップダウンの安定ガバナンスシステムをリード

同時に、ビジネスミドルプラットフォームの誕生により、季節ごとの電子商取引のプロモーションやビジネス形態の変化にさらに対応するために、サービスガバナンスやカオスエンジニアリングなどの製品が誕生しました。断片化していた観測可能な能力を徐々に統合し、トップダウンの安定性ガバナンス体制を構築し、ビジネスSLOを中核とした安定性ガバナンス体制を構築しました。ログリンクインジケーターと診断ツールの統合により、アリババ社内のAPM製品の実用性が大幅に向上し、有名な「イーグルアイ」のプロトタイプが登場しました。監視機能と制御機能の統合: フルリンク グレースケールには、フルリンク、グレースケール、フルリンク ストレス テスト、カオス エンジニアリングなどの複雑なガバナンス メソッドが含まれており、容量評価やマイクロサービス間の強い依存関係と弱い依存関係の評価などの分析シナリオも含まれ、既存の監視機能に完全に統合されています。この段階では、アプリケーション、管理および制御の統合、およびドメイン知識の蓄積に重点が置かれ、一部のクローズド シナリオでデータの価値を最大化できるようになります。

アリババは2017年、長年社内で磨き上げてきた監視ツールを社外に公開し、リアルタイム監視サービス「ARMS」を正式に商品化した。クラウドネイティブの統合型可観測性プラットフォームである ARMS は、フルスタックのパフォーマンス監視とエンドツーエンドのフルリンク トレースおよび診断機能を提供します。同時に、Alibaba Cloud Log Service SLS のログデータ分析機能と Cloud Monitor の豊富なクラウド サービスおよびインフラストラクチャ監視機能を組み合わせることで、ユーザーはユーザー エクスペリエンス、アプリケーション サービス、クラウド製品、コンテナのワンストップ監視を簡単に完了できます。

第2世代: アプリケーションホスティングおよびガバナンス製品とのシームレスな統合により、監視、セキュリティ、ビジネスの安定性など、複数の厳格な需要シナリオをカバーします。

企業がデジタル変革を加速するにつれて、IT システムは頻繁に更新され、アプリケーションの複雑さは劇的に増加します。マイクロサービスやコンテナ化などの技術が従来の企業でも徐々に登場しており、クラウドサービスは企業が大規模にデジタルビジネスを運営するために不可欠な技術サービスとなっています。ユーザー エクスペリエンスに重点を置いたアプリケーション パフォーマンス管理 (APM) は広く注目を集めており、企業のデジタル変革とインテリジェントな運用および保守の実現に大きな価値をもたらしています。経験がものを言う時代では、上に向かってビジネスの継続性をカバーし、下に向かってインフラストラクチャの安定性につながる、統合された観測可能な製品が生まれました。

より完全な製品機能を提供するために、2017年のフロントエンド監視のリリースに続き、Alibaba Cloudは2021年にクラウドダイヤリング製品をリリースしました。ユーザーの視点からシステムの可用性を観察し、クラウドユーザーにすぐに使用できるエンタープライズレベルのパッシブおよびアクティブダイヤルアップアプリケーション監視ソリューションを提供し、ユーザーエクスペリエンスの最適化のための堅牢で信頼性の高い観測可能な分析ツールを提供します。

第3世代:アリババクラウドの蓄積された可観測性技術、オープンソースの観測可能なファクト標準、顧客インベントリ、自社開発の観測可能なデータ資産をシームレスに統合

クラウドネイティブ時代における可観測性の需要の爆発的な増加とインフラストラクチャの標準化により、オープンソースおよび商用の可観測性プロジェクトが継続的に出現しています。国内の可観測性市場の考え方が徐々に形成され、Prometheus、Grafana、Opentelemetryなどの可観測性標準も徐々に形成されてきました。これを基に、アリババクラウドはPrometheus監視サービスやGrafanaサービスなどの観測性を次々に発表し、6月にはアリババクラウド観測性スイートACOSを発表して、アリババクラウドの関連観測性製品とシナリオをさらに統合し、企業がより豊富で完全な観測性機能を提供できるように支援するとともに、観測性システム構築にかかるリソースと運用保守費用を大幅に節約しました。



51CTO: Alibaba Cloud の可観測性製品スイートの具体的な適用シナリオは何ですか?

周 小凡:クラウドネイティブのオープンソースエコシステムの急成長のおかげで、エンジニアは、Prometheus+Grafana を使用して基本的な監視を構築したり、SkyWalking や Jaeger を使用してトレースシステムを構築したり、ELK や Loki を使用してログシステムを構築したりするなど、監視システムを簡単に構築できるようになりました。可観測性技術の急速な発展により、現在私たちが直面している最大の問題は機能不足ではなく、データの断片化です。運用保守チームにとっては、さまざまな種類の観測可能なデータが異なるバックエンドに保存されており、トラブルシューティングには依然として複数のシステム間を行き来する必要があり、効率が保証されません。

今日の顧客は、市販の可観測性製品、オープンソースの自社構築製品、既存の可観測性資産の間で難しい選択を迫られています。

この分裂を解決するには 2 つの方法があります。 1 つの方法は、顧客の既存のソリューションを置き換えるために、完全に自社開発のワンストップ可観測性製品を作成することです。しかし、過去の経験から、ワンストップ ソリューションは別のデータ アイランドを形成することが多いことがわかります。

そのため、私たちは別の道を歩みました。つまり、下方向に標準化されたデータインターフェースを提供し、Alibaba Cloud 上の断片化された可観測性製品を統合し、顧客の既存の可観測性データ資産を接続しました。さらに、当社は自由にカスタマイズ可能な製品インターフェースを提供し、お客様がベンダーに縛られない 1+1+1>3 の独自の可観測性ソリューションを構築できるように支援しました。 Alibaba Cloud Observability Suite は、可観測性システム設計の観点から、企業のさまざまな観測シナリオに完全に対応します。

  • インフラストラクチャ層の場合

Prometheus 監視サービスは、クラウド サーバー ECS、コンテナー Kubernetes、VPC、メッセージ キューなどのサードパーティ ミドルウェアを含むさまざまなクラウド サービスを監視します。また、さまざまなクラウド サービスにすばやく接続して、容量をすばやく拡張または縮小したり、負荷を分散したりすることで、問題をより迅速に解決できます。

  • アプリケーション層の場合

Alibaba Cloud が独自に開発した Java プローブに基づくアプリケーション監視は、アプリケーション監視のニーズを完全に満たします。オープンソース ツールと比較すると、データ品質、プローブ パフォーマンス、分析機能が大幅に向上しています。オープンソースの SDK またはプローブを使用する場合でも、Opentelemetry を通じてアプリケーション監視プラットフォームにデータを報告できます。

  • ユーザーエクスペリエンス層

モバイル監視、フロントエンド監視、クラウドダイヤリングテストなどのモジュールを通じて、さまざまな端末でのユーザーエクスペリエンスとパフォーマンスを包括的にカバーします。

  • 統合されたアラームと管理

各レイヤーで収集されたデータとアラーム情報に対して統合されたアラームと根本原因分析を実行し、検出結果を Insight を通じて直接提示します。また、DingTalk や Enterprise WeChat などのコラボレーション プラットフォームを統合して、問題をより効率的に発見、処理、追跡します。

  • 統一されたインターフェース

アプリケーションリアルタイム監視サービス ARMS、Prometheus によって監視されたレポートデータ、ログサービス、Elasticsearch、MongoDB などのさまざまなデータソースなど、すべてをフルマネージドの Grafana サービスを通じて統合された監視可能なデータとして提示し、統合された監視ダッシュボードを確立できます。

Alibaba Cloudの可観測性に関する考え

51CTO: 市場の類似製品と比較して、Alibaba Cloud の可観測性製品の独創性と差別化された利点は何ですか?

周小凡:ガートナーはかつて、世界の可観測性市場規模は2023年に164億9,400万米ドルに達すると予測していました。2024年までに、30%の企業が可観測性技術を使用してデジタルビジネスオペレーションのパフォーマンスを向上させるでしょう。この熱狂の中で、既存のメーカーと新興企業の両方が、観察可能な分野で強力な製品能力を発揮しました。市場の類似製品と比較して、Alibaba Cloud には独自の考え方と差別化された利点もあります。多くのサードパーティ サービスやオープンソースの自社構築ソリューションとは異なり、Alibaba Cloud Observability Suite は、マルチレベルの接続を実現し、データ サイロを完全に解体し、データの背後にあるビジネス価値を探ります。

まず、オープンソース標準と互換性のある統一された観察インターフェースを形成する

アプリケーションリアルタイムモニタリングサービスARMSのアプリケーション層モニタリング(APM)、フロントエンドエクスペリエンスモニタリング(RUM)、eBPF技術に基づくK8sモニタリング、クラウドモニタリングなど、Alibaba Cloudが自社開発した可観測性製品と双方向に接続し、オープンスタンダード(PromQL)と統一されたオープンインターフェース(Grafana)の形でユーザーに観測可能なデータと分析機能を提供し、ユーザーが再統合して再処理するのに便利です。 ARMS は、カスタム トラッキング拡張機能のための OpenTelemetry SDK も完全にサポートしています。

次に、Alibaba Cloudの観測可能なデータストレージ製品に接続します。

Log Service SLS、Elasticsearch サービスなどの観測可能なデータ ストレージと、異種データ ストレージ施設 (Clickhouse、Lindorm、RDS など) に散在する観測可能なデータを統合し、シームレスな観測可能なデータ ソース管理と異種データ探索を実現します。

3つ目は、Alibaba Cloudのアプリケーション管理・制御製品とミドルウェア製品をすべて水平接続することです。

Alibaba Cloud のすべてのアプリケーション管理および制御 (Serverless Application Engine SAE、Container Service ACK、Function Compute FC、Enterprise Distributed Application Service EDAS など) とミドルウェア製品は、オープンソースの可観測性標準を完全に採用し、可観測性スイートに接続します。現在、50 を超える Alibaba Cloud サービスが Prometheus 標準を通じて監視されています。

4番目に、オープンソースを完全に受け入れる

Alibaba Cloud は、中国の可観測性分野のリーダーとして、オープンソース エコシステムを積極的に採用し、OpenTelemetry や Skywalking などの主流のオープンソース プロトコルと互換性のある Prometheus 監視サービス、Grafana サービス、リンク追跡サービスを提供し、新世代の Alibaba Cloud 可観測性スイートを形成しています。標準化されたテクノロジーを使用して、既存の断片化された観測可能なデータを下位に接続し、顧客が独自のベンダーフリーの観測可能なソリューションを上位に形成して、真の顧客成功を実現できるように支援します。

5番目に、観測可能なデータエコシステムを構築する

Alibaba Cloudは、2017年にElasticと協力してElasticserachサービスを構築して以来、Grafana Labs、Borei Data、Harmony Cloud、Kangaroo Cloudなどの企業と相次いで戦略的な協力関係を築き、Alibaba Cloudが自社開発した可観測性システムとシームレスに統合し、業界標準をリードする優れた製品と技術サービスをAlibaba Cloudの大規模な顧客にもたらし、より豊富で高品質、敷居の低い可観測性サービスと機能を提供しています。


51CTO: 具体的なユーザー事例に基づいて、Alibaba Cloud の可観測性製品の導入と実際の効果について説明していただけますか?

周小凡:2022年の北京冬季オリンピックを例に挙げてみましょう。これは、コアシステムが完全にクラウドベースとなる史上初のオリンピックとなる。 Alibaba Cloudのガバメントクラウドとパブリッククラウドの40以上の製品とサービスを活用し、冬季オリンピック公式アプリ「Winter Olympics Pass」、記者会見システム、競技時間・採点システム、選手解説システムなど30以上のアプリケーションをクラウドに完全移行しました。クラウドリソースを多次元的に収集・観測することで、北京冬季オリンピック期間中の現場担当者がクラウドリソースの全体的な運用リスクを事前に予測し、障害発生時に問題を迅速に特定・診断するニーズに応えます。 Alibaba Cloud は、冬季オリンピック組織委員会のビジネス特性に基づいて、3 つのレベルから観測指標を選択します。

  • アプリケーション層監視
    サービスが 1 秒あたりに受信するリクエストの数、各リクエストの継続時間、失敗したリクエストの数などのアプリケーション層の技術パラメータ。
  • 基本的なリソース監視
    ECS CPU 使用率、メモリ使用率、およびディスク容量。 POD CPU 使用率、メモリ使用率、およびディスク容量。 RDS CPU 使用率、メモリ使用率、IOPS 使用率、およびディスク容量。 Redis の CPU 使用率、メモリ使用率。 CSG フロントエンドの読み取りおよび書き込み速度、共有キャッシュの使用率、ユーザー スペースの使用率、および Trottling ステータス。
  • ネットワーク層監視
    帯域幅、アクティブ接続数、レート制限パケット損失率、専用回線ヘルスチェックパケット損失率などのコア ネットワーク パラメータ。

上記の要件に基づいて、冬季オリンピック組織委員会は、可観測性システム全体を構築するために Alibaba Cloud Observability Suite を選択しました。北京冬季オリンピック組織委員会の業務システムは、本番環境とテスト環境に分かれており、本番環境の監視に重点が置かれています。情報システムの全体監視ダッシュボードを構築する際には、まずタグに基づいて PromSQL 構文を記述し、実稼働環境のリソースを抽出します。同時に、ECS、RDS、Redis、SLB などの多数のリソースを考慮し、リスクをより適切に特定し、サービスの可用性を向上させるために、TOP 10 リソースの使用状況を観察することに重点を置いています。同時に、結果システム、解説者通訳システム、その他の主要情報システムなど、北京冬季オリンピックの運営中の重要な業務システムについては、別途 Grafana 監視ダッシュボードを構築します。 SLB トラフィック、QPS 使用状況、HTTP リクエストのさまざまな戻りステータス コードの監視に重点を置きます。

冬季オリンピックのバックエンド アプリケーションは Java マイクロサービス アーキテクチャであり、約 1,000 個の Kubernetes Deployment アプリケーション インスタンスが含まれているため、コンテナ サービス クラスターとそこで実行されているアプリケーションをより適切に監視するために、冬季オリンピック組織委員会は、アプリケーション リアルタイム監視サービス ARMS の Prometheus に基づいてコンテナ クラスター監視ダッシュボードを構築しました。クラスター イベント ログ、eBPF ベースの非侵入型アプリケーション インジケーター、ネットワーク インジケーターなど、同じディスク上の複数のデータ ソースを確認できます。冬季オリンピック組織委員会は、大規模な相関分析ロジックを使用して、複数のデータ ソースと多角的な観測機能を通じて、概要から詳細までさまざまな次元で調査を実施しています。

北京冬季オリンピック組織委員会は、Alibaba Cloud Observability Suite を基盤として、オリンピック国際公式サイト、オリンピックチャンネル OCS、オリンピック放送サービス OBS をはじめ、競技会場のチケット販売、記者会見システム、冬季オリンピック公式アプリ Winter Olympics Pass、放送データプッシュ、自動メディア注釈、国際リアルタイム信号中継、データウェアハウス、人員到着・出発 ADS、オンライン配車旅行 RHP など、さまざまなビジネスシナリオをサポートする完全な観測システムを最短時間で迅速に構築し、北京冬季オリンピックの円滑な開催を確保しました。

Alibaba Cloud の可観測性製品マトリックスは、世界レベルのプロジェクトのテストに合格したことに加え、その完全な機能、優れたエコシステム統合能力、および優れたコスト優位性により業界の評価を得ています。 Alibaba Cloudのリアルタイムアプリケーション監視サービスARMSは今年、中国情報通信研究院から高度レベルの観測性製品認証を取得しました。 Alibaba Cloud は、Gartner APM および Observability Magic Quadrant に 2 年連続で選出されており、今年は中国企業として唯一選出されました。 Forrester のコンテナおよびサーバーレス製品の機能評価では、可観測性関連の製品機能スコアも満点と認定されました。

観測可能分野における7つの主要な技術とアプリケーションのトレンド

51CTO: 将来的に観測機能が標準化される可能性はありますか?監視から可観測性まで、運用と保守の変革の全体的な傾向は何ですか?

周小凡:近い将来、観測可能な分野ではある程度の標準化が形成されるでしょう。大手メーカーやオープンソースプロジェクトでは標準規格の統一を推進しています。まず、指標に関してですが、Prometheusはクラウドネイティブ時代の指標データのコンセンサス標準となっています。 OpenTracing と OpenTelemetry の推進により、リンク標準は徐々に主流になってきました。ログの分野では、データの構造化が進んでおらず、データ標準を形成するのが難しいものの、収集、保存、分析の面で Fluentd や Loki などの新しいオープンソース プラットフォームが登場しています。一方、Grafana は観測可能なデータを表示するための標準としてますます明確になりつつあります。標準は統一されているものの、統一された標準に基づくオープンソースの分裂の度合いは想像以上に深刻であることも認識する必要があります。

同時に、標準化に加えて、可観測性分野では 7 つの予測可能なテクノロジーとアプリケーションのトレンドが見られます。

  • アプリケーション中心の観察視点を構築します。アプリケーションに基づいてインジケーター、リンク、ログを関連付けます。徐々に成熟しつつある eBPF プローブ技術を使用して、グローバルなアプリケーションの可観測性を迅速に実現し、非侵入型アプリケーション プローブを主な方法として、OpenTelemetry を補助的な方法として使用することで、コード レベルの可観測性を実現します。
  • ビジネスの成功とユーザー エクスペリエンスに重点を置く: ユーザー エクスペリエンスを正確に測定し、ビジネスの成功または失敗を関連付けます。フロントエンドとバックエンドの観測可能なデータが接続され、ビジネスチェーン全体での迅速な問題特定を実現します。
  • アプリケーション管理と制御リンクを接続: 運用および保守変更管理システムと密接に接続して、統合された監視、管理、制御機能を実現します。セキュリティ ガバナンスと可観測性テクノロジーを統合して、IT リスクを包括的に削減します。カオス エンジニアリングとパフォーマンス テストを統合して、データ駆動型の安定性管理を標準化します。
  • 部門の壁を壊し、効率的なコラボレーション メカニズムを確立します。SLO 主導の緊急対応システムを構築し、ChatOps メカニズムを導入して、分散型コラボレーションを実現します。データ ラベル付けシステムを使用して、チームおよび個人の観察可能なビューをすばやく構築します。
  • 標準化された指標監視システムの構築: Prometheus エコシステムを中心に新世代の観測可能なインフラストラクチャを構築し、分散クラウド アーキテクチャを採用し、グローバルな指標監視システムを構築します。指標の量ではなく質に重点を置き、監視システムの有効性を継続的に管理します。
  • 統一された観測可能なインターフェース: 「データベースではなくデータを統一する」ことで、Grafana 視覚化システムを活用して異種ストレージの統一されたプレゼンテーションを実現します。

将来を見据えて、Alibaba Cloud は、クラウド コンピューティングの時代において「観察力」がすべてのエンジニアの中核的な競争力になると考えています。 Alibaba Cloud 上のクラウド サービスの多くは、主流のオープンソース標準を通じて運用状況を完全にホワイトボックス化しており、クラウド サービス ユーザーがより適切に統合できるようにしています。エンジニアは、観測可能な左シフトを実現するために、コードアプローチとしてのモニタリングを徐々に採用していきます。過去と比較して、可観測性機能の構築は、ビジネス ロジックの作成と運用および保守の自動化の実装において重要なリンクになります。

マネージャーとして、観測可能なテクノロジーを使用して研究開発や運用効率の管理、IT コスト分析を支援することは、徐々に必須のスキルになります。同時に、マネージャーは観察可能なデータを徐々に活用して、チームメンバー間のコラボレーションとコミュニケーションをデジタルで推進し、企業のセキュリティリスクを特定します。

すべてがクラウドベースになる時代において、可観測性によりクラウドは使いやすくなります。可観測性の大きな価値が徐々に認識されつつあります。私たちは監視から観測可能性へと移行していますが、観測に限定されるわけではありません。分析、洞察、そして質の高い意思決定とビジネスイノベーションの実現こそが、観察の究極の目的です。 Alibaba Cloud は今後もこの分野で高品質な製品とサービスを提供し続けます。

ゲスト紹介

周小凡氏は、Alibaba Cloud のシニア技術専門家です。彼は現在、Alibaba Cloud のクラウドネイティブ アプリケーション プラットフォームに勤務しており、Alibaba グループの APM システム EagleEye や Alibaba Cloud アプリケーション リアルタイム監視サービス (ARMS) などの技術製品を担当しています。可観測性関連分野で9年以上の実務経験を持ち、分散リンク追跡、ログ処理プラットフォーム、監視・警報システムの構築と応用において豊富な経験を持っています。その他のテクノロジー関連の経験には、マイクロサービス ガバナンス、分散データ処理、アプリケーション PaaS などがあります。

コラム紹介

「T最前線」は、51CTOコンテンツセンターが技術系人物向けに特別に開設した深掘りインタビューコラムの一つです。テクノロジー業界のビジネスリーダー、シニアアーキテクト、シニア技術専門家を招き、現在のテクノロジーのホットスポット、テクノロジーの実践、テクノロジーのトレンドについて詳細な解釈と洞察を行うことで、最先端テクノロジーの普及と開発を促進します。

<<:  クラウドデータベースはテクノロジースタックの重要な部分です

>>:  世界のエッジコンピューティング市場は2030年までに1560億ドルに達する

推薦する

上海SEO: 最適化は外部リンクの構築だけではない

偶然、あるウェブサイトで Google 検索エンジンのランキングに影響を与える要素と、その要素の割合...

推奨: ライブビデオストリーミングやビデオウェブサイトに適したクラウドサーバー

ライブビデオストリーミングにはどのクラウドサーバーを使用すればよいですか?ビデオ ウェブサイトにはど...

モバイル インターネット業界の専門用語の完全リスト [2016 年最新版]

モバイルインターネットプロフェッショナルレベル4試験が始まりました〜 CPA、CPD、CPI、CPS...

入札データ分析のいくつかの主要な分析についての簡単な説明

これまで私はデータ分析についての記事を書いてきましたが、主にデータ分析のプロセスとデータ分析のアイデ...

量子コンピューティングに注力するBose Quantumは、Dianliang Bernが主導する数千万人民元のエンジェルラウンドの資金調達を完了した。

36Krは、「コヒーレント量子コンピューティング」に焦点を当てた中国初のスタートアップ企業であるBo...

Webmaster.com からの毎日のレポート: 冬を乗り切るために 2,859 の共同購入サイトが閉鎖、高級品 E コマースへの突然の攻撃

1. 115クラウドディスクがパブリック共有を停止したという噂は誇大宣伝であり、115コミュニティを...

無料の大容量ファイル転送ツールを推奨

中国から海外の VPS ホストにアクセスする場合、ファイル転送速度は理想的ではなく、数十 KB/秒程...

タオバオの商人は「タオバオを去った」が、SEOはまだ逃げられないのか?

最近のニュース報道によると、タオバオの商人が毎日タオバオから逃げているそうです。タオバオが広告費を値...

#12.12# tmhhost: 月額33元から利用できるVPS、日本cn2、日本ソフトバンク、韓国cn2、米国cn2、200G米国cn2高防御

tmhhost は、Double 12 向けにハイエンド ネットワークを備えた安価な VPS を提供...

フラッシュセールプラットフォームFabは3つの変革を経て破産の危機に瀕している。モデルの維持は困難で、会社の経営は不安定だ。

「Fabの前身はFabulisというゲイ向けソーシャルネットワーキングサイトだった。Yelpのレビュ...

私たちが長年にわたり追求してきたSEOの知識を注意深く読んでください

SEOを学んでから2年以上経ちました。この長い期間に、検索エンジンはアルゴリズムを何度も更新し、多く...

推奨: netcloud-$5/512m メモリ/10g SSD/1T トラフィック/ONAPP クラウド

Netcloud はテキサス州に登録された中規模の民間企業で、多くの事業を展開しています。Netcl...

ウェブサイトの重さについて考える

ウェブサイトの重みの定義は何ですか?多くの SEO 担当者がウェブサイトの重みについて議論しています...

降格問題を解決し、防止する方法を教えます

多くの SEO 初心者は、自分のウェブサイトが後退しているのを見ると、他の人のウェブサイトの権威が低...

人材ネットワーク活動計画のポイント

ウェブサイトの運営を成功させるには、さまざまな活動の計画が不可欠です。人材ネットワークは、人材を募集...