トラブルシューティングや事後検証の際にデータの価値を高めるには、プロパティ名がすべてのテレメトリ タイプ、ツール、サービスにわたって一貫している必要があります。 OpenTelemetry 属性の命名に関するベスト プラクティス トップ 5 から翻訳された著者の Carl Brahms は、Chronosphere カスタマー サクセス チームのメンバーであり、監視、観察、イベント管理プラットフォームで長年の経験を持っています。彼は、チームがリアルタイムのデータ洞察を発見できるように支援すること、生成型人工知能、そして...という 3 つのことに情熱を注いでいます。 OpenTelemetry (OTel) を使用した分散トレース データに関しては、データを収集するだけでは十分ではありません。データを簡単に見つけ、他のデータと関連付けられるようにするための手順を実行する必要があります。これが、適切なプロパティ命名のための標準を持つ目的です。 効果的な属性の命名は単なるベストプラクティスではありません。それは重要な要件です。データがトラブルシューティングや事後分析に役立つようにするには、プロパティ名がすべてのテレメトリ タイプ、すべてのツール、すべてのサービスにわたって一貫している必要があります。この一貫性がなければ、OTeL データの有用性は大幅に低下します。 OTel のセマンティック規則とベスト プラクティスにより、データの相互接続性、移植性が向上し、クラウド ネイティブ環境での利用可能性が高まります。コンテキスト データは、可観測性チーム内で保持するデータの中で最も有益なタイプであり、ベスト プラクティスにより、そのデータの使用と影響を最大限に高めることができます。 これらのガイドラインとベスト プラクティスは、組織が収集した追跡データから最大限の利益を得るのに役立ちます。 OTeL属性の効果的な導入を確立する効果的で有用な OTeL 属性を実装するには、影響を受けるすべてのチームの早期の関与が重要です。導入を成功させるには、スタックのすべてのレイヤーにわたって明確で一貫した命名標準を持つことのプラスの効果について全員に教育するワークショップを開催することを検討する必要があります。一貫性は明確さを生み出し、インシデント対応とデバッグの際に重要です。 命名標準の利点を説明し、会社やアプリケーションに関連する領域に焦点を当てることで、ソフトウェアおよびシステム アーキテクトの賛同を得ます。 次に、構文、構造、例など、命名規則を概説した詳細なドキュメントを作成します。標準を改訂し、フィードバックを通じて改善し、事後に見つかったギャップに対処するためのプロセスを開発します。 OTel プロパティの命名に関するベスト プラクティス観測可能性データを最大限に活用するには、OTel プロパティの命名規則の一部として従うべき 5 つの重要なベスト プラクティスがあります。 1. 意味的属性と説明的属性を使用するセマンティック名は、効率的な根本原因分析に役立ちます。
例: app.service.version
説明的なプロパティ名を使用すると、リソースを簡単に表示し、そのコンテンツと関連性を理解するために必要なすべてのコンテキストを得ることができます。既存のセマンティック規則の優れた説明については、公式仕様を参照してください。ここでは、一般的なプロパティとシステム プロパティについて学習し、テクノロジ固有の規則を含むシグナルまたは操作タイプ (HTTP やデータベースなど) 別に整理できます。 2. 共有ライブラリの使用既知のプロパティのライブラリを作成すると、重要なデータをカタログ化し、顧客にとって重要なデータを文書化するのに役立ちます。 複数のチームがプロパティを共有する場合は、矛盾を避けるためにプロパティを標準化することが重要です。チーム間で属性の命名規則が異なると、データの相関が困難または不可能になる可能性があります。たとえば、バックエンド チームが「latency」という名前を付け、フロントエンド チームが「duration」という名前を付けた場合、サービス間でレイテンシを比較または集計するクエリは正しく機能しません。標準化されたプロパティにより、チームは共有リソース (ダッシュボードやアラートなど) を活用し、複数のシステムやサービスにわたる分析情報を得ることができます。 3. カスタム属性を作成する場合によっては、会社またはアプリケーションの特定の側面に合わせて新しいプロパティを作成する必要があります。これを実行する前に、OpenTelemetry プロパティ レジストリを参照して、必要なプロパティがまだ存在していないことを確認することをお勧めします。必要な属性に一致する属性がないことを確認したら、新しい属性を作成できます。作成プロセス中は、特にプレフィックスの使用に関して、OTel 属性の命名ガイドラインのヒントに従うことが重要です。 属性名にプレフィックスを使用すると、カスタム属性名を標準名、他のプロジェクトで選択された名前、または協力しているベンダーや会社で選択された名前と区別しやすくなります。カスタム属性が誤って別の属性と名前を共有している場合、誤った結論や決定、ダッシュボードやアラートの欠陥につながり、トランザクションのフローやステータスの追跡が困難になる可能性があります。 他のプロジェクト、ベンダー、または企業との競合を避けるには、io.chronosphere.myapp のように、会社のドメイン名に基づいたプレフィックスを逆順で使用することを検討することをお勧めします。 名前がアプリケーション外部では決して使用されず、社内でのみ使用されることが確実な場合でも、プレフィックスを付けるということは競合を防ぐ重要な手段です。 bluebook.widget_count など、アプリケーションまたはプロジェクトに関連付けられたプレフィックス名の使用を検討してください。 OpenTelemetry や他のプロジェクトやベンダーに属する既存のプレフィックスを活用することもできます。プレフィックスを共有すると、その後の名前の競合につながる可能性があり、インシデント発生時に同僚が他の人のデータを自分のデータから分離する方法を見つけるのに苦労することになります。 4. サービスレベルに重点を置く追跡に適用する属性を決定するときは、アプリケーションの目的は顧客に高品質のソフトウェア エクスペリエンスを提供することであることを忘れないでください。このミッションは、サービス/アプリケーションのサービス レベル目標 (SLO) に、おそらく 99.999% の稼働率の期待値という形でエンコードされます。 SLO から、どのサービス レベル インジケーター (SLI) が SLO の達成を最もサポートしているか、または最も脅かしているかを絞り込むことができます。プロパティはサービス レベルをサポートする必要があります。 たとえば、トラフィックの異なるセグメント間にレイテンシ SLO がある場合、ProductID、FeatureID、RegionID などのセグメント ディメンションを提供する属性を使用すると、それに応じてアラートを整理できます。 5. 新しいユースケースを考えるプロパティは、分散システムにおけるパターン マッチングのルートであると考えてください。カテゴリやクラス間の関係を調査したい場合、属性は並べ替えや比較のためのツールとなります。 さまざまなプロパティを徐々に試して、何が起こるかを確認します。例を考えてみましょう。 プレミアム顧客は請求書のエラーについてサポートに問い合わせていますか?注文サービスは数分前に新しいバージョンをデプロイしませんでしたか? service.version や membership.level などのプロパティを比較し、サービス名 order のエラー メトリックを相関させることで、プレミアム メンバーシップのエラー率の増加が、新しいバージョンの order サービスと高い相関関係にあるかどうかを判断するのに役立ちます。 便利なプロパティタイプOpenTelemetry の標準プロパティの開発には多くの慎重な検討が払われており、リストは常に進化しています。ここですべてのカテゴリを挙げることは不可能ですが、社内の命名基準を策定する際には既存のものを調べ、回帰を調査する際にはチームにとって役立ったものを強調すると役立ちます。レジストリからの例をいくつか示します。
server.address: サーバーのアドレス。 destination.address: 宛先のアドレス。 network.carrier.name: ネットワークキャリアの名前。 code.filepath: コードのファイルパス。
その事件はどうなったんですか?見落とされがちな、span イベント ログと呼ばれる特別なタイプの span 属性があります。スパンのイベントはログと非常に似ていますが、トランザクションの問題のトラブルシューティングを行うときに非常に役立つコンテキスト情報を配置するのに適した場所です。 スパンのイベント ログに何を入れるかを検討するときは、ペイロードからプライベート ユーザー データを削除し、発生した事象の簡単な概要、例外や完全なエラー メッセージ、追加のコンテキスト情報など、スパン内で発生したイベントを追加する必要があります。 避けるべき属性の実践これまでは属性の「方法」に焦点を当ててきましたが、ここでは回避すべき属性の落とし穴について詳しく見ていきます。
OpenTelemetry のドキュメントにはさらに多くの有用な情報とアドバイスが記載されているため、属性標準が開発されるたびに最新の仕様を参照することをお勧めします。 結論は追跡データ収集は、可観測性の重要な部分です。しかし、そのためには、データが有用で、アクセスしやすく、洞察に富んでいることを保証するプロセスを確立する必要があります。命名規則には事前にいくらかの作業が必要ですが、意味の明確さの確保、統合リポジトリの維持、データの理解、サービス レベルとの整合、新しいユース ケースの予測に至るまで、これらのベスト プラクティスを採用することで、チームはテレメトリの有用性を高めることができます。 このアプローチはトラブルシューティングを簡素化するだけでなく、組織内で効果的な観察文化を確立するのにも役立ちます。この作業の結果、アクセス可能な洞察が満載の豊富な OTeL データセットが得られ、よりスマートで迅速な意思決定が可能になります。 |
<<: アップグレード時にクラッシュします。K8s には LTS バージョンが必要です。
>>: Alibaba Cloud 上の複数のアカウントを一元管理
データの出現により、ビジネス インテリジェンスは真に 21 世紀に移行しました。しかし実際には、「ビ...
turnkeyinternet.net は 1999 年から運営されており、主にニューヨークに独自の...
[[346377]]建国記念日を前に、NVIDIA による ARM 買収のニュースはテクノロジー界で...
インターネット上に出回っている多くの SEO 記事は、高品質の外部リンクの重要性を強調しています。そ...
最近、SAP は 2020 年の第 4 四半期および年間財務報告を発表したほか、今四半期に中華圏で締...
アメリカの VPS ホストの中で、国内でアクセス速度が速いのはどれですか?最も速度が速い米国の VP...
Unihost は 2001 年から運営されており、現在はフランス、ポーランド、ドイツ、オランダ、カ...
国家郵政局は昨日、「ダブル11」のピーク時の速達注文数は約2400万個で、昨年より41%増加したと発...
SEOテクノロジーを使用して、予算ゼロで Web サイトの正確なトラフィックを 2 倍にするにはどう...
ユーザーがゲームを入手するには、一般的に、推奨ダウンロードと検索ダウンロードの 2 つの方法がありま...
[[431325]] JVM 全体構造HotSpot VM は、市場における代表的な高性能仮想マシン...
bluevm が今回開設したデータセンターは、ニューヨーク、シカゴ、ロサンゼルス、ダラス、アトランタ...
epidrive は 6 月に設立された非常に新しい VPS プロバイダーです。openvz 仮想化...
競争圧力と有利な政策に直面して、ネットワーク運用はリスクと機会の両方に直面している。 2013年の鐘...
タグタグは、実は大規模なウェブサイトでは非常に一般的です。今日ここでこのトピックについて議論するのは...