Sentry モニタリング - Snuba データミドルプラットフォームアーキテクチャ (Kafka+Clickhouse) の紹介

[[427651]]

この記事はWeChatの公開アカウント「Hacker Afternoon Tea」から転載したもので、著者はShaoです。この記事を転載する場合は、Hacker Afternoon Tea公式アカウントまでご連絡ください。

Snuba は、Clickhouse 上に豊富なデータモデルと、高速な取り込みコンシューマー (Kafka から直接データを取得) およびクエリオプティマイザーを提供するサービスです。

Snuba はもともと、Postgres と Redis の組み合わせを置き換えて、Sentry エラーに関する集計データを検索および提供するために開発されました。それ以来、現在の形に進化し、複数のデータセットで時系列関連の Sentry 機能のほとんどをサポートするようになりました。

関数

ClickHouse 分散データストレージ用のデータベースアクセスレイヤーを提供します。
SQL のような機能を提供する SnQL 言語を通じてクライアントがクエリを実行できるグラフィカルな論理データモデルを提供します。
1 回のインストールで複数の個別のデータセットをサポートします。
ルールベースのクエリオプティマイザーを提供します。
単一ノードおよび分散環境で ClickHouse に DDL 変更を適用するための移行システムを提供します。
Kafkaから直接データを取り込む
ポイントインタイムクエリとストリーミングクエリをサポートします。

Sentry の使用例:

イベントデータセットは、問題ページなどの機能のサポートを提供します。ここでの検索機能とすべての集約機能は Snuba によって提供されています。
検出データセットは、パフォーマンス監視に関連するすべての機能をサポートします。
セッションデータセットは、リリース機能のサポートを提供します。具体的には、データセットは大量のデータポイントを取り込み、事前に集計されたデータを保存して、大量のデータの高速クエリを可能にします。
結果データセットは統計ページを強化します。

Snubaを使い始める

これは、Sentry 開発環境で Snuba をすばやく起動するためのガイドです。

必要条件

Snuba は次のことを前提としています。

CLICKHOUSE_HOST (デフォルトのローカルホスト) にある Clickhouse サーバーエンドポイント。
REDIS_HOST (デフォルトは localhost) で実行されている redis インスタンス。ポート6379。

これらのサービスを実行する簡単な方法は、sentry をセットアップして、以下を使用することです。

セントリー開発サービスアップ--exclude=snuba

Snuba ではすべてが UTC 時間で実行されていると想定していることに注意してください。そうしないと、タイムゾーンの不一致の問題が発生する可能性があります。

セントリー + スヌーバ

~/.sentry/sentry.conf.py に次の行を追加/変更します。

 SENTRY_SEARCH = 'sentry.search.snuba.EventsDatasetSnubaSearchBackend'  
 SENTRY_TSDB = 'sentry.tsdb.redissnuba.RedisSnubaTSDB'  
 SENTRY_EVENTSTREAM = 'sentry.eventstream.snuba.SnubaEventStream'

走る：

セントリー開発サービスアップ

オリジナルの Clickhouse クライアント (psql に類似) にアクセスします。

 docker exec -it sentry_clickhouse クリックハウスクライアント

データはsentry_localテーブルに書き込まれます: select count() from sentry_local;

設定

設定はsettings.pyで確認できます。

クラスター: クラスターのリストと、各クラスターで実行する必要があるホスト名、ポート、およびストレージセットを指定します。各クラスターには、ローカル設定と分散設定もあります。
REDIS_HOST: ここで redis が実行されています。

Snuba アーキテクチャの概要

Snuba は、Clickhouse を利用した時系列データストレージサービスです。これは、Snuba が提供するクエリの種類に適した列指向の分散データベースです。

https://clickhouse.tech/

データは Clickhouse テーブルとマテリアライズドビューに完全に保存され、入力ストリーム (現在は Kafka トピックのみ) を介して取り込まれ、ポイントインタイムクエリまたはストリーミングクエリ (サブスクリプション) を介してクエリできます。

ストレージ

Clickhouse がバッキングストアとして選択されたのは、Snuba に必要なリアルタイムパフォーマンス、分散および複製された性質、ストレージエンジンに関する柔軟性、および一貫性の保証の間で適切なバランスが取れているためです。

Snuba データは Clickhouse テーブルと Clickhouse マテリアライズドビューに保存されます。テーブルのターゲットに応じて複数の ClickHouse ストレージエンジンを使用します。

https://clickhouse.tech/docs/en/engines/table-engines/

Snuba データは、データモデルの独立したパーティションを表す複数のデータセットに編成されます。詳細については、Snuba データモデルのセクションを参照してください。

摂取

Snuba は、行を挿入するための API エンドポイントを提供しません (デバッグモードで実行している場合を除く)。データは複数の入力ストリームからロードされ、一連のコンシューマーによって処理され、Clickhouse テーブルに書き込まれます。

コンシューマーは 1 つ以上のトピックからデータを消費し、1 つ以上のテーブルに書き込みます。これまでのところ、複数のコンシューマーがテーブルに書き込んでいることはありません。これにより、以下で説明する一貫性の保証の一部が可能になります。

データの取り込みはバッチ処理で最も効果的に機能します (Kafka の場合、特に Clickhouse の場合)。私たちのコンシューマーはバッチ処理をサポートしており、Kafka から取得されたイベントのバッチが ClickHouse に少なくとも 1 回は配信されることを保証します。 Clickhouse テーブルエンジンを適切に選択して行の重複を排除することで、最終的な一貫性を受け入れる場合に、正確に 1 回のセマンティクスを実現できます。

クエリ

最も単純なクエリシステムは時間ポイントです。クエリは SnQL 言語 (SnQL クエリ言語) で表現され、HTTP ポスト呼び出しとして送信されます。クエリエンジンはクエリ (Snuba クエリ処理で説明されているプロセス) を処理し、それを ClickHouse クエリに変換します。

ストリーミングクエリ (サブスクリプションエンジンを介して実行) を使用すると、クライアントはクエリ結果をプッシュ方式で受信できます。この場合、HTTP エンドポイントにより、クライアントはストリームクエリを登録できます。次に、コンシューマーはトピックにサブスクライブされ、更新のために関連する Clickhouse テーブルにデータを入力し、クエリエンジンを通じて定期的にクエリを実行し、サブスクライブされた Kafka トピックで結果を生成します。

データの一貫性

Snuba では、さまざまな保証を提供するために、さまざまな一貫性モデルが共存しています。

デフォルトでは、Snuba は最終的に一貫性を持ちます。クエリを実行する場合、デフォルトでは単調な読み取りは保証されません。これは、ClickHouse がマルチリーダーであり、クエリが任意のレプリカにヒットする可能性があり、レプリカが最新であるという保証がないためです。さらに、デフォルトでは、ClickHouse が単独で一貫した状態に到達するという保証はありません。

クエリを実行する前に ClickHouse に一貫性を強制的に達成させ (FINAL キーワード)、コンシューマーが書き込む特定のレプリカにクエリがヒットするように強制することで、特定のクエリで強力な一貫性を実現できます。これは基本的に、ClickHouse を単一のリーダーシステムのように使用し、連続的な一貫性を実現します。

スヌーバのセントリー配備

このセクションでは、主なデータフローを示しながら、Sentry 展開で Snuba が果たす役割について説明します。 Snuba を単独で展開した場合、これは役に立ちません。

エラーとトランザクションのデータフロー

図の上部にあるメインセクションは、イベントおよびトランザクションエンティティの取り込みプロセスを示しています。これら 2 つのエンティティは、Sentry およびパフォーマンス製品全体の問題/エラー関連の機能の大部分を提供します。

このパイプラインの情報を提供する、エラーとトランザクション間で共有される Kafka トピック (イベント) は 1 つだけです。このトピックには、エラーメッセージとトランザクションメッセージが含まれています。

エラーコンシューマーは、イベントトピックを使用して、ClickHouse エラーテーブルにメッセージを書き込みます。コミット後、snuba-commit-log トピックにもレコードが生成されます。

エラーアラートは、エラーサブスクリプションコンシューマーによって生成されます。これは、メインイベントトピックと snuba-commit-log トピックの両方を消費する同期コンシューマーであるため、メインコンシューマーと同期して続行できます。

同期されたコンシューマーは、Clickhouse にクエリを実行し、結果トピックで結果を生成することでアラートを生成します。

トランザクションは同じですが独立したパイプラインに存在します。

エラーパイプラインには、置換トピックへの書き込みという追加のステップがあります。 Sentry は、イベントトピックでエラーミューテーション (マージ/アンマージ/再処理など) を生成します。次に、エラーコンシューマーはそれらを置換トピックに転送し、置換コンシューマーによって実行されます。

プロジェクト内のイベントを順番に処理できるようにするには、イベントトピックを Sentry プロジェクト ID によって意味的に分割する必要があります。これまでのところ、これはアラートと交換の要件です。

セッションと成果

セッションと成果は非常によく似ており、よりシンプルな方法で動作します。特に、セッションはリリースの健全性機能を強化し、成果は主に Sentry 統計ページにデータを提供します。

どちらのパイプラインにも独自の Kafka トピック、Kafka コンシューマーがあり、Clickhouse の独自のテーブルに書き込みます。

変更データキャプチャパイプライン

パイプラインはまだ建設中です。 cdc トピックを使用し、Clickhouse に 2 つの別々のテーブルを作成します。

<<: クラウドネイティブはどこにでもあります。デジタル変革で道に迷うことを避けるにはどうすればよいでしょうか?

>>: ついに誰かがDevOpsをわかりやすく説明してくれた

機密情報ネットワークがどのようにして仁徳経絡と杜徳経絡を開くことができるかについて話す

Sentry モニタリング - Snuba データミドルプラットフォームアーキテクチャ (Kafka+Clickhouse) の紹介

関数

Sentry の使用例:

Snubaを使い始める

Snuba アーキテクチャの概要

スヌーバのセントリー配備

機密情報ネットワークがどのようにして仁徳経絡と杜徳経絡を開くことができるかについて話す

misterhost 無制限トラフィック VPS/1.99 ユーロ/月/無料 .de ドメイン名

Weiboマーケティングにおけるデータ分析の応用 Weiboマーケティングの影響を評価する方法

dedipathはどうですか？デンバーデータセンターのVPSサービスの簡単なレビュー

Godaddy ドメイン名登録/更新 30% 割引コード

Hostflyte: VPS IPの変更はわずか2ドル、4Gメモリ/20g SSD/4Tトラフィックの場合は年間11ドル

量子コンピューティング、機械学習など、注目すべき 6 つのクラウドコンピューティングのトレンド

[更新/有効性保証] 年間15ドル（約100元）以下の安価な海外VPSのおすすめ

Tencent Cloud の「軽量アプリケーションサーバー Lighthouse」、通称「Tencent Lightweight Cloud」が正式にリリースされました。

第5回江蘇インターネット年次大会が南京で成功裏に開催されました

推薦する

ウェブサイトのユーザーエクスペリエンスを向上させる最適化: アクセス速度

Weiboマーケティングスキル：Weiboの汎エンターテイメントエコシステムを活用する

#12.12# cloudcone、ロサンゼルスの高トラフィック VPS、年間 14 ドル、KVM/1G メモリ/1 コア/20g SSD/5T トラフィック/1Gbps 帯域幅

Spring Boot 2.x 基本チュートリアル: JTA を使用した分散トランザクションの実装

サイトを最適化するための最初のステップは、適切な検索ボックスを作成することです。

#おすすめ# bacloud: 12% オフの VPS 割引コード、高性能、100Mbps/1Gbps 無制限トラフィック

初心者はSEOをどう学ぶべきか

360 Search が「Haosou」検索エンジンを開始

エッジコンピューティングの探究: プロセッサ、アルゴリズム、メモリ

CrownCloud-1g メモリ/KVM/Phoenix/月額 5 ドル/Win

共同購入サイトが最後の寒い冬を迎える。大企業の例に倣い、従業員を解雇して冬を乗り切ろう

50kvm-ロサンゼルス/C3 データセンター/3 USD/1g RAM/30g HDD/2T フロー

中間レビュー: 2023 年に注目すべきクラウドコンピューティングスタートアップ 10 社

友情リンクは慎重に選択してください

昆山農村商業銀行とテンセントクラウドは、新たな銀行インフラと新たな接続を共同で構築するための戦略的協定を締結した。