背景とシステム紹介: Kafka は、Web サイト上の消費者のすべてのアクション ストリーム データを処理できる、高スループットの分散型パブリッシュ/サブスクライブ メッセージング システムです。通常、高スループットが求められるため、解決策としてはログ データの処理とログの集約が行われます。
この記事で取り上げる分散システム(C システムと呼ぶ)が形になり始めています。システムの構築が進み、機能が徐々に向上するにつれて、Cシステム周辺システムのログ消費需要も徐々に増加しています。ログ消費のニーズを満たすために、システム C のゲートウェイ システムにログ送信機能を追加し、外部へのメッセージ送信を実現することが決定されました。 システム C のゲートウェイ システムは、分散システムのアクセス検証を主に担当し、受け入れられた要求の合法性、セキュリティ、およびその他の内容の必要な検証を実行します。ゲートウェイ システムにメッセージ送信機能を配置する場合、主に次の 2 つの点を考慮する必要があります。
オンラインメッセージ送信テスト ゲートウェイ システムは、メッセージを送信するかどうかを制御するためにメッセージ制御テーブルを設定します。同時に、すべてのログ データを送信するのではなく、必要に応じてさまざまなディメンションからどのメッセージを送信する必要があるかを制御して、システム リソースの浪費を回避し、メッセージの使用効率を向上させることができます。 1. 通常のトランザクションメッセージの送信 つまり、送信サービスの基本的な機能テストです。トランザクション要求がバックグラウンドで正常に実行されると、ゲートウェイ システムのメッセージ送信機能がトリガーされ、要求に関連するログ情報がメッセージにカプセル化されて送信されます。メッセージ制御データは、読み取り速度を向上させるためにアプリケーション サーバーにキャッシュされ、POSTMAN ツールを通じて照会および検証できます。 メッセージ送信の明示的な表示はないため、ログを照会して、メッセージが正常かどうか、送信ルールがメッセージ制御テーブルの構成ルールに準拠しているかどうか、送信された内容が正確で完全かどうか、トピックが正しく使用されているかどうか、バス システムが正常かどうか、メッセージが正しく受信されているかどうかを確認してテストが完了します。 2. 送信されたトランザクションメッセージを確認する ゲートウェイシステムでは、トランザクションの実行結果(成功/失敗)を検証するための検証機能が提供されます。ネットワーク上の理由やその他の理由により、チェック済みトランザクションの結果が受信されない場合、トランザクションにメッセージ送信機能が構成されていると、チェック済みトランザクションの元のトランザクション情報がメッセージにカプセル化されて、トランザクションが正常に検証された後に送信されます。これにより、トランザクションのすべての使用シナリオでメッセージを正しく送信できるようになります。 3. 例外メッセージの処理 異常シナリオでは、主に Kafka がメッセージを正常に送信できない状況を検証します。 Kafka サーバーの IP アドレスを変更し、間違ったトピックを設定することで、Kafka メッセージ送信の失敗のシナリオをシミュレートし、ゲートウェイ システムが異常メッセージ テーブルにメッセージを正しく完全に記録できるかどうかを検証します。 4. サーキットブレーカーシナリオテスト サーキットブレーカーは、Kafka に異常があるか、メッセージ サービスに過度の負荷がかかっていることを意味します。その結果、ゲートウェイ システムの他の正常な機能に影響が及びます。ゲートウェイ システム自体が通常の外部サービスを提供できるようにするには、メッセージ サービスを一時的にシャットダウンする必要があります。送信するメッセージを異常メッセージ テーブルに記録し、メッセージを一括して再送信することで、メッセージ サービスが終了します。 バッチメッセージ処理テスト 定期的なポーリングにより、異常メッセージテーブルに記録されたメッセージが再送信されます。同時に、メッセージヒューズメカニズムが設定されます。 Kafka に異常が発生した場合、メッセージ送信はメッセージ記録テーブルに完全に切り替えられ、Kafka の完全な障害を回避しながら、このシステムの正常な外部サービスを確保します。 メッセージ再送信機能 当日の再送信メッセージは定期的にポーリングされ、異常メッセージ テーブルは 5 分ごとにスキャンされます。正常に送信されなかったメッセージは再送信されます。送信試行が 3 回失敗すると、メッセージのステータスが「異常」に更新されます。テストの主な検証内容は次のとおりです。
前日メッセージ再送機能は、前日に送信されなかった異常メッセージを再送信します。当日再送信機能に似ていますが、スケジュールされたポーリング機能ではありません。 例外メッセージのエクスポート 再送信後もメッセージが失敗する場合は、データの整合性を確保するために後続の処理用のエクスポート機能が提供されます。 パフォーマンステスト 生産後に予想されるメッセージ送信量は非常に大きく、1億以上と推定されるため、パフォーマンス要件は比較的高くなります。 推定トランザクション量を参考に、80/20ルール(トランザクション量の80%が20%の時間で発生する)に従うと、生産後のシステムのTPSは約7,000になると予測されます。システムの以前のパフォーマンステスト指標を参考に、標準ポジショニング2000を使用し、テストと生産のTPS比は1:3.5です。テスト環境リソースと本番環境リソースの比率は約 1:16 であり、TPS のテスト対本番環境比率よりもはるかに大きくなります。したがって、この基準に到達すれば、生産システムのパフォーマンス要件を満たすことができると考えています。 ベンチマーク テスト、負荷テスト、混合シナリオ テストを実施した結果、メッセージ サービスはテスト環境で 2,000 を超える TPS を達成し、システム リソースは適切な範囲内でした。 要約する Kafka は、ゲートウェイ システムのメッセージング サービスの基盤を提供する、比較的成熟したメッセージング システムです。ただし、Kafka では時折疑似死現象が発生し、メッセージがブロックされることがあります。当初は仮死状態という現象をシミュレートしようと計画していましたが、プロジェクト開発者や Kafka サポートスタッフと話し合った結果、当面はこのシナリオをシミュレートすることはできないことがわかり、これも今回残った残念な点です。 |
<<: VMworld 2020 Chinaが正式に開催:すべての目標を達成するためにすべての力を結集
>>: クラウド コンピューティング テクノロジーが中小企業の IT サービス市場をどのように変えるか
こんにちは、友達。前回私が書いた、誰かの悪意ある行為により、ウェブページがブロックされ、そのスナップ...
翻訳者 |李睿校正:孫淑娟ガバナンスにより一貫性と再現性がもたらされ、品質が決して損なわれることがな...
ネットユーザーがインターネットに参入する主要な入り口として、検索エンジンが企業のプロモーションにとっ...
今日、マルチクラウド環境は複雑になっています。複雑な価格体系と多数のクラウド コンピューティング サ...
hostus.us は、英国ロンドンのデータセンターに新しい KVM 仮想 VPS を追加したことを...
月給5,000~50,000のこれらのプロジェクトはあなたの将来ですはじめに:ウェブサイトへのURL...
[[264128]] 1. 一般的な OSD のトラブルシューティングOSD のトラブルシューティン...
今夜、28tui を閲覧していたところ、最近のホットな返信で、友人が自分の Web サイトが 1 か...
前回と同様に、この記事には他の URL リンク、特に以前に最適化された URL リンクをあまり多く含...
はじめに: マーケティングは死んだのか? 最近の演説で、マーケティングの創始者はこれを否定しました。...
中国初のオンラインスーパーマーケットである Yihaodian は、2008 年 7 月に正式に開始...
この記事は、現代中国人の共通点やメンタリティを考え、より人間的な視点からウェブ製品のユーザーエクスペ...
【捜狐ITニュース】2月14日、中国国際放送の「新聞新聞ダイジェスト」によると、春節期間中、ほとんど...
gcorelabs は、地中海に近いイスラエル第 2 の都市テルアビブにデータセンターを追加しました...
百度はアルゴリズムの大幅な調整を開始したと言われており、多くのウェブサイトのランキングが変わり、いく...