メッセージングシステムメッセージング システムは、データ プロデューサーの分離や未処理メッセージのキャッシュなど、さまざまなシナリオで使用されます。 Kafka は従来のメッセージング システムの代替として使用できます。従来のメッセージング システムと比較して、Kafka はスループットと可用性が優れているため、大規模なメッセージの処理に適しています。 経験則として、メッセージングでは通常、スループット要件は低くなりますが、エンドツーエンドのレイテンシが低くなる可能性があり、多くの場合、Kafka の信頼性の高い耐久性のあるメカニズムに依存します。 この点で、Kafka は従来のメッセージング システム (ActiveMQ および RabbitMQ) に匹敵します。 ストレージシステムKafka に書き込まれたデータはディスクに保存され、冗長バックアップが行われます。 Kafka では、プロデューサーは確認を待つことができます。構成により、すべてのレプリケーションが完了するまで書き込みが成功したとは見なされないようにすることができ、データの可用性が確保されます。 Kafka はストレージを重視しており、クライアントが読み取り位置を独自に制御できるようにします。 Kafka は、高パフォーマンス、低レイテンシ、高可用性のログ送信ストレージを提供できる特別なファイル システムと考えることができます。 ログ集約ログ システムには、通常、ログの収集、クリーニング、集約、保存、表示の機能が必要です。 Kafka は、他のログ集約ソリューションの代わりとしてよく使用されます。 Scribe や Flume と比較すると、Kafka は同等に優れたパフォーマンス、より堅牢なスタッキング保証、およびエンドツーエンドの低レイテンシを提供します。ログが記録されるため、Kafka でのログ集約のコストが高くなります。 Kafka はログを実現できます:
ELK は人気のあるログ記録システムです。 Kafka の協力により、より成熟したソリューションが実現します。 ELK テクノロジー スタックでは、Kafka は主にバッファの役割を果たし、必要に応じてログを収束できます。 写真 システム監視とアラームログ分析システムと同様に、監視とトラブルシューティングのためにシステムメトリックを収集する必要があります。違いは、メトリックは構造化データであるのに対し、ログは非構造化テキストであることです。メトリクス データは Kafka に送信され、Flink で集計されます。集計データは、リアルタイム監視ダッシュボードや PagerDuty などのアラート システムによって使用されます。 写真 コミットログKafka は分散システムの外部コミット ログとして機能できます。ジャーナルは、ノード間でデータを複製するのに役立ち、障害が発生したノードからデータを回復するための再同期メカニズムとして機能します。 Kafka のログ圧縮機能は、この使用法をサポートするのに役立ちます。 ウェブサイトアクティビティの追跡 - 推奨システムKafka の本来の目的は、ユーザー行動追跡パイプラインを、リアルタイムのパブリッシュ/サブスクライブ ソースのセットに再構築することです。ウェブサイトのアクティビティ (ウェブページの閲覧、検索、その他のユーザー操作) を中央トピックに公開します。各アクティビティ タイプはトピックに対応しています。これらのサブスクリプション ソースに基づいて、リアルタイム処理、リアルタイム監視、Kafka データの Hadoop またはオフライン データ ウェアハウス システムへのバッチ ロード、オフライン データ処理、レポート生成などの一連のユース ケースを実現できます。 各ユーザーは Web を閲覧する際に大量のアクティビティ情報を生成するため、アクティビティ追跡データの量は通常非常に大きくなります。 (Kafkaの実用化) Amazon のような電子商取引サイトでは、過去の行動や類似のユーザーを使用して製品の推奨を計算します。次の図は、推奨システムがどのように機能するかを示しています。 Kafka は生のクリックストリーム データを送信し、Flink はそれを処理し、モデル トレーニングはデータ レイクからの集約データを使用します。 写真 これにより、各ユーザーに対する推奨事項の関連性を継続的に改善することができます。 Kafka のもう 1 つの重要な使用例は、リアルタイムのクリックストリーム分析です。 ストリーム処理 - Kafka ストリーム APIKafka コミュニティは、データの生成と消費のメカニズムを提供するだけでは不十分であると考えています。また、ストリーミング データに対するリアルタイム処理メカニズムも提供する必要があります。 0.10.0.0 以降、Kafka は、Stremrs API を提供することで、軽量でありながら強力なストリーム処理を提供します。実際、ストリーム参照における次のようないくつかの厄介な問題を解決するのに役立つのは、Streams API です。
Streams API のストリーム処理は、入力トピックからデータを消費し、さまざまな処理を実行し、結果をターゲット トピックに書き込むという複数の段階で構成されています。 Streams API は、Kafka が提供するコア プリミティブに基づいて構築されています。入力と出力には Kafka のコンシューマーとプロデューサーを使用し、状態の保存には Kfka を使用します。 ストリーム処理フレームワーク: Flink、spark streaming、Storm は、正統的なストリーム処理フレームワークです。 Kafka は、ストリーム処理において、ストリーム ストレージとしての役割を果たします。 CDC (変更データキャプチャ)
写真 画像 システム移行レガシー サービスのアップグレードは困難です。
MQ を使用するとリスクを軽減できます。 注文サービスをアップグレードするには、古い注文サービスを更新して、Kafka からの入力を消費し、結果を ORDER トピックに書き込みます。新しい注文サービスは同じ入力を消費し、結果を ORDERNEW トピックに書き込みます。 写真 調整サービスは、ORDER と ORDERNEW を比較します。同じであれば、新しいサービスはテストに合格します。 イベントソーシングイベントがシステム内の第一級オブジェクト (つまり、真実のソース) として扱われる場合、保存されたアプリケーションの状態は一連のイベントとなり、システム内の他のすべてはこれらの永続的で不変のイベントに基づいて再計算できます。 イベント ソーシングは、一連のイベントにおける状態の変化をキャプチャすることです。通常、Kafka は主要なイベント ストアとして使用されます。障害、ロールバック、または状態の再構築が必要な場合、Kafka からのイベントはいつでも再適用できます。 |
>>: Amazon、AWS「サーバーレス」クラウドサービスの改善を発表:データベース容量をオンラインで拡張可能、クラウドキャッシュ技術「マイクロ秒遅延」
接続されたデバイスによって収集および送信されるデータの量が増加するにつれて、エッジ コンピューティン...
StarNet の以前の生徒からのフィードバックに基づいて、同様によく使用される単語をいくつか追加し...
検索エンジン スパイダーがページ コードを検索エンジン サーバーに送り返した後、SE はどのようにし...
[51CTO.comからのオリジナル記事]今日のデジタル時代において、ビジネスの革新と変革は、企業の...
先週の日曜日、私たちは友人たちと「2019 年のブランド トレンドと提案」について話し合い、興味深い...
クラウド時代のパフォーマンス監視戦略焦点を失うことなく変化に迅速に対応し、事業開発を推進できることは...
ここで、Hostcat は BandwagonHost の米国データセンター DC2 (USCA_2...
8 月 27 日、北京 - 大手インターネット インフラストラクチャ サービス プロバイダーの 21...
ロイターの報道によると、スノーデン氏が漏洩した文書に基づき、米国国家安全保障局(NSA)と暗号化会社...
利用者の苦情、レイオフ、事業ラインの縮小、上級役員の辞任など、数々の混乱を経験した後、共同購入業界は...
1. ジャック・マーが33億元で恒生グループを買収:恒生電子の筆頭株主に4月3日早朝、恒生電子が発表...
Linode は、米国南東海岸のフロリダ州第 2 の都市マイアミにデータセンターを構え、他のデータセ...
みなさんこんにちは。私はHongtu Internetです。以前、弊社のウェブサイトの1つでキーワー...
オープンソースは、世界中の開発者が知識を共有し、技術を共同で構築するための架け橋です。オープンソース...
はじめに:馬家佳のスタイルは、フェニックスニュースクライアントの位置付けとは対照的です。彼は、フェニ...