Kafka のプロデューサー、コンシューマー、ブローカーの基本概念

Kafka のプロデューサー、コンシューマー、ブローカーの基本概念

Kafka は、パブリッシングおよびサブスクリプションベースのメッセージング システムです。一般的には「分散コミット ログ」または「分散ストリーミング プラットフォーム」と呼ばれます。ファイル システムまたはデータベースのコミット ログは、すべてのトランザクションの永続的な記録を提供するために使用され、これらのログを再構築することでシステムの状態を再構築できます。同様に、Kafka データは特定の順序で永続化および保存され、オンデマンドで読み取ることができます。

1. Kafka トポロジ

2. カフカの特徴

配信とサブスクリプションの両方に高いスループットを提供します。 Kafka は 1 秒あたり約 250,000 メッセージ (50 MB) を生成し、1 秒あたり 550,000 メッセージ (110 MB) を処理できるとされています。ここで言及されているメッセージの数は、メッセージのサイズが一定でない可能性があるため、特に正確ではない可能性があります。

永続化操作を実行してメッセージをディスクに永続化し、ログの形式で保存できるため、ETL などのバッチ消費やリアルタイム アプリケーションに使用できます。データをハードディスクに保存し、複製することでデータの損失を防ぎます。
分散型システムなので、外部への拡張が容易です。複数のプロデューサー、ブローカー、コンシューマーが存在し、それらはすべて分散されます。ダウンタイムなしでマシンを拡張します。

メッセージ処理の状態はサーバー側ではなくコンシューマー側で維持され、障害が発生した場合に自動的にバランスをとることができます。
オンラインとオフラインのシナリオをサポートします。

3. Kafka の核となる概念

用語集
プロデューサーメッセージプロデューサー
消費者メッセージ 消費者
ConsumerGroup コンシューマ グループ。トピック内のパーティションからメッセージを並行して消費できます。
ブローカー キャッシュ エージェント、Kafka クラスター内の 1 つ以上のサーバーは総称してブローカーと呼ばれます。
トピックKafkaはさまざまな種類のメッセージソース(メッセージのフィード)を処理します。
パーティション トピックは物理的なグループ化です。トピックは複数のパーティションに分割でき、各パーティションは順序付けられたキューです。パーティション内の各メッセージには順序付けられたID(オフセット)が割り当てられます。
メッセージはコミュニケーションの基本単位です。各プロデューサーはトピックにいくつかのメッセージを公開できます。
プロデューサーはメッセージとデータを生成する存在です。 Kafka トピックにメッセージを公開するプロセスはプロデューサーと呼ばれます。
消費者はメッセージとデータの消費者です。トピックをサブスクライブし、公開されたデータを処理するプロセスは、コンシューマーと呼ばれます。

3.1 プロデューサーの概念

メッセージおよびデータ ジェネレーター。 Kafka トピックにメッセージを公開するプロセスはプロデューサーと呼ばれます。
プロデューサーは指定されたトピックにメッセージを公開します。プロデューサーは、たとえばラウンドロビン方式やその他のアルゴリズムに基づいて、メッセージがどのパーティションに属するかを決定することもできます。
非同期バッチ送信により、送信効率を効果的に向上できます。 kafka プロデューサーの非同期送信モードでは、バッチ送信が可能になります。メッセージは最初にメモリにキャッシュされ、その後一度にバッチで送信されます。

3.2 ブローカーの概念:

ブローカーにはレプリカ メカニズムがありません。ブローカーがダウンすると、そのブローカーのメッセージは利用できなくなります。
ブローカーはサブスクライバーのステータスを保存しません。これはサブスクライバー自身によって保存されます。
ステートレスであるため、メッセージを削除することが困難です (削除されたメッセージはサブスクライブされている可能性があります)。 Kafka は時間ベースの SLA (サービス保証) を使用し、メッセージは一定期間 (通常は 7 日間) 保存された後に削除されます。
消費者加入者は、任意の場所に戻って再度視聴することができます。サブスクライバーに障害が発生した場合、最小のオフセット (ID) を選択して消費メッセージを再読み取りできます。

3.3 メッセージの構成

メッセージ: コミュニケーションの基本単位です。各プロデューサーはトピックにメッセージを公開できます。
Kafka のメッセージはトピックに基づいて整理されます。さまざまなトピックは互いに独立しています。各トピックは異なるパーティションに分割でき、各パーティションにはメッセージの一部が格納されます。
パーティション内の各メッセージには、次の 3 つの属性が含まれます。
オフセット長い
メッセージサイズ int32
データメッセージの具体的な内容

3.4 消費者の概念

メッセージとデータのコンシューマー、トピックをサブスクライブし、公開されるメッセージを処理するプロセスをコンシューマーと呼びます。 Kafka では、グループを「サブスクライバー」と考えることができます。トピック内の各パーティションは、「サブスクライバー」内のコンシューマーによってのみ消費されますが、コンシューマーは複数のパーティションからのメッセージを消費できます。注: Kafka の設計原則では、トピックの場合、同じグループには同時に消費するパーティションの数よりも多くのコンシューマーを含めることはできません。そうしないと、一部のコンシューマーがメッセージを取得できないことになります。

<<:  クラウドの可観測性における5つの主要な新たなトレンド

>>:  クラウドネイティブシナリオでサーバーレスアプリケーションプログラミングモデルを体験する

推薦する

専門家と非専門家がオンラインで安全を保つ方法を比較する

Google セキュリティ ブログによると、最近の論文は「なぜ人々はセキュリティ オプションを (他...

マイクロソフトは360およびテンセントと提携し、Windows 10への無料アップグレードを提供

3月18日、マイクロソフトのWindowsハードウェアエンジニアリング業界イノベーションサミット(W...

SEO競争は競合他社のあらゆる動きを明らかにする

以前、FMCG(Fast Moving Consumer Goods)業界で働いていたとき、競合他社...

Microsoft Office 365 は、エンタープライズ デジタル ミドル プラットフォームという大きな敵に直面しています。

マイクロソフトは、企業の共同オフィスのニーズを満たすために Office 365 をリリースしました...

誰もが雷鋒である——ソーシャルプラットフォームがユーザーエンゲージメントを向上させる方法

多くのソーシャル プラットフォーム開発者は、ポイント、レベル、リーダーボードなどのゲームのようなメカ...

HPE Aruba Networking: 中小企業の発展を促進する4大クラウドネットワーク管理

著者: Yu Shidan、Aruba China テクニカル セールス ディレクター近年、中小企業...

12月のウェブサーバー市場:Apacheは3.08%下落、Microsoftは上昇

IDC Review Network (idcps.com) は 12 月 11 日に次のように報告...

テンセントクラウドの「AIスーパーベース」特別セッションがWOTカンファレンスで発表され、技術革新がAIインフラの新たな章を導く

過去2年間、「百機種戦争」は中国で人気の技術トピックになりました。 2020年以降、中国は大型モデル...

新たなクラウドサービスが停止、今回はNetEase

最近、NetEase Photo Albumは今年5月8日から完全に運営を停止し、サーバーをシャット...

ショッピングモールのウェブサイトの最適化から得られた3つの洞察

私は瑞品モールに1年以上在籍し、多くのことを学びました。SEOのスキルが向上しただけでなく、お茶の飲...

Jianwang App Factory: 印刷メディアはアプリ開発チームを維持する必要がない

編集者注: 2013 年中国インターネット起業家会議 (http://2013.loohua.com...

九江にJDシティデジタル経済産業パークが設立され、デジタルインテリジェンスで長江経済ベルトの変革とアップグレードを推進しています。

4月16日、JD都市長江経済ベルト(九江)デジタル経済産業パーク(以下、「産業パーク」という)が盛大...

Taobao Affiliate Station の所有者は、Baidu アルゴリズムの調整にどのように対処すべきでしょうか?

最近、Baidu のいくつかのメジャーアップデートは、多数のウェブマスターに影響を与えており、特に ...

ウェブサイトの初期段階ではソフト記事の重要な原動力について考えていなかったかもしれません

誰もがオンラインマーケティングにおけるソフト記事の重要性を知っています。私がダイエット薬を販売してい...

SEO最適化に適したウェブサイトの構築方法

ウェブマスターの皆さんにとって、ウェブサイトの構築は馴染みのない話題ではないかもしれません。私たち草...