正直、RabbitMQ と Kafka のどちらを選ぶべきでしょうか?

経験豊富なマイクロサービスシステムアーキテクトとして、RabbitMQ と Kafka のどちらを選ぶべきかとよく尋ねられます。

[[319666]]

画像はPexelsより

何らかの理由で、多くの開発者はこれら 2 つのテクノロジを同等のものとして扱います。実際、いくつかのケースのシナリオでは、RabbitMQ と Kafka のどちらを選択しても違いはありませんが、基盤となる実装の点では、これら 2 つのテクノロジの間には多くの違いがあります。

シナリオによって必要なソリューションは異なり、間違ったソリューションを選択すると、ソフトウェアの設計、開発、保守の能力に重大な影響を与える可能性があります。

この記事では、まず基本的な非同期メッセージングモードを紹介し、次に RabbitMQ と Kafka とその内部構造情報を紹介します。第 2 部 (未完成) では、主に 2 つのテクノロジの主な違いと、それぞれの利点と欠点について説明します。最後に、2 つのテクノロジの選択方法について説明します。

非同期メッセージングモード

非同期メッセージングは、メッセージの生成と処理を分離するソリューションとして使用できます。メッセージングシステムについて話すとき、通常は、メッセージキューとパブリッシュ/サブスクライブという 2 つの主要なメッセージングパターンについて考えます。

メッセージキュー

メッセージキューは、プロデューサーとコンシューマーを分離するために使用できます。複数のプロデューサーが同じメッセージキューにメッセージを送信できます。

ただし、メッセージがコンシューマーによって処理されると、メッセージはロックされるかキューから削除され、他のコンシューマーはメッセージを処理できなくなります。つまり、特定のメッセージは 1 人のコンシューマーによってのみ消費されます。

メッセージキュー

コンシューマーがメッセージの処理に失敗した場合、メッセージングシステムは通常、メッセージをキューに戻して、他のコンシューマーが引き続き処理できるようにすることに注意することが重要です。

分離機能の提供に加えて、メッセージキューはプロデューサーとコンシューマーを個別にスケーリングし、エラー処理のフォールトトレランスを提供することもできます。

公開/購読

パブリッシュ/サブスクライブ (pub/sub) モデルでは、単一のメッセージを複数のサブスクライバーが同時に取得して処理できます。

公開/購読

たとえば、システムで生成されたイベントは、パブリッシャーがこのパターンを通じてすべてのサブスクライバーに通知するために使用できます。多くのキューイングシステムでは、トピックという用語は、パブリッシュ/サブスクライブモデルを指すためによく使用されます。

RabbitMQ では、トピックはパブリッシュ/サブスクライブモデルの特定の実装 (より正確には、交換の一種) ですが、この記事ではトピックとパブリッシュ/サブスクライブを同等のものとして扱います。

一般的に、サブスクリプションには 2 つの種類があります。

一時的なサブスクリプションは、コンシューマーが稼働している間のみ存在します。コンシューマーが終了すると、対応するサブスクリプションと未処理のメッセージは失われます。
永続サブスクリプションは、削除しない限り常に存在します。コンシューマーが終了した後も、メッセージングシステムはサブスクリプションを維持し続け、後続のメッセージは引き続き処理されます。

ラビットMQ

RabbitMQ は、メッセージミドルウェアの実装として、サービスバスとしてよく使用されます。 RabbitMQ は、上記の 2 つのメッセージモードをネイティブにサポートしています。

その他の一般的なメッセージミドルウェアの実装としては、ActiveMQ、ZeroMQ、Azure Service Bus、Amazon Simple Queue Service (SQS) などがあります。

これらのメッセージミドルウェアの実装には多くの共通点があります。この記事で説明した概念の多くは、これらのミドルウェアにほぼ適用できます。

列

RabbitMQ は、標準的なメッセージキューをすぐにサポートします。開発者は名前付きキューを定義し、パブリッシャーはこの名前付きキューにメッセージを送信できます。最後に、コンシューマーはこの名前付きキューを通じて保留中のメッセージを取得できます。

メッセージ交換

RabbitMQ はメッセージ交換を使用してパブリッシュ/サブスクライブモデルを実装します。パブリッシャーは、サブスクライバーが誰であるかを知らなくても、メッセージ交換にメッセージを公開できます。

交換にサブスクライブする各コンシューマーはキューを作成します。メッセージ交換は、生成されたメッセージをコンシューマーが消費できるようにキューに入れます。メッセージ交換では、さまざまなルーティングルールに基づいて、一部のサブスクライバーのメッセージをフィルター処理することもできます。

RabbitMQ メッセージ交換

RabbitMQ は一時的なサブスクリプションタイプと永続的なサブスクリプションタイプの両方をサポートしていることに注意することが重要です。消費者は RabbitMQ の API を呼び出して、希望するサブスクリプションの種類を選択できます。

RabbitMQ のアーキテクチャ設計に基づいて、ハイブリッドアプローチを作成することもできます。つまり、サブスクライバーがチームを形成し、グループ内でコンシューマーとして競争して、特定のキュー上のメッセージを処理します。この加入者のグループはコンシューマーグループと呼ばれます。

このようにして、パブリッシュ/サブスクライブモデルを実装し、受信したメッセージを処理するためにサブスクライバーをスケールアップすることができます。

キューと組み合わせたパブリッシュ/サブスクライブ

アパッチカフカ

Apache Kafka はメッセージングミドルウェアの実装ではありません。むしろ、それは単なる分散ストリーミングシステムです。

キューと交換に基づく RabbitMQ とは異なり、Kafka のストレージ層はパーティション化されたトランザクションログを使用して実装されます。

Kafka は、リアルタイムストリーム処理用のストリーミング API と、さまざまなデータソースとの統合を容易にするコネクタ API も提供します。ただし、これらはこの記事の範囲を超えています。

クラウドベンダーは、Azure Event Hubsy や AWS Kinesis Data Streams など、Kafka ストレージ層向けのオプションのソリューションを提供しています。

Kafka ストリーミング機能向けの特定のクラウドおよびオープンソースソリューションもいくつかありますが、これもこの記事の範囲外です。

テーマ

Kafka はキューのようなものを実装していません。したがって、Kafka はレコードのセットをカテゴリに保存し、これらのカテゴリをトピックと呼びます。

Kafka はトピックごとにメッセージのパーティション化されたログを維持します。各パーティションは、順序付けられた不変のレコードのシーケンスで構成され、メッセージは末尾に連続して追加されます。

メッセージが到着すると、Kafka はそれをパーティションの末尾に追加します。デフォルトでは、Kafka はラウンドロビンパーティショナーを使用して、メッセージを複数のパーティションに一貫して分散します。

Kafka は、メッセージの論理フローを作成する動作を変更できます。たとえば、マルチテナントアプリケーションでは、各メッセージのテナント ID に基づいてメッセージフローを作成できます。

IoT シナリオでは、一定レベルの ID 情報に基づいて、プロデューサーを特定のパーティションにマップできます。

同じ論理フローからのメッセージが同じパーティションにマップされていることを確認します。これにより、メッセージがコンシューマーに順番に提供されることが保証されます。

カフカプロデューサー

コンシューマーは、パーティションオフセット (またはインデックス) を維持してメッセージを順番に読み取り、メッセージを消費します。

単一のコンシューマーは複数の異なるトピックから消費することができ、コンシューマーの数は利用可能なパーティションの最大数まで拡張できます。

したがって、トピックを作成するときは、作成されたトピックで予想されるメッセージスループットを慎重に考慮する必要があります。同じトピックを消費する複数のコンシューマーのグループをコンシューマーグループと呼びます。

Kafka が提供する API は、同じコンシューマーグループ内の複数のコンシューマー間のパーティションバランスと、コンシューマーの現在のパーティションオフセットのストレージを処理できます。

Kafka コンシューマー

Kafka によって実装されたメッセージパターン

Kafka の実装は、パブリッシュ/サブスクライブパターンに適合します。プロデューサーは特定のトピックにメッセージを送信でき、その後、複数のコンシューマーグループが同じメッセージを消費できます。各コンシューマーグループは、対応する負荷を処理するために個別にスケーリングできます。

コンシューマーは独自のパーティションオフセットを維持するため、再起動後にオフセットを失わない永続サブスクリプションと、再起動後にオフセットを失い、再起動のたびにパーティション内の最新のレコードから読み取りを開始する一時サブスクリプションのどちらかを選択できます。

ただし、この実装は、一般的なメッセージキューモードと完全に同等であるとは言えません。もちろん、コンシューマーを持つコンシューマーグループに関連付けられたトピックを作成することもできます。

このようにして、典型的なメッセージキューをシミュレートしました。ただし、これには多くの欠点があり、パート 2 で詳しく説明します。

Kafka は、コンシューマーがメッセージを消費したかどうかに基づかず、事前に設定された時間パーティションにメッセージを保持することに注意することが重要です。

この保持メカニズムにより、消費者は以前のメッセージを自由に読み返すことができます。さらに、開発者は Kafka のストレージ層を使用して、イベントトレースやログ監査などの機能を実装することもできます。

結論

RabbitMQ と Kafka は同等であると見なされることもありますが、実装は大きく異なります。

したがって、これらを同じ種類のツールとして扱うことはできません。 1 つはメッセージミドルウェアであり、もう 1 つは分散ストリーミングシステムです。

ソリューションアーキテクトとして、私たちはそれらの違いを認識し、特定のシナリオでどのタイプのソリューションを使用するかを可能な限り検討する必要があります。

2 番目の部分 (未完成) では、これらの違いを指摘し、各ソリューションをいつ使用するかについてのガイダンスを提供します。これは後で更新される予定です。

<<: Tencent MeetingがAPIインターフェースを公開し、企業専用の「Tencent Meeting」を開設

>>: エッジコンピューティングとクラウドコンピューティング: どちらがより効果的でしょうか?

クラウドコンピューティングの10年: インターネット大手の勢力争いと生死をかけた闘い

正直、RabbitMQ と Kafka のどちらを選ぶべきでしょうか?

クラウドコンピューティングの10年: インターネット大手の勢力争いと生死をかけた闘い

春節の紅包を「誘拐」したのは誰ですか?

SEO時代のもう一つのインパクト：Green Radish 2.0ダイレクトソフト記事プロモーション

可観測性によって開発者の役割がどのように再定義されるか

健康食品ウェブサイトの発展の道筋についての簡単な議論

ビッグネットワークデータはどうでしょうか? 2Gbpsの帯域幅を持つクラウドサーバーをテストしてみましょう

Dmoz ディレクトリに Web サイトを効果的に送信するにはどうすればよいですか?

中国の外部リンク専門家の悲しさについて語る

「4つの強力なツール」がWeiboマーケティングを効果的にする

コンテンツマーケティングを行う際に考慮すべきことは何ですか?

推薦する

Qutoutiaoのコンテンツブレイクスルー

なぜ Google はクラウドサービスの開発に失敗し、電子商取引サイトが先行したのでしょうか?

タクシー配車ソフトウェアの観点から、両社の競争によるマーケティング上のメリットについて語る

エッジコンピューティングがIoTアプリケーションを簡素化する方法

HPEとGoogle Cloudが協力してハイブリッドクラウドソリューションを提供

SEO起業の条件や収益化のアイデアについて何を知っていますか?

初心者の視点から見たSEO：ウェブサイトの本来の価値を見落としがちです

タイガースニフの徹底分析：成功する製品はどのように作られるか

ウェブサイトのページナビゲーションの最適化: タイトルの重複と重みの分散を解決する

Androidフォーラムがハッキングされ、数百万人のメンバーのデータが漏洩した可能性

V.PS: 全アイテムが 10% オフ、IP が 8 で終わるお客様のトラフィックが 2 倍、古いユーザーの場合は無料の構成アップグレードまたはトラフィックが 2 倍

レノボIDVインテリジェントクラウドデスクトップソリューションが2019年および2020年上半期の市場シェアで第1位を獲得

エッジコンピューティングの支出は2026年までに3,170億ドルに達する

SAP は Baicaibang がデジタル化の基盤を築き、顧客に優れたコミュニケーションサービスを提供できるよう支援します

Alibaba Cloudの「Automotive Cloud」がYunqiカンファレンスでデビューしました。 Xpeng、FAW、Great Wall、Horizonなどはすべてクラウドに移行しました