9枚の写真、カフカがZookeeperを放棄した理由

9枚の写真、カフカがZookeeperを放棄した理由

[[394712]]

最近、Confluent コミュニティが記事を公開しました。この記事では主に、Kafka の将来のバージョン 2.8 で Zookeeper が廃止されることについて説明されており、これは Kafka ユーザーにとって重要な改善点です。以前は、Kafka をデプロイするときに Zookeeper をデプロイする必要がありましたが、現在は Kafka のみをデプロイすれば済みます。 [1]

1. Kafka の紹介

Apache Kafka は最初に Linkedin によって開発され、後に Apack Foundation に寄贈されました。

Kafka は分散ストリーム処理プラットフォームとして正式に定義されており、高いスループット、永続性、水平スケーラビリティを備えているため広く使用されています。現在、Kafka には次の特定の機能があります。

  • メッセージ キュー、Kafka には、システム分離、トラフィック ピークの削減、バッファリング、非同期通信などのメッセージ キューの機能があります。
  • 分散ストレージ システムである Kafka は、メッセージを永続化し、複数のコピーを使用してフェイルオーバーを実装できるため、データ ストレージ システムとして使用できます。
  • リアルタイムデータ処理のために、Kafka は、リアルタイムデータを処理する機能を持つ Kafka Streams や Kafka Connect などのデータ処理に関連するいくつかのコンポーネントを提供します。

次の図はKafkaのメッセージモデルを示しています。[2]

上の図を通して、Kafka のいくつかの主要な概念を紹介します。

  • プロデューサーとコンシューマー: メッセージ キュー内のプロデューサーとコンシューマー。プロデューサーはキューにメッセージをプッシュし、コンシューマーはキューからメッセージをプルします。
  • コンシューマー グループ: 同じトピックの異なるパーティションからのメッセージを並行して消費できるコンシューマーのコレクション。
  • ブローカー: Kafka クラスター内のサーバー。
  • トピック: メッセージ カテゴリ。
  • パーティション: トピックの物理的なグループ化。トピックにはパーティションを設定できます。各パーティション内のメッセージには、オフセットとして順序付けられた ID が割り当てられます。各コンシューマー グループには、パーティションを消費するコンシューマーが 1 つだけ存在します。

2. Kafka と Zookeeper の関係

Kafka のアーキテクチャを下図に示します。図からわかるように、Kafka には Zookeeper の協力が必要です。それで、それらはどのように連携するのでしょうか?

下の写真をご覧ください。

図からわかるように、Kafka の作業には Zookeeper の協力が必要です。それで、それらはどのように連携するのでしょうか?

下の写真をご覧ください。

2.1 登録センター

2.1.1 ブローカー登録

上図からわかるように、ブローカー分散展開では、統一管理のために登録センターが必要です。 Zookeeper は、ブローカー サービス リスト (/brokers/ids) を保存するために専用のノードを使用します。

ブローカーが起動すると、Zookeeper に登録要求が送信されます。 Zookeeper は、/brokers/ids の下に /brokers/ids/[0...N] などのブローカー ノードを作成し、ブローカーの IP アドレスとポートを保存します。

このノードは一時ノードです。ブローカーがダウンすると、この一時ノードは自動的に削除されます。

2.1.2 トピック登録

Zookeeper はトピックに個別のノードも割り当て、各トピックは /brokers/topics/[topic_name] の形式で Zookeeper に記録されます。

トピックのメッセージは複数のパーティションに保存され、これらのパーティションとブローカー間の対応も Zookeeper に保存する必要があります。

パーティションは複数のコピーで保存されます。上図の赤いパーティションはリーダーコピーです。リーダー レプリカが配置されているブローカーに障害が発生した場合、パーティションはリーダーを再選出する必要があり、これは Zookeeper によって実行される必要があります。

ブローカーが起動されると、ブローカー ID が対応するトピック ノードのパーティション リストに登録されます。

次のコマンドを使用して、xxx​​ という名前のトピックとパーティション番号 1 の情報を確認します。

  1. [root@master] /brokers/topics/xxx/partitions/1/state を取得します
  2. { "controller_epoch" :15、 "leader" :11、 "version" :1、 "leader_epoch" :2、 "isr" :[11,12,13]}

ブローカーが終了すると、Zookeeper は対応するトピックのパーティション リストを更新します。

2.1.3 消費者登録

コンシューマー グループも Zookeeper に登録され、Zookeeper は関連データを保存するためにコンシューマー グループにノードを割り当てます。ノード パスは /consumers/{group_id} で、次に示すように 3 つの子ノードがあります。

このようにして、Zookeeper はパーティションとコンシューマーの関係、およびパーティションのオフセットを記録できます。 [3]

2.2 負荷分散

ブローカーが Zookeeper に登録されると、プロデューサーはブローカー ノードに基づいてブローカー サービス リストの変更を認識し、動的な負荷分散を実現します。

コンシューマー グループ内のコンシューマーは、トピック ノード情報に基づいて特定のパーティションからメッセージをプルし、負荷分散を実現できます。

実際、次の図に示すように、Kafka は Zookeeper に大量のメタデータを保存します。

ブローカー、トピック、パーティションの数が増えるにつれて、保存されるデータの量はますます大きくなります。

3. コントローラの紹介

前のセクションの説明から、Kafka は Zookeeper に大きく依存していることがわかります。 Kafka は Zookeeper なしでは独立して実行できません。では、Kafka は Zookeeper とどのようにやり取りするのでしょうか?

次の図に示すように: [4] Kafkaクラスターでは、ブローカーがZookeeperと対話するコントローラーとして選出されます。 Kafka クラスター全体のすべてのパーティションとレプリカのステータスを管理する役割を担います。他のブローカーは、コントローラー ノード上のデータの変更を監視します。

コントローラーの選択は Zookeeper に依存します。選出が成功すると、Zookeeper は一時的なノード / コントローラーを作成します。

管理者の具体的な責任は次のとおりです。

  • パーティションの変更を監視する

たとえば、パーティションのリーダーに障害が発生すると、コントローラはパーティションの新しいリーダーを選出します。パーティションの ISR セットで変更が検出されると、コントローラはすべてのブローカーにメタデータを更新するように通知します。トピックがパーティションを追加すると、コントローラーがパーティションの再割り当てを担当します。

  • トピック関連の変更を監視する
  • ブローカー関連の変更を監視する
  • クラスターメタデータ管理

次の図は、コントローラー、Zookeeper、ブローカー間の相互作用の詳細を示しています。

コントローラーが正常に選出されると、Zookeeper クラスターからメタデータの完全なセットが取得され、ControllerContext が初期化され、このメタデータがコントローラー ノードにキャッシュされます。トピック パーティションの追加など、クラスターが変更されると、コントローラーはローカル キャッシュ データを変更するだけでなく、この変更情報を他のブローカーと同期する必要もあります。

コントローラーは、Zookeeper イベント、スケジュールされたタスク イベント、およびその他のイベントを監視した後、これらのイベントを順番に LinkedBlockingQueue に一時的に保存し、イベント処理スレッドが順番に処理します。これらのプロセスのほとんどは Zookeeper とのやり取りを必要とし、コントローラーは独自のメタデータを更新する必要があります。

4. Zookeeper の問題

Kafka 自体は分散システムですが、それを管理するには別の分散システムが必要であり、間違いなく複雑さが増します。

4.1 運用と保守の複雑さ

Zookeeper を使用する場合、Kafka を導入する際に 2 つのシステムを導入する必要があり、Kafka の運用保守担当者は Zookeeper の運用保守能力を備えている必要があります。

4.2 コントローラのトラブルシューティング

Kafaka は、Zookeeper と対話するために単一のコントローラー ノードに依存します。このコントローラー ノードに障害が発生した場合は、ブローカーから新しいコントローラーを選択する必要があります。下の図に示すように、新しいコントローラーは broker3 になります。

新しいコントローラーが正常に選出されると、初期化のために Zookeeper からメタデータが再度取得され、他のすべてのブローカーに ActiveControllerId を更新するように通知する必要があります。古いコントローラーは、リスニング、イベント処理スレッド、およびスケジュールされたタスクをシャットダウンする必要があります。パーティションの数が非常に多い場合、このプロセスには非常に時間がかかり、このプロセス中は Kafka クラスターは動作できません。

4.3 パーティションのボトルネック

パーティションの数が増えると、Zookeeper に保存されるメタデータの量が増加し、Zookeeper クラスターへの負荷が増加します。一定のレベルに達すると監視の遅延が増加し、Kafka の動作に影響します。

したがって、単一の Kafka クラスターによって実行されるパーティションの数がボトルネックになります。そして、これはまさに一部のビジネス シナリオで必要なことです。

5. アップグレード

アップグレード前とアップグレード後のアーキテクチャ図を比較すると、次のようになります。

KIP-500 は、以前のコントローラーを Quorum コントローラーに置き換えます。クォーラム内の各コントローラー ノードはすべてのメタデータを保存し、KRaft プロトコルを通じてレプリカの一貫性を確保します。この方法では、クォーラム コントローラー ノードに障害が発生した場合でも、新しいコントローラーの移行は非常に高速になります。

公式紹介によれば、アップグレード後、Kafka は数百万のパーティションを簡単にサポートできるようになります。

Kafkaチームは、Raftプロトコル(略してKRaft)を介してデータを同期する方法であるKafka Raftメタデータモードと呼んでいます。

Kafka のユーザーベースは非常に大きいため、サービスを停止せずにアップグレードする必要があります。

現在、Zookeeper を削除する Kafka コード KIP-500 がトランク ブランチに送信されており、将来の 2.8 バージョンでリリースされる予定です。

Kafaka はバージョン 3.0 で Zookeeper Controller および Quorum Controller と互換性を持たせ、ユーザーがグレースケール テストを実行できるようにする予定です。 [5]

6. まとめ

大規模クラスターやクラウドネイティブのコンテキストでは、Zookeeper を使用すると、Kafka の運用と保守、クラスターのパフォーマンスに大きな負担がかかります。 Zookeeper を削除することは避けられない傾向であり、シンプルさというアーキテクチャの考え方にも沿っています。

参照

[1] 参考文献1:

https://www.confluent.io/blog/kafka-without-zookeeper-a-sneak-peek/

[2] 参考文献2:

https://blog.csdn.net/Zidingyi_367/article/details/110490910

[3] 参考文献3:

https://www.jianshu.com/p/a036405f989c

[4] 参考文献4:

https://honeypps.com/mq/kafka-controller-analysis/

[5] 参考文献5:

https://mp.weixin.qq.com/s/ev6NM6hptltQBuTaCHJCQQ

<<:  インターネットを再構築するために新しいオープングリッドアライアンスが設立されました

>>:  仮想マシンはもういらない! PC 上で Docker を実行する正しい方法についてお話ししましょう。

推薦する

クラウド データ ウェアハウスの将来動向: コンピューティングとストレージの分離

[[403506]]背景クラウド時代の到来とともに、データベースもクラウド データベース時代を迎え始...

Tencent Cloud の「データ損失」が疑問を呼ぶ:クラウド サービスは安全か?

最近、新興企業「Frontier CNC」がTencent Cloudを批判する記事を発表し、業界の...

定番のおすすめ:香港格安サーバー、香港格安サーバーレンタル業者のご紹介

香港のサーバーは高速で、登録不要、コンテンツも充実していますが、香港のサーバーは高価で、安価な香港の...

Qiyi Marketing MobileとAiyouyouは戦略的提携を結び、パートナーに香港とマカオへの無料ツアーを提供する。

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています最近、Qi...

7か月間でウェブサイトのタイトルを3回変更したことによるウェブサイトへの影響

ウェブサイトのタイトルを変更すると、ウェブサイトに影響がありますか? 私のウェブサイト、Mitao ...

エンタープライズ変革: 仮想化がクラウド コンピューティングに与える影響

仮想化は、IT 業界における最高のテクノロジーの 1 つと考えられています。仮想化によってもたらされ...

Slow Company の秘密を解読する 6 つの質問: Douban とは何ですか?

【はじめに】豆瓣は主流メディアではあまり見かけません。自然に成長している「スローカンパニー」であるこ...

Zenlayerの香港データセンターはどうですか? Zenlayer 香港国際線サーバーのレビュー

世界的に有名なコンピュータールームであるzenlayerは、アジアで最も有名な金融センターと貨物配送...

Baiduの検索結果にモバイルアプリの表示が追加される

Baidu 検索結果のスクリーンショット新浪科技は5月2日夜、百度包括コンピューティングが新たなコン...

テンセントと百度の戦い、「ミニプログラム」が勝敗を分けるか?

わずか1年余りで、to Bは中国のインターネットで人気のトレンドになりました。 3月末、馬化騰氏はI...

360度検索の課題に対応するために、Baidu Search Allianceはすべてのウェブサイトにオープンしています

2010 年 7 月 1 日、Baidu Alliance は中小規模の URL とのトラフィックの...

求人サイトの運営スキルと経験について簡単に説明します

私は3年間、機能的なウェブサイト運営の指揮を執ってきました。この3年間、業界ウェブサイトの最も基本的...

gigenetcloud-25 USD/月 50.33TB 月間トラフィック/512MB メモリ/20GB ハードディスク

512M メモリ、20G ハードディスク、標準 333G 月間トラフィック、G ポ​​ート、シカゴ、...

ワーナークラウド:年末割引、クラウドサーバーは最安280元/半年、香港ハイディフェンスは最安999元、評価情報付き

ワーナークラウドは12月下旬に年末カーニバルイベントを開始し、香港クラウドサーバーは半年払いで280...

resellerclub - 10 月のドメイン プロモーション、ドメインは最低 $1.99

resellerclub は、非常に有名な外国ドメイン名の再販業者です。多くの国内ユーザーは、彼らに...