とてもクール! Kafka は Zookeeper を削除しました。

とてもクール! Kafka は Zookeeper を削除しました。

[[396651]]

この記事はWeChat公式アカウント「妹の味」から転載したもので、著者は妹が飼っている犬です。記事を転載する場合は、ミスシスターテイスト公式アカウントまでご連絡ください。

この機会をお祝いしましょう!最新バージョンの Kafka 2.8.0 では、Zookeeper への依存関係がなくなり、KRaft を通じて独自のクラスターを管理します。非常に良い、非常に良い、ようやく質的な変化が起こった。

KRaft と聞いたとき、私たちは Raft プロトコルを思い浮かべました。 Raft プロトコルは、現在最も人気のある分散調整アルゴリズムです。 Etcd や Consul などのシステムの基盤となります。今ではカフカにもそれが備わっている。

この機能は非常に新しいため、バージョン 2.8.0 ではデフォルトでまだ ZooKeeper が使用されていますが、試してみることを止めることはできません。また、あまり興奮しすぎないでください。一部の機能はまだ完璧ではないと公式が主張しているため、オンラインでは使用しないでください。

1. KRaft を起動するにはどうすればいいですか?

Kafka は ZooKeeper の代わりに組み込みの KRaft を使用します。これは、ES などの分散システムがクラスターのメタ情報を自己循環方式で同期するため、大きな改善です。

しかし、KRaft を使い始めるにはどうすればいいのでしょうか?多くの学生が混乱しています。この分野の情報は比較的少ないですが、使い方は非常に簡単です。

config ディレクトリの下に、kraft という新しいディレクトリがあり、そこに ZK への依存関係を直接放棄できる新しい構成ファイル セットが含まれていることに気付きました。

次の 3 行のコマンドを使用すると、ZK を介さずにスタンドアロン ブローカーを起動できます。

  1. # ./bin/kafka-storage.sh ランダムUUID
  2. # ./bin/kafka-storage.sh フォーマット -t TBYU7WMiREexuZqrjKG60g -c ./config/kraft/server.properties
  3. # ./bin/kafka-server-start.sh ./config/kraft/server.properties

しばらくパチパチ音が鳴った後、No ZK Kafka が始まりました。

とても簡単です。

2. 設定方法は?

Kafka は、このメタデータを保存するために @metadata という内部トピックを追加します。

次に、いくつかの重要な構成情報を見ていきます。主な違いを確認するには、vimdiff config/server.properties config/kraft/server.properties を使用できます。

まず、Kraft には process.roles と呼ばれる追加の構成があります。設定ファイルでは次のようになります。

  1. process.roles=ブローカー、コントローラー

実際には3つの値があります。

  • ブローカー: このマシンはブローカーとしてのみ機能します
  • コントローラー: Raftクォーラムのコントローラーの1つとして開始します
  • ブローカー、コントローラー: 両方の機能が含まれています

ES に精通している学生であれば、これらの部門が ES のマスターとノードのようなもので、分散の概念は実際にはある程度同じであることがわかります。

次のステップは、アドレスの変更を監視することです。サーバーには 2 つの機能があるため、2 つのポートを開く必要があります。

  1. リスナー=PLAINTEXT://:9092、CONTROLLER://:9093

さらに、node.id と呼ばれるものがあります。元の broker.id とは異なり、この nodeid は投票に使用されます。

  1. ノードID=1

raft プロトコルの特性上、投票構成では上記の node.id を使用する必要があります。こう書くとちょっと変な感じがしませんか?しかし、Zk のものよりはるかに優れています。したがって、これらの構成は以降のバージョンで変更される可能性があります。

  1. コントローラー.quorum.voters=1@localhost:9093

これが設定ファイルの主な違いです。そのコレクションを見てみましょう。

  1. process.roles=ブローカー、コントローラー
  2. リスナー=PLAINTEXT://:9092、CONTROLLER://:9093
  3. ノードID=1
  4. コントローラー.quorum.voters=1@localhost:9093

3. ZK を削除する必要があるのはなぜですか?

メッセージ キューとして、Kafka は実際には重量級の調整システムである ZooKeeper に依存しています。これは冗談です。また、メッセージ キューとしても、RabbitMQ は早い段階で自己管理を実現しました。

Zookeeper は非常に扱いにくく、奇数個のノードを持つクラスター構成が必要なので、容量の拡張や縮小が不便です。 Zk の設定方法も Kafka とは全く異なります。 Kafka を調整するには、別のシステムを考慮する必要があります。これは本当にひどい。

Kafka を軽量かつすぐに使える方向に発展させたいのであれば、Zk を排除する必要があります。

さらに、Zk と Kafka は同じストレージ システム内にないため、トピックとパーティションの数が増えると、データ同期の問題がより顕著になります。 Zk は信頼性が高いですが、遅いです。 Kafka のログ ストレージ システムに配置するのほど良くはありません。スピードを誇る Kafka にとって、これは回避しなければならないリンクです。

Kafka-admin を使用したことがある学生なら、監視データの同期が遅いことを鮮明に覚えているはずです。まず zk を経由してメタデータ情報を取得し、次に Kafka の JMX インターフェースからデータを取得する必要があります。このサイクルにより、大規模なクラスターがほぼ消滅しました。

4. どのような変更がありますか?

より簡単な導入。

まず、展開が容易になります。高可用性を追求しない一部のシステムでは、単一のプロセスでも優れた Kafka を実行できます。 Zookeeper 対応の SSD ディスクを申請する必要も、ZK の容量が十分かどうかを心配する必要もなくなりました。

監視がより便利になります。

第二に、情報の集中化により、zk を経由せずに Kafka から監視情報を取得することが容易になります。 Grafana/Kibana/Promethus などのシステムとの統合が間もなく始まります。

より速いスピード。

最も重要なのは、もちろんスピードです。 Raft は ZK の ZAB プロトコルよりも理解しやすく、効率的です。パーティション マスターの選択が高速化され、コントローラーのスケジューリング速度が向上します。

このようなつながりは二度と生まれないでしょう。

  1. 動物園の飼育係.接続=動物園の飼育係:2181

代わりに、ブートストラップ接続方法のみが残ります。 Kafka のノードはますますピアノードに似てきています。

  1. bootstrap.servers=ブローカー:9092

Kafka には、トピックとパーティションの分布を表示するために使用できる kafka-metadata-shell.sh というツールも用意されています。この情報は元々 zk を通じて入手できましたが、現在はこのコマンド ラインを使用して取得できます。

  1. $ ./bin/kafka-metadata-shell.sh --snapshot /tmp/kraft-combined-logs/\@metadata-0/00000000000000000000.log  
  2. >> ls /
  3. ブローカーローカルメタデータ クォーラム トピック ID トピック
  4. >> ls /トピック
  5. フー
  6. >> cat /topics/foo/0/data
  7. {
  8. 「パーティションID」 : 0,
  9. 「トピックID」 : 「5zoAlv-xEh9xRANKXt1Lbg」
  10. 「レプリカ」 : [ 1 ],
  11. "isr" : [ 1 ],
  12. "レプリカの削除" : null
  13. "レプリカの追加" : null
  14. 「リーダー」 : 1,
  15. "リーダーエポック" : 0,
  16. "パーティションエポック" : 0
  17. }
  18. >> 終了

最後に、現時点ではオンライン環境でこの機能を有効にせず、ZK のみを使用する必要があることをお知らせします。その理由は機能性にあります。これらの機能をサポートするインフラストラクチャが整備されておらず、コードが信頼できるレベルに達していないためです。使用すると、不完全なツールや難しいバグのせいで、おそらく惨めな思いをすることになるだろう。

しかし、この勇気ある第一歩はすでに踏み出され、方向性も示されており、私たちに残されたのは待つことだけです。いずれにせよ、Zk を取り除くのは良いことです。

著者について: Sister Taste (xjjdog)、プログラマーが寄り道をすることを許可しない公開アカウント。インフラストラクチャと Linux に重点を置きます。 10 年間のアーキテクチャと 1 日あたり数千億のトラフィックを基に、私たちはお客様とともに高並行性の世界を探求し、新たな体験をお届けします。私の個人WeChatはxjjdog0です。今後のコミュニケーションのために、私を友達として追加してください。

<<:  スマート交通におけるエッジコンピューティングの応用に関する簡単な分析

>>:  SaaS をサービスの観点から見ると何がわかるでしょうか?

推薦する

クラウド データ ウェアハウス アーキテクチャにおけるコントロール パネルの重要性

翻訳者|ブガッティ校正:孫淑娟企業がデジタルファースト モデルに移行するにつれて、クラウド コンピュ...

SEO 業界では、他の人ができることができない場合があります。

オンラインストアを開設したり、様々なプロジェクトを行っています。何かを初めてやるときに、それを早くや...

reprisehosting: シアトル専用サーバー、月額 27 ドルから、L5640/16g メモリ/1T ハードディスク/20T トラフィック

reprisehosting は、米国西海岸のシアトル データ センターにある、超格安の米国サーバー...

クラウドネイティブ導入におけるセキュリティ責任

企業での導入が増加するにつれて、開発者と IT 意思決定者がセキュリティとコンプライアンスの懸念に対...

クラウドサービスと仮想化データセンターの可視化について(第2部)

仮想化データセンター向けオーバーレイネットワーク仮想拡張LAN (VXLAN)物理ネットワークの現在...

読み込み速度が再び向上しました:ウェブサイト構築プログラムを詳細に記述します

この冬、人々に最も深い印象を残した2つのウェブサイトは、12306列車のチケット購入ウェブサイトとX...

ecshop フルシリーズ バージョン ウェブサイトの脆弱性 リモート コード実行 SQL インジェクションの脆弱性

月収10万元の起業の夢を実現するミニプログラム起業支援プランecshopの脆弱性は、2018年9月1...

ブランドはBilibiliでどのようにマーケティングを行えるのでしょうか?

6月25日、ビリビリのトップストリーマーである王冰冰は、@CMG Observationと共同制作し...

vivo クラウドネイティブコンテナの探索と実装

vivo は 2018 年以来、コンテナをベースとしたワンストップのクラウドネイティブ機械学習プラッ...

ZJiNet: 香港独立サーバー 50% 割引、500 元/月、2*e5-2630L/32g メモリ/1TSSD/20M 帯域幅/2IP

zji.netは現在、香港葵湾データセンターの3種類の香港独立サーバーを対象に、特別50%オフキャン...

分析:検索エンジンのアルゴリズムは変わったが、基本的な考え方は変わっていない

検索エンジンのアルゴリズムはリンクをランク付けします。値が高いほど、ランクが高くなります。キーワード...

化粧品業界におけるインターネットマーケティング戦略の分析

新たな経済発展の状況は、新たなマーケティングルールをもたらしました。21年はまさにインターネットマー...

無料で実用的な越境ECソフトウェアのおすすめ④-SEOキーワードランキング追跡ツール

プラットフォームを構築する場合でも、独立した Web サイトを構築する場合でも、商品を適切な位置に表...

gadgedz-$3.75/KVM/1g メモリ/20g ハードディスク/1T トラフィック

gadgedzさん、私がこれを投稿した理由は、これがすごく安いからなんです、すごいんです!ざっと見た...

losangelesvps: 月に 1 回の無料 IP 変更サービス、コスト効率の高い 1G 帯域幅無制限トラフィック VPS

losangelesvps の公式から次のようなニュースが届きました。今後、losangelesvp...