とてもクール! Kafka は Zookeeper を削除しました。

とてもクール! Kafka は Zookeeper を削除しました。

[[396651]]

この記事はWeChat公式アカウント「妹の味」から転載したもので、著者は妹が飼っている犬です。記事を転載する場合は、ミスシスターテイスト公式アカウントまでご連絡ください。

この機会をお祝いしましょう!最新バージョンの Kafka 2.8.0 では、Zookeeper への依存関係がなくなり、KRaft を通じて独自のクラスターを管理します。非常に良い、非常に良い、ようやく質的な変化が起こった。

KRaft と聞いたとき、私たちは Raft プロトコルを思い浮かべました。 Raft プロトコルは、現在最も人気のある分散調整アルゴリズムです。 Etcd や Consul などのシステムの基盤となります。今ではカフカにもそれが備わっている。

この機能は非常に新しいため、バージョン 2.8.0 ではデフォルトでまだ ZooKeeper が使用されていますが、試してみることを止めることはできません。また、あまり興奮しすぎないでください。一部の機能はまだ完璧ではないと公式が主張しているため、オンラインでは使用しないでください。

1. KRaft を起動するにはどうすればいいですか?

Kafka は ZooKeeper の代わりに組み込みの KRaft を使用します。これは、ES などの分散システムがクラスターのメタ情報を自己循環方式で同期するため、大きな改善です。

しかし、KRaft を使い始めるにはどうすればいいのでしょうか?多くの学生が混乱しています。この分野の情報は比較的少ないですが、使い方は非常に簡単です。

config ディレクトリの下に、kraft という新しいディレクトリがあり、そこに ZK への依存関係を直接放棄できる新しい構成ファイル セットが含まれていることに気付きました。

次の 3 行のコマンドを使用すると、ZK を介さずにスタンドアロン ブローカーを起動できます。

  1. # ./bin/kafka-storage.sh ランダムUUID
  2. # ./bin/kafka-storage.sh フォーマット -t TBYU7WMiREexuZqrjKG60g -c ./config/kraft/server.properties
  3. # ./bin/kafka-server-start.sh ./config/kraft/server.properties

しばらくパチパチ音が鳴った後、No ZK Kafka が始まりました。

とても簡単です。

2. 設定方法は?

Kafka は、このメタデータを保存するために @metadata という内部トピックを追加します。

次に、いくつかの重要な構成情報を見ていきます。主な違いを確認するには、vimdiff config/server.properties config/kraft/server.properties を使用できます。

まず、Kraft には process.roles と呼ばれる追加の構成があります。設定ファイルでは次のようになります。

  1. process.roles=ブローカー、コントローラー

実際には3つの値があります。

  • ブローカー: このマシンはブローカーとしてのみ機能します
  • コントローラー: Raftクォーラムのコントローラーの1つとして開始します
  • ブローカー、コントローラー: 両方の機能が含まれています

ES に精通している学生であれば、これらの部門が ES のマスターとノードのようなもので、分散の概念は実際にはある程度同じであることがわかります。

次のステップは、アドレスの変更を監視することです。サーバーには 2 つの機能があるため、2 つのポートを開く必要があります。

  1. リスナー=PLAINTEXT://:9092、CONTROLLER://:9093

さらに、node.id と呼ばれるものがあります。元の broker.id とは異なり、この nodeid は投票に使用されます。

  1. ノードID=1

raft プロトコルの特性上、投票構成では上記の node.id を使用する必要があります。こう書くとちょっと変な感じがしませんか?しかし、Zk のものよりはるかに優れています。したがって、これらの構成は以降のバージョンで変更される可能性があります。

  1. コントローラー.quorum.voters=1@localhost:9093

これが設定ファイルの主な違いです。そのコレクションを見てみましょう。

  1. process.roles=ブローカー、コントローラー
  2. リスナー=PLAINTEXT://:9092、CONTROLLER://:9093
  3. ノードID=1
  4. コントローラー.quorum.voters=1@localhost:9093

3. ZK を削除する必要があるのはなぜですか?

メッセージ キューとして、Kafka は実際には重量級の調整システムである ZooKeeper に依存しています。これは冗談です。また、メッセージ キューとしても、RabbitMQ は早い段階で自己管理を実現しました。

Zookeeper は非常に扱いにくく、奇数個のノードを持つクラスター構成が必要なので、容量の拡張や縮小が不便です。 Zk の設定方法も Kafka とは全く異なります。 Kafka を調整するには、別のシステムを考慮する必要があります。これは本当にひどい。

Kafka を軽量かつすぐに使える方向に発展させたいのであれば、Zk を排除する必要があります。

さらに、Zk と Kafka は同じストレージ システム内にないため、トピックとパーティションの数が増えると、データ同期の問題がより顕著になります。 Zk は信頼性が高いですが、遅いです。 Kafka のログ ストレージ システムに配置するのほど良くはありません。スピードを誇る Kafka にとって、これは回避しなければならないリンクです。

Kafka-admin を使用したことがある学生なら、監視データの同期が遅いことを鮮明に覚えているはずです。まず zk を経由してメタデータ情報を取得し、次に Kafka の JMX インターフェースからデータを取得する必要があります。このサイクルにより、大規模なクラスターがほぼ消滅しました。

4. どのような変更がありますか?

より簡単な導入。

まず、展開が容易になります。高可用性を追求しない一部のシステムでは、単一のプロセスでも優れた Kafka を実行できます。 Zookeeper 対応の SSD ディスクを申請する必要も、ZK の容量が十分かどうかを心配する必要もなくなりました。

監視がより便利になります。

第二に、情報の集中化により、zk を経由せずに Kafka から監視情報を取得することが容易になります。 Grafana/Kibana/Promethus などのシステムとの統合が間もなく始まります。

より速いスピード。

最も重要なのは、もちろんスピードです。 Raft は ZK の ZAB プロトコルよりも理解しやすく、効率的です。パーティション マスターの選択が高速化され、コントローラーのスケジューリング速度が向上します。

このようなつながりは二度と生まれないでしょう。

  1. 動物園の飼育係.接続=動物園の飼育係:2181

代わりに、ブートストラップ接続方法のみが残ります。 Kafka のノードはますますピアノードに似てきています。

  1. bootstrap.servers=ブローカー:9092

Kafka には、トピックとパーティションの分布を表示するために使用できる kafka-metadata-shell.sh というツールも用意されています。この情報は元々 zk を通じて入手できましたが、現在はこのコマンド ラインを使用して取得できます。

  1. $ ./bin/kafka-metadata-shell.sh --snapshot /tmp/kraft-combined-logs/\@metadata-0/00000000000000000000.log  
  2. >> ls /
  3. ブローカーローカルメタデータ クォーラム トピック ID トピック
  4. >> ls /トピック
  5. フー
  6. >> cat /topics/foo/0/data
  7. {
  8. 「パーティションID」 : 0,
  9. 「トピックID」 : 「5zoAlv-xEh9xRANKXt1Lbg」
  10. 「レプリカ」 : [ 1 ],
  11. "isr" : [ 1 ],
  12. "レプリカの削除" : null
  13. "レプリカの追加" : null
  14. 「リーダー」 : 1,
  15. "リーダーエポック" : 0,
  16. "パーティションエポック" : 0
  17. }
  18. >> 終了

最後に、現時点ではオンライン環境でこの機能を有効にせず、ZK のみを使用する必要があることをお知らせします。その理由は機能性にあります。これらの機能をサポートするインフラストラクチャが整備されておらず、コードが信頼できるレベルに達していないためです。使用すると、不完全なツールや難しいバグのせいで、おそらく惨めな思いをすることになるだろう。

しかし、この勇気ある第一歩はすでに踏み出され、方向性も示されており、私たちに残されたのは待つことだけです。いずれにせよ、Zk を取り除くのは良いことです。

著者について: Sister Taste (xjjdog)、プログラマーが寄り道をすることを許可しない公開アカウント。インフラストラクチャと Linux に重点を置きます。 10 年間のアーキテクチャと 1 日あたり数千億のトラフィックを基に、私たちはお客様とともに高並行性の世界を探求し、新たな体験をお届けします。私の個人WeChatはxjjdog0です。今後のコミュニケーションのために、私を友達として追加してください。

<<:  スマート交通におけるエッジコンピューティングの応用に関する簡単な分析

>>:  SaaS をサービスの観点から見ると何がわかるでしょうか?

推薦する

垂直型 B2C は失われる: 金持ちの男性と付き合うことが解決策となるか?

天猫の「ダブル11」プロモーションは売上高132億元で完璧に終了した。人々がまだ「ダブル11」につい...

張小龍がユーザーエクスペリエンスについて語る: ユーザーエクスペリエンスの目標は「自然」にすること

張小龍すべてのプロダクト マネージャーとユーザー エクスペリエンス デザイナーに推奨: 言葉で説明す...

ジェネラル・ダイナミクスがマルチクラウド戦略を次のレベルへ

現在、世界中で 10 万人を超える従業員のニーズに応えるには、クラウドに大きく賭ける必要があります。...

vps777: ロサンゼルスの高級 VPS、年間 25 ドル、8GB メモリ/20GB SSD/2TB トラフィック

vps777 のプロモーション メールには、ロサンゼルス CC データ センターにあり、OpenVZ...

従来のマーケティングはどれくらい続くのでしょうか?ソーシャルマーケティングの4つの大きなトレンド

広告、広報、ブランド管理、企業コミュニケーションなどの従来のマーケティング手法は効果がなくなってきて...

直線対曲面、曲面は超薄型製品の未来のリーダーに挑戦できるでしょうか?

はじめに: サムスンや LG など多くのカラーテレビメーカーが推進する曲面 LED バックライト付き...

クラウド関連の IoT 脅威を軽減する方法

モノのインターネット (IoT) は、デバイスやシステムが相互に通信し、データを交換できるようにする...

Googleの新機能の解釈

Googleは、ユーザーが検索結果をピン留めまたは削除し、「あなたはこの結果を最初に選択した人です」...

virmach: クリスマスの素晴らしいもの、マルチコンピュータルームKVM、Windows付き、年間支払いは15ドルから

virmach は、クリスマス、ボックス デー、新年などの休暇中に再び暖かさをもたらします。いくつか...

Windows サーバー構成 PHP 環境チュートリアル

Windows サーバー (VPS) を購入した後、独自のプロジェクトを構築するために PHP 環境...

『乾物』陳一立:産業クラウドの現状解釈

中国情報通信研究院が主催し、中国通信標準化協会が後援する「OSCARクラウドコンピューティングオープ...

ウェブマスターデイリーレポート: ICANN が新しいトップレベルドメイン名申請リストを発表

新しいトップレベルドメイン: インターネットの巨人たちの饗宴インターネットネーム・番号割当機関(IC...

ウェブサイトのインタラクションデザイン: 異なる種類の「キャンセル」ボタン

「キャンセル」ボタンは必要な操作プロセスの一部ではなく、デザイン上の主要な要素として表示されません。...

クラウド変更管理戦略を適応するための 3 つのルール

変更に関しては、変更管理戦略を立てることでリスクを最小限に抑えることができます。クラウドの変更管理戦...

クラウドネイティブの可観測性がインダストリー4.0の成功をいかに推進するか

クラウド ネイティブの可観測性が、リアルタイムの分析情報、俊敏な意思決定、最適なクラウド使用を可能に...