Pulsar: 次世代メッセージング エンジンは本当にそれほど強力なのでしょうか?

Pulsar: 次世代メッセージング エンジンは本当にそれほど強力なのでしょうか?

[[394573]]

背景

現在、新しいサービスのための技術を選定しており、メッセージ ミドルウェアの選定も行っています。実際の状況を踏まえると、以下の要件を満たすことができると期待しています。

  • クラウドネイティブ対応が親切:現在のメイン言語はGoなので、操作やメンテナンスも簡単です。
  • 公式 SDK は複数の言語をサポートしていますが、Python および Java 関連のコードはまだメンテナンスが必要です。
  • 遅延メッセージ、デッドレターキュー、マルチテナントなどの便利で使いやすい機能があれば最高です。

もちろん、水平拡張、スループット、低レイテンシなど、詳しく説明する必要のない機能もあります。ほぼすべての成熟したメッセージ ミドルウェアは、これらの要件を満たすことができます。

上記のスクリーニング条件に基づいて、Pulsar が私たちの視界に入りました。

Apache のトップレベル プロジェクトとして、上記の機能は十分にサポートされます。

それでは、何がそんなに特別なのか見てみましょう。

建築

公式のアーキテクチャ図から、Pulsar は主に次のコンポーネントで構成されていることがわかります。

  1. ブローカーは、水平方向に拡張できるステートレス コンポーネントです。主にプロデューサーとコンシューマーの接続に使用されます。 Kafka のブローカーに似ていますが、データストレージ機能がないため、拡張が容易です。
  2. BookKeeper クラスター: 主にデータの永続的な保存に使用されます。
  3. Zookeeper はブローカーと BookKeeper のメタデータを保存するために使用されます。

一見すると、Kafka が依存するコンポーネントの数よりも多くのコンポーネントがあり、システムの複雑さが増しているように見えます。しかし、そのメリットも明らかです。

Pulsar はストレージとコンピューティングが分離されているため、容量の拡張が必要な​​場合でも非常に簡単です。他の精神的な負担なしに、新しいブローカーを直接追加できます。

ストレージがボトルネックになった場合は、BookKeeper を拡張するだけで済みます。 BookKeeper が自動的に負荷を処理するため、手動で再バランス調整する必要はありません。

同じ操作でも、Kafka ははるかに複雑です。

特性

マルチテナント

マルチテナント機能も厳密に必要な機能であり、異なるビジネスやチームのデータを同じクラスター内で分離できます。

  1. 永続的://core/順序/作成-順序 

このトピック名を例にとると、コア テナントの下に order 名前空間があり、最後に create-order トピック名があります。

実際の使用では、テナントは一般的にビジネス チームごとに分割され、名前空間は現在のチームの下にある異なるビジネスです。これにより、トピックを明確に管理できるようになります。

通常、比較しなくても害はありません。マルチテナントのないメッセージミドルウェアでは、このような問題にどのように対処しますか?

  1. あまり細かく分けず、すべての事業ラインを一緒に使う方が良いでしょう。チームが小さい場合、これは大きな問題ではないかもしれません。しかし、事業が拡大すると管理が非常に面倒になります。
  2. トピックの前に抽象化レイヤーを作成しますが、本質的にはマルチテナントも実装しています。
  3. 各ビジネスチームが独自のクラスターを維持することで、確かに問題は解決できますが、運用と保守の複雑さは当然増大します。

上記は、マルチテナンシーの重要性を明確に示しています。

関数

Pulsar は、特定のメッセージを別のトピックに公開する前にクリーンアップして変換する必要があるなどの軽量関数コンピューティングもサポートしています。

このタイプの要件に対しては、単純な関数を記述できます。 Pulsar は、データを簡単に処理し、最終的に公式ツールを使用してブローカーに公開できる SDK を提供します。

これまでは、このような単純な要件でも、ストリーム処理エンジンを自分で処理する必要があったかもしれません。

応用

これらを除けば、プロデューサーやコンシューマーなどの上位レベルのアプリケーションの概念と使用法は、すべての人にとって同様です。

たとえば、Pulsar は次の 4 つの消費モードをサポートしています。

  • 排他: 排他モードでは、一度に 1 つのコンシューマーのみがデータを開始して消費できます。 SubscriptionName は同じコンシューマーであることを示します) であり、適用範囲が狭くなります。
  • フェイルオーバー モード: 排他モードに基づいて、複数のコンシューマーを同時に起動できます。消費者が失敗すると、他の消費者がすぐに引き継ぐことができますが、消費できるのは 1 つの消費者だけです。いくつかのシナリオでは利用可能です。
  • 共有モード: N 個のコンシューマーが同時に実行でき、メッセージはラウンドロビン モードで各コンシューマーに配信されます。コンシューマーがクラッシュして ack を受信しない場合、メッセージは他のコンシューマーに配信されます。この消費モデルは消費能力を向上させることができますが、メッセージは整然としたものになりません。
  • KeyShared 共有モード: 共有モードに基づきます。これは、同じトピック内のメッセージをグループ化することと同じです。同じグループ内のメッセージは、同じコンシューマーによってのみ順番に消費されます。

3 番目の共有消費モードが最も一般的に使用されるはずです。 KeyShared モードは、メッセージにシーケンス要件がある場合に使用できます。

開発キット

公式にサポートされている SDK は非常に豊富です。公式 SDK をベースに内部で使用する SDK もカプセル化しました。

dig のような軽量の依存性注入ライブラリを使用するため、次のようになります。

  1. SetUpPulsar(ルックアップURL)
  2. コンテナ:= dig.New()
  3. コンテナ.Provide(func() ConsumerConfigInstance {
  4. return NewConsumer(&pulsar.ConsumerOptions{
  5. トピック: "persistent://core/order/create-order"
  6. サブスクリプション名: "order-sub"
  7. タイプ: pulsar.Shared、
  8. 名前: "consumer01"
  9. }, コンシューマーオーダー)
  10.  
  11. })
  12.  
  13. コンテナ.Provide(func() ConsumerConfigInstance {
  14. return NewConsumer(&pulsar.ConsumerOptions{
  15. トピック: "persistent://core/order/update-order"
  16. サブスクリプション名: "order-sub"
  17. タイプ: pulsar.Shared、
  18. 名前: "consumer02"
  19. }, 消費者請求書)
  20.  
  21. })
  22.  
  23. コンテナを起動します(StartConsumer)

2 つの container.Provide() 関数は、コンシューマー オブジェクトを挿入するために使用されます。

container.Invoke(StartConsumer) は、コンテナーからすべてのコンシューマー オブジェクトを取り出し、同時に消費を開始します。

当時、私の限られた Go 開発経験から、次のような疑問も考えていました。Go では依存性注入は必要なのか?

まず、Dig のようなライブラリを使用する利点を見てみましょう。

  • オブジェクトはコンテナによって管理されるため、シングルトンを実装するのに非常に便利です。
  • オブジェクト間の依存関係が複雑な場合、オブジェクトの作成と取得のためのコードを大幅に削減でき、依存関係が明確になります。

同様の欠点も存在します:

  • コードを読むときにトレースはあまり直感的ではなく、依存オブジェクトがどのように作成されるかを一目で確認することはできません。
  • これは Go が提唱するシンプルさと矛盾しています。

Spring を使用したことがある Java 開発者にとっては、Spring は本当に優れていると間違いなく言うでしょう。結局のところ、それはまだ馴染みのある味です。しかし、同様のニーズに遭遇したことのない Gopher にとっては、それは緊急のニーズではないようです。

市場にはさまざまな Go 依存性注入ライブラリが登場しており、その中には大手メーカーが制作したものも多く、依然として大きな市場があることがわかります。

多くの Gopher は、Java のいくつかの複雑な概念が Go に導入されることに非常に嫌悪感を抱いていると思いますが、依存性注入自体は言語によって制限されるものではなく、さまざまな言語にも独自の実装があると思います。 Java の Spring は単なる依存性注入フレームワークではなく、多くの開発者を困惑させる複雑な機能も多数備えています。

依存性注入だけであれば、実装は複雑ではなく、それほど複雑にはなりません。時間をかけてソースコードを読むと、概念を理解した上ですぐに習得できるようになります。

SDK 自体に戻ると、Go の SDK は現在 Java バージョンよりも機能が少ない (正確には、Java バージョンのみが最も多くの機能を備えています) ですが、コア機能はすべて備えており、日常的な使用には影響しません。

要約する

この記事では、Pulsar の基本的な概念と利点を紹介し、Go の依存性注入について説明します。私たちと同じようにテクノロジーの選択をする場合は、Pulsar を検討してみてはいかがでしょうか。

<<:  オンライン問題レビュー、JVM Fast Throw のストーリー

>>:  2021年の世界クラウドストレージ業界の現状と発展の見通しに関する分析

推薦する

3 回の試行を経てウェブサイトが承認された後に学んだ教訓と心理的変動

出版からサイト立ち上げまで、経験不足で遠回りばかりでした。3回の挑戦を経て登録が承認されるまでに1ヶ...

王通: 貧しいウェブマスターと裕福なウェブマスターの違い

この記事で言う貧乏人と金持ちというのは、お金のことだけではなく、精神的な面も指しています。この記事で...

香港のVPSを推奨、Alipay支払いも受け付けます

香港 VPS: 速度が速く、中国本土からのアクセス速度が超高速で、登録の必要がないため、登録の手間が...

フォーラムコミュニティ運営シリーズ1: コンテンツこそが王様というのは、まさに「落とし穴」

フォーラム コミュニティ運営シリーズ 1 (コンテンツこそが王様、それは詐欺)この記事の内容や意見は...

データセンターの終焉は誇張されすぎている

[51CTO.com クイック翻訳] クラウドに対する熱狂は、データセンターは死んでいる、あるいはも...

分散ストレージに関する5つの嘘

近年のストレージの世界で最も人気のあるものといえば、分散ストレージです。分散ストレージは誕生以来、ス...

野蛮さが尊重されなくなったとき、ヴァンクルはどのように存続すべきでしょうか?

かつて電子商取引の伝説的存在だったヴァンクルは、マーケティングと口コミを利用して短期間でブランド認知...

Weiboのトピックを見てSEOの価値を分析する

昨晩Weiboをチェックしていたところ、興味深い話題が2つ見つかったので、返信し、ネットユーザーのコ...

SEO最適化ウェブサイトURLディレクトリレベルの検索エンジンの自然な重み

ウェブサイトのページの重みレベルが検索エンジンに反映される方法は、基本的にホームページ→ディレクトリ...

SEO 王国についての簡単な説明

SEO は、私たちにとって馴染み深く、しかし未知の部分に満ち、美しい物語と伝説的な叙事詩に満ちた、地...

分散ロックは実装がとても簡単です

[[404863]]この記事はWeChatの公開アカウント「Java Geek Technology...

ニッチブランド向けの新しいメディアマーケティングを行うにはどうすればよいでしょうか?

あなたが PPT を書いている間に、アラスカではタラが水から飛び出しています。あなたがレポートを読ん...

AI+IoT開発者エコシステムが普及し、Tuya Smartの6つのSaaSサービスプラットフォームが企業を支援

[51CTO.comからのオリジナル記事] Tuya Smartは消費者市場ではあまり見かけないので...

持続可能性は企業のクラウド移行における重要な考慮事項となっている

気候への影響を軽減するためにクラウドへの移行を検討している企業にとって、持続可能性はますます重要な要...