Pulsar: 次世代メッセージング エンジンは本当にそれほど強力なのでしょうか?

Pulsar: 次世代メッセージング エンジンは本当にそれほど強力なのでしょうか?

[[394573]]

背景

現在、新しいサービスのための技術を選定しており、メッセージ ミドルウェアの選定も行っています。実際の状況を踏まえると、以下の要件を満たすことができると期待しています。

  • クラウドネイティブ対応が親切:現在のメイン言語はGoなので、操作やメンテナンスも簡単です。
  • 公式 SDK は複数の言語をサポートしていますが、Python および Java 関連のコードはまだメンテナンスが必要です。
  • 遅延メッセージ、デッドレターキュー、マルチテナントなどの便利で使いやすい機能があれば最高です。

もちろん、水平拡張、スループット、低レイテンシなど、詳しく説明する必要のない機能もあります。ほぼすべての成熟したメッセージ ミドルウェアは、これらの要件を満たすことができます。

上記のスクリーニング条件に基づいて、Pulsar が私たちの視界に入りました。

Apache のトップレベル プロジェクトとして、上記の機能は十分にサポートされます。

それでは、何がそんなに特別なのか見てみましょう。

建築

公式のアーキテクチャ図から、Pulsar は主に次のコンポーネントで構成されていることがわかります。

  1. ブローカーは、水平方向に拡張できるステートレス コンポーネントです。主にプロデューサーとコンシューマーの接続に使用されます。 Kafka のブローカーに似ていますが、データストレージ機能がないため、拡張が容易です。
  2. BookKeeper クラスター: 主にデータの永続的な保存に使用されます。
  3. Zookeeper はブローカーと BookKeeper のメタデータを保存するために使用されます。

一見すると、Kafka が依存するコンポーネントの数よりも多くのコンポーネントがあり、システムの複雑さが増しているように見えます。しかし、そのメリットも明らかです。

Pulsar はストレージとコンピューティングが分離されているため、容量の拡張が必要な​​場合でも非常に簡単です。他の精神的な負担なしに、新しいブローカーを直接追加できます。

ストレージがボトルネックになった場合は、BookKeeper を拡張するだけで済みます。 BookKeeper が自動的に負荷を処理するため、手動で再バランス調整する必要はありません。

同じ操作でも、Kafka ははるかに複雑です。

特性

マルチテナント

マルチテナント機能も厳密に必要な機能であり、異なるビジネスやチームのデータを同じクラスター内で分離できます。

  1. 永続的://core/順序/作成-順序 

このトピック名を例にとると、コア テナントの下に order 名前空間があり、最後に create-order トピック名があります。

実際の使用では、テナントは一般的にビジネス チームごとに分割され、名前空間は現在のチームの下にある異なるビジネスです。これにより、トピックを明確に管理できるようになります。

通常、比較しなくても害はありません。マルチテナントのないメッセージミドルウェアでは、このような問題にどのように対処しますか?

  1. あまり細かく分けず、すべての事業ラインを一緒に使う方が良いでしょう。チームが小さい場合、これは大きな問題ではないかもしれません。しかし、事業が拡大すると管理が非常に面倒になります。
  2. トピックの前に抽象化レイヤーを作成しますが、本質的にはマルチテナントも実装しています。
  3. 各ビジネスチームが独自のクラスターを維持することで、確かに問題は解決できますが、運用と保守の複雑さは当然増大します。

上記は、マルチテナンシーの重要性を明確に示しています。

関数

Pulsar は、特定のメッセージを別のトピックに公開する前にクリーンアップして変換する必要があるなどの軽量関数コンピューティングもサポートしています。

このタイプの要件に対しては、単純な関数を記述できます。 Pulsar は、データを簡単に処理し、最終的に公式ツールを使用してブローカーに公開できる SDK を提供します。

これまでは、このような単純な要件でも、ストリーム処理エンジンを自分で処理する必要があったかもしれません。

応用

これらを除けば、プロデューサーやコンシューマーなどの上位レベルのアプリケーションの概念と使用法は、すべての人にとって同様です。

たとえば、Pulsar は次の 4 つの消費モードをサポートしています。

  • 排他: 排他モードでは、一度に 1 つのコンシューマーのみがデータを開始して消費できます。 SubscriptionName は同じコンシューマーであることを示します) であり、適用範囲が狭くなります。
  • フェイルオーバー モード: 排他モードに基づいて、複数のコンシューマーを同時に起動できます。消費者が失敗すると、他の消費者がすぐに引き継ぐことができますが、消費できるのは 1 つの消費者だけです。いくつかのシナリオでは利用可能です。
  • 共有モード: N 個のコンシューマーが同時に実行でき、メッセージはラウンドロビン モードで各コンシューマーに配信されます。コンシューマーがクラッシュして ack を受信しない場合、メッセージは他のコンシューマーに配信されます。この消費モデルは消費能力を向上させることができますが、メッセージは整然としたものになりません。
  • KeyShared 共有モード: 共有モードに基づきます。これは、同じトピック内のメッセージをグループ化することと同じです。同じグループ内のメッセージは、同じコンシューマーによってのみ順番に消費されます。

3 番目の共有消費モードが最も一般的に使用されるはずです。 KeyShared モードは、メッセージにシーケンス要件がある場合に使用できます。

開発キット

公式にサポートされている SDK は非常に豊富です。公式 SDK をベースに内部で使用する SDK もカプセル化しました。

dig のような軽量の依存性注入ライブラリを使用するため、次のようになります。

  1. SetUpPulsar(ルックアップURL)
  2. コンテナ:= dig.New()
  3. コンテナ.Provide(func() ConsumerConfigInstance {
  4. return NewConsumer(&pulsar.ConsumerOptions{
  5. トピック: "persistent://core/order/create-order"
  6. サブスクリプション名: "order-sub"
  7. タイプ: pulsar.Shared、
  8. 名前: "consumer01"
  9. }, コンシューマーオーダー)
  10.  
  11. })
  12.  
  13. コンテナ.Provide(func() ConsumerConfigInstance {
  14. return NewConsumer(&pulsar.ConsumerOptions{
  15. トピック: "persistent://core/order/update-order"
  16. サブスクリプション名: "order-sub"
  17. タイプ: pulsar.Shared、
  18. 名前: "consumer02"
  19. }, 消費者請求書)
  20.  
  21. })
  22.  
  23. コンテナを起動します(StartConsumer)

2 つの container.Provide() 関数は、コンシューマー オブジェクトを挿入するために使用されます。

container.Invoke(StartConsumer) は、コンテナーからすべてのコンシューマー オブジェクトを取り出し、同時に消費を開始します。

当時、私の限られた Go 開発経験から、次のような疑問も考えていました。Go では依存性注入は必要なのか?

まず、Dig のようなライブラリを使用する利点を見てみましょう。

  • オブジェクトはコンテナによって管理されるため、シングルトンを実装するのに非常に便利です。
  • オブジェクト間の依存関係が複雑な場合、オブジェクトの作成と取得のためのコードを大幅に削減でき、依存関係が明確になります。

同様の欠点も存在します:

  • コードを読むときにトレースはあまり直感的ではなく、依存オブジェクトがどのように作成されるかを一目で確認することはできません。
  • これは Go が提唱するシンプルさと矛盾しています。

Spring を使用したことがある Java 開発者にとっては、Spring は本当に優れていると間違いなく言うでしょう。結局のところ、それはまだ馴染みのある味です。しかし、同様のニーズに遭遇したことのない Gopher にとっては、それは緊急のニーズではないようです。

市場にはさまざまな Go 依存性注入ライブラリが登場しており、その中には大手メーカーが制作したものも多く、依然として大きな市場があることがわかります。

多くの Gopher は、Java のいくつかの複雑な概念が Go に導入されることに非常に嫌悪感を抱いていると思いますが、依存性注入自体は言語によって制限されるものではなく、さまざまな言語にも独自の実装があると思います。 Java の Spring は単なる依存性注入フレームワークではなく、多くの開発者を困惑させる複雑な機能も多数備えています。

依存性注入だけであれば、実装は複雑ではなく、それほど複雑にはなりません。時間をかけてソースコードを読むと、概念を理解した上ですぐに習得できるようになります。

SDK 自体に戻ると、Go の SDK は現在 Java バージョンよりも機能が少ない (正確には、Java バージョンのみが最も多くの機能を備えています) ですが、コア機能はすべて備えており、日常的な使用には影響しません。

要約する

この記事では、Pulsar の基本的な概念と利点を紹介し、Go の依存性注入について説明します。私たちと同じようにテクノロジーの選択をする場合は、Pulsar を検討してみてはいかがでしょうか。

<<:  オンライン問題レビュー、JVM Fast Throw のストーリー

>>:  2021年の世界クラウドストレージ業界の現状と発展の見通しに関する分析

推薦する

インターネットセレブブランドは5年以内に消滅するのでしょうか?

以前、タオバオ生放送運営の元責任者である趙元元氏は、「市場に出回っている『ネットセレブブランド』の9...

Vultr 無料 $5 (VPS-12 データセンター)

Vultr は本日、ウェブサイトの再設計を完了し、5 ドルのトライアル割引をリリースしました。割引は...

2022年の予測: クラウド コンピューティングの 3 つのホットなトレンド

COVID-19 パンデミックにより業界全体でハイブリッド ワークとデジタル中心のサービスが推進され...

基本的なウェブサイトエクスペリエンスを向上させる方法の紹介

基本的なウェブサイト エクスペリエンスは、SEO 最適化の前提条件です。初期段階でこれらの基礎が適切...

hostdare: 40% 割引コード/C3 データセンター VPS/高速ウェブサイト構築、高速 x、年間 15 ドルから、Alipay/WeChat

早朝に hostdare からプロモーション メールを受け取りました。ロサンゼルスにある hostd...

alphavps-2.5 USD/1g RAM/2CPU/150g HDD/500g トラフィック/ノースカロライナ

alphavps.net は、Host Cat によって一度紹介されました。このサーバーは、ノースカ...

最適化は「取る」ことも「従う」こともできない

本物の SEO 担当者になりたいのであれば、SEO の専門知識を理解するだけでなく、SEO の誤解も...

ジェイ・チョウ風の交通ボディが形になりつつある

インターネットとトラフィックの間には、切っても切れない複雑な関係があるようだ。多くのインターネットプ...

Baidu シェア SEO アプリケーション

Baidu は 2011 年にこれを開始し、最初は小規模なテストを実施し、2012 年 1 月 10...

fapvps-1G メモリ KVM/SSD ハードディスク/月額 6.99 ドル

fapvps、この VPS プロバイダーに関して、Hostcat は関連する紹介情報を見つけることが...

北京の知恵、クラウドが企業のデジタル変革を支援

2021年3月28日、CIOタイムズアカデミーと新インフライノベーション研究所が共催する「2021年...

スーパープロモーションでビジネスが世界中に広がる

Taobao チームはますます大きくなっており、それは競争がますます激しくなっていることを意味します...

tragicservers-20 USD/年/KVM/128 MB RAM/150 GB ハード ドライブ/1 TB トラフィック/ロサンゼルス

TragicServers は非常に小規模で、個人経営の企業ですが、同社の VPS は非常に評判が良...

天猫のダブル11の2時間での売上高は33.7億に達し、昨年の1日全体の売上高を上回った。

ダブル11の夜、アリペイの杭州オフィスビルは明るく照らされていた。新浪科技は11月11日早朝、アリバ...