ハイブリッド vs. マルチクラウド: Kafka アーキテクチャの 5 つの重要な比較

ハイブリッド vs. マルチクラウド: Kafka アーキテクチャの 5 つの重要な比較

ハイブリッドおよびマルチクラウド インフラストラクチャは、Apache Kafka を使用するユーザーにとって多くの利点をもたらします。

クラウド テクノロジーは、現代のビジネスにとってこれまで以上に重要になっています。企業の 94% は、クラウド インフラストラクチャがもたらすメリットを理由に、クラウド インフラストラクチャに投資しています。

クラウドを使用している企業の約 87% がハイブリッド クラウド環境に依存しています。ただし、他のクラウド ソリューションを使用している企業もあるため、これについても議論する必要があります。

現在、ほとんどの企業のクラウド エコシステムには、インフラストラクチャ、コンプライアンス、セキュリティなどの側面が含まれています。これらのインフラストラクチャは、ハイブリッドまたはマルチクラウドに配置できます。さらに、マルチクラウド システムでは、組織のニーズに基づいてさまざまなベンダーからクラウド インフラストラクチャを調達します。

ハイブリッド クラウド戦略には多くの利点がありますが、マルチクラウド インフラストラクチャの利点についても議論する必要があります。マルチクラウド インフラストラクチャとは、さまざまなベンダーからテクノロジを取得することを意味します。これらのベンダーはプライベートでもパブリックでもかまいません。ハイブリッド クラウド システムは、オンプレミスのハードウェア ソリューションとパブリック クラウドの両方を使用して、さまざまなクラウド タイプを組み合わせたクラウド展開モデルです。

Apache Kafka クラスターを安全に使用して、Amazon の S3 などのさまざまなクラウド サービスを使用して、オンプレミスのハードウェア ソリューションからデータ レイクにデータをシームレスに移動できます。ただし、クラウド クラスターでトピックを複製するか、クラウドからアプリケーションに読み取りとコピーを行うカスタム コネクタを開発する必要があることに注意してください。

さまざまな Apache Kafka アーキテクチャの 5 つの重要な比較

1. KafkaとETL処理

Apache Kafka は、高パフォーマンスのデータ パイプライン、さまざまな分析データのストリーミング、Kafka を使用した企業にとって重要な資産の実行などに使用できますが、Kafka クラスターを使用して複数のシステム間でデータを移動することもできることをご存知でしたか?

これは通常、Kafka プロデューサーがデータを公開したり、Kafka トピックにプッシュしたりして、アプリケーションがデータを使用できるようにしているためです。ただし、Kafka コンシューマーは通常、ターゲット アプリケーションにデータを供給するカスタム アプリケーションです。したがって、クラウド プロバイダーのツールを使用して、データを抽出して変換するジョブを作成し、ETL データをロードできるという利点も得られます。

Amazon の AWS Glue は、Apache Kafka および Amazon Managed Apache Kafka (MSK) ストリームからデータを消費できるツールの 1 つです。これにより、データ結果をすばやく変換し、Amazon S3 データレイクまたは JDBC データストアにロードできるようになります。

2. 建築設計

ほとんどのシステムの場合、最初のステップは通常、ユーザーがこのデータをすばやく表示できるように、応答性が高く管理しやすい Apache Kafka アーキテクチャを構築することです。たとえば、従業員保険証券フォームなど、多くの重要なデータ セットを含むドキュメントを処理および記録する必要がある場合などです。その後、さまざまなクラウド ツールを使用してデータを抽出し、さらに処理することができます。

また、AWS Glue などのクラウドベースのツールを構成して、オンプレミスのクラウドハードウェアに接続し、安全な接続を確立することもできます。 3 ステップの ETL フレームワーク ジョブで問題が解決するはずです。手順がわからない場合は、次の手順に従ってください: 手順 1: ツールとローカルの Apache Kafka データ ストレージ ソース間の接続を作成します。ステップ 2: データ カタログ テーブルを作成します。ステップ 3: ETL ジョブを作成し、そのデータをデータ レイクに保存します。

3. 接続する

事前定義された Kafka 接続を使用すると、AWS Glue などのさまざまなクラウド ツールを使用して、データ カタログに安全な Secure Sockets Layer (SSL) 接続を作成できます。さらに、これらの接続には常に自己署名 SSL 証明書が必要であることに注意してください。

さらに、情報からより多くの価値を引き出すために実行できる手順がいくつかあります。たとえば、Quick Sight などのさまざまなビジネス インテリジェンス ツールを使用して、内部の Kafka ダッシュボードにデータを埋め込むことができます。その後、別のチーム メンバーがイベント駆動型アーキテクチャを使用して管理者に通知し、さまざまなダウンストリーム アクションを実行できます。特定のデータ型を扱うときは常にこれを実行する必要がありますが、ここでの可能性は無限です。

4. セキュリティグループ

AWS Glue のようなクラウドツールがそのコンポーネント間で通信する必要がある場合は、すべての伝送制御プロトコル (TCP) ポートに対して自己参照の受信ルールを持つセキュリティグループを指定する必要があります。これにより、データ ソースを同じセキュリティ グループに制限できるようになります。基本的に、すべてのトラフィックに対して自己参照型の受信ルールを事前に構成できます。次に、この新しく作成された接続を参照する Apache Kafka トピックを設定し、スキーマ検出機能を使用する必要があります。

5. データ処理

Apache Kafka 接続を完了してジョブを作成したら、後で必要になるソース データをフォーマットできます。さまざまな変換ツールを使用してデータベースを処理することもできます。このデータ処理を行うには、先ほど作成した ETL スクリプトを使用して、上記の 3 つの手順に従います。

結論は

Apache Kafka は、さまざまなアプリケーションで多様に使用できるオープンソースのデータ処理ソフトウェアです。上記のガイドラインを使用して、適切なストレージの種類を決定してください。

<<:  ガートナー:世界のパブリッククラウドのエンドユーザー支出は2022年に5,000億ドルに近づく

>>:  10年間の努力、新時代のIT技術の頂点を目指す - WOTグローバルテクノロジーイノベーションカンファレンス2022が盛大に開幕

推薦する

私のSEO計画: 全体像を把握し、細部に注意を払う

休暇前に社会と触れ合い、自分を鍛えたいと思い、自分の趣味と能力を組み合わせて、蘇州にある電動機器を販...

盗作を減らしてウェブサイトをオリジナルにしましょう - A5 Webmaster Network

実際、オリジナル記事の 90% は疑似オリジナルであるということは誰もが知っているはずです。特に、イ...

快手、新たな成長の柱を模索するため初のクラウドコンピューティングサービス「StreamLake」を開始

快手は最近、「顧客とユーザーを最もよく理解するクラウドサービス」をスローガンに掲げ、初のクラウドサー...

テンセントの最新のデータベース研究成果が、世界トップのデータベースカンファレンスであるSIGMODに選出された。

テンセントと華中科技大学の最新の共同研究成果が、世界最高峰のデータベースカンファレンス「SIGMOD...

医療系ウェブサイトのキーワードの位置づけの把握方法

SEO最適化に関しては、あらゆる人がうまく行うことができますが、運用中に注意する必要があるのは、We...

ネットワークマーケティングの利点は何ですか

オンラインマーケティングの利点を知りたい場合は、まずオンラインマーケティングとは何かを理解する必要が...

IoT、エッジコンピューティング、AIプロジェクトが企業にもたらす利益

[[385209]]ビル・ホームズは、象徴的なフェンダー・ストラトキャスターとテレキャスターのギター...

百度の新規サイトの更新サイクルに関する最新調査結果

著者は最近、多くの例を通して、Baidu の新規サイトへのアップデートのほとんどにはホームページのみ...

2014 年の動画サイト著作権戦争を包括的に見る

年末が近づくにつれ、動画サイト界隈では著作権の争奪戦や広告出稿、そして舌戦が繰り広げられている。ここ...

ガートナー: クラウド セキュリティが直面する 3 つの大きな課題とそれに対応する 3 つの戦略

クラウド セキュリティの課題について話す前に、まず 1 つのことを確認しておく必要があります。クラウ...

VMware が IT チームの負担を軽減し、従業員のエクスペリエンスを向上させる新しい Anywhere Workspace 機能を発表

今日のハイブリッドな作業環境において、IT チームはさまざまな新たな課題に取り組んでいます。従業員は...

extravm: Ryzen 3900X+NVMe+1gDDR4 メモリ、わずか 3.48 ドル、ダラス データ センター

ExtraVM は、Hivelocity のダラス データ センターに新しいマシンを装備しています。...

ゼロから始める教育:アプリ初リリーススキル+オムニチャネル

優れた製品アプリを作るのは簡単ではありませんが、優れたアプリをリリースするのはさらに困難です。大量に...

クラウドベースのビデオ監視の準備はできていますか?

[[431304]]数年前、帯域幅とセキュリティの問題により、クラウド上の専門的なセキュリティ サー...