ビッグデータとクラウドコンピューティングの深い統合はどのような側面に反映されていますか?

ビッグデータとクラウドコンピューティングの深い統合はどのような側面に反映されていますか?

[[386838]]

ITエコシステム全体のさらなる発展に伴い、2021年には、IT実務家の間ではビッグデータの開発動向について一般的なコンセンサスが形成され、ビッグデータとクラウドコンピューティングのさらなる深い統合、つまりビッグデータがクラウドコンピューティングを取り入れてクラウドネイティブへと移行するという動向が高まっています。

ミン兄弟がここにいます。私たちは、ディープ インテグレーションのトレンドの中で、ビッグ データとクラウド コンピューティングのディープ インテグレーションが具体的にどこに現れるのかを一緒に見ていきます。

ビッグデータとクラウド コンピューティングの緊密な統合は、次の側面に反映されています。

1. アプリケーション側のビッグデータ プラットフォームはクラウド上にあります。ビッグデータ テクノロジを使用するビジネス アプリケーション ビルダーは、独自のデータ センターを構築するのではなく、ビッグデータ プラットフォームをクラウドに移行します。クラウドベンダーの IaaS レイヤー上に独自のビッグデータ プラットフォームを構築する企業もあります。現状では、このようにクラウド上でビッグデータを活用する事例は比較的少ないです。クラウドベンダーが提供するPaaS層のビッグデータ関連製品を直接利用する企業もあれば、クラウドベンダーが発売するSaaS層のビッグデータ関連製品を直接利用する企業もあります。 「クラウド移行」において強調する必要がある傾向が 1 つあります。それは、ベンダー ロックインが発生しないことを誰もが非常に重視しているということです。基盤となるクラウドは、複数のパブリック クラウドとプライベート クラウドを統合したハイブリッド クラウドである場合があります。

2. クラウド コンピューティング ベンダーは、ビッグ データに基づく独自の付加価値サービスを継続的にリリースしています。主要なクラウド ベンダーは、市場競争力を高め、市場での地位をさらに強化/拡大するために、最も基本的な S3/OSS、EMR/E-MapReduce、前述の AWS RedShift、Alibaba Cloud の MaxCompute など、独自の統合ビッグ データ関連製品を積極的にリリースしています。さらに、さまざまなクラウド データベース、クラウド上のサーバーレス形式のさまざまなビッグ データ サービスなどがあります。次のスクリーンショットに示すように、このリストはまだ増え続けています。


3. 従来のビッグデータベンダーは、自社の製品やサービスを提供するためにクラウドに依存するようになりました。たとえば、Elastic は長年クラウドをベースとした独自の ELK テクノロジー スタックを提供しており、Databricks のビッグデータ プラットフォームと製品は常にクラウドをベースとして顧客にサービスを提供しており、Cloudera はビジネス モデルの変更を常に模索しています。

4. それぞれの特定のビッグデータ コンポーネントは、独自のアーキテクチャを積極的に変更し、クラウド ネイティブから「クラウド化」へと積極的に移行しています。概念レベルでは、ビッグデータは、初期の「データの局所性」と「モバイル データはモバイル コンピューティングほど優れていない」という重視から、現在の「ストレージとコンピューティングの分離」に進化しました。新しくリリースされた各コンポーネントとフレームワークは、クラウド ネイティブを積極的に採用しています。たとえば、Pulsa と TiDB は、ストレージとコンピューティングが分離されたクラウド ネイティブ アーキテクチャに基づいています。伝統的なコンポーネントには歴史的な負担が伴いますが、常に革新と変化を求めています。たとえば、Flink/Spark は深く統合されており、Kubernetes クラスター モードをサポートしています。 Kafka は、Zookeeper と Rebalance Protocol の静的メンバーシップへの依存を完全に排除するなど、フラワーのクラウド化も継続的に検討しています。古いことわざに「意志に従えば繁栄し、従わなければ滅びる」というのがあります。クラウド ネイティブ アーキテクチャに適さない一部の技術コンポーネントの市場は縮小しています。たとえば、多くのシナリオでは、Kubernetes が Yarn に取って代わり、オブジェクト ストレージ OSS/S3 も HDFS に取って代わります。また、Apache コミュニティによって Ozone がリリースされたことも注目しています。このコンポーネントはオブジェクト ストレージに基づいて、ファイル システム API も統合して起動します。このコンポーネントの背後には、元の HDFS コミュニティからの多くのコミッターがコードを提供しており、このコンポーネントは Cloudera CDP プラットフォームにも組み込まれています。次の図は、Flink/Spark と Kubernetes の深い統合を示しています。(k8s オペレーターを使用して k8s クラスターで Spark/Flink ジョブを実行するだけでなく、ネイティブの深い統合であることに注意してください)


<<:  分散システムのCAP定理とBASE理論

>>:  SpringBootとデータベーステーブルレコードに基づく分散ロックの実装

推薦する

個人情報保護法の草案が発表され、ファーウェイクラウドが企業のデータ処理規制遵守を支援

最近、第13期全国人民代表大会常務委員会第22回会議において、個人情報保護における現在の顕著な問題に...

中国移動は数万のノードを管理するという課題に直面しており、オープンソースのOpenStackだけがそれを解決できる

最近、私が参加する IT カンファレンスでは、オープンソースがほぼ毎回言及されており、オープンソース...

Kubernetes でのゼロトラストの実装

この記事は、ContainerJournalの2022年の記事「Kubernetesでのゼロトラスト...

Baidu のウェブマスター向けウェブサイト構築ガイド

1. サイトを効果的に Baidu に登録するにはどうすればよいですか?各 Web ページにテキスト...

暁蘇:ウェブサイトのオリジナルアクセスログの浅いところから深いところまでの分析について語る

最近、筆者はSEOを始めたばかり、またはSEOに1~2年従事している50人以上のSEO担当者を対象に...

#11.11# cloudcone: 真新しい母鶏、高構成、低価格、年間 14 ドル、1G メモリ/1 コア/20g SSD/5T トラフィック

Cloudcone は、低価格で高構成の「Double Eleven」プロモーションを実施します。新...

実用記事 | 「知乎チャンネル配信戦略」を徹底分析!

私が Zhihu に対して抱いた第一印象は、ずっと前に尋ねた質問から生まれました。 「あなたにとって...

QuadraNet - $39/Q9300/8g メモリ/1T ハードディスク/15T トラフィック/5IPv4/ロサンゼルス

QuadraNet は時々現れて、ジャンクなものをいくつか出します。彼らによると、これは超低価格のサ...

Google のアルゴリズムを使用して 24 時間で 30 万件のトラフィックを一掃

Google のランキング アルゴリズムは比較的包括的ですが、Google が新しい Web ページ...

#BlackFriday# Contabo: 月額 8.49 ドル、シンガポール/米国/ドイツ/英国、8G メモリ/4 コア (AMD EPYC)/200gSSD/32T トラフィック、Windows をサポート

contabo のブラックフライデーをご紹介します。VPS、VDS、専用サーバー、ブロックストレージ...

5Gがクラウドコンピューティングを変える2つの方法

5G が到来し、ほとんどの人がこの大きな進歩を期待しています。クラウドコンピューティングに関しては、...

Apple のプリインストール チャネルを失った後、Google マップはこのようにユーザーを獲得します。

中国本土のインターネットユーザーにとって Google の使用が難しいのと同様に、Google マッ...

突然の停止が発生した場合、Kafka によって書き込まれたデータが失われないようにするにはどうすればよいですか?

先週、「Kafka はどのようにして 1 秒あたり数百万件という超高速同時書き込みを実現するのか?」...

2018 年に需要が高まるクラウド コンピューティング スキル トップ 5

2018 年には、あらゆる規模の企業がクラウド コンピューティング プロジェクトを推進し始めるため、...

Baidu の評判がひっそりと開始: ウェブサイトの評判を客観的に評価する方法

最近、Baidu Reputation がオンラインでひっそりとリリースされました。多くの SEO ...