ITエコシステム全体のさらなる発展に伴い、2021年には、IT実務家の間ではビッグデータの開発動向について一般的なコンセンサスが形成され、ビッグデータとクラウドコンピューティングのさらなる深い統合、つまりビッグデータがクラウドコンピューティングを取り入れてクラウドネイティブへと移行するという動向が高まっています。 ミン兄弟がここにいます。私たちは、ディープ インテグレーションのトレンドの中で、ビッグ データとクラウド コンピューティングのディープ インテグレーションが具体的にどこに現れるのかを一緒に見ていきます。 ビッグデータとクラウド コンピューティングの緊密な統合は、次の側面に反映されています。 1. アプリケーション側のビッグデータ プラットフォームはクラウド上にあります。ビッグデータ テクノロジを使用するビジネス アプリケーション ビルダーは、独自のデータ センターを構築するのではなく、ビッグデータ プラットフォームをクラウドに移行します。クラウドベンダーの IaaS レイヤー上に独自のビッグデータ プラットフォームを構築する企業もあります。現状では、このようにクラウド上でビッグデータを活用する事例は比較的少ないです。クラウドベンダーが提供するPaaS層のビッグデータ関連製品を直接利用する企業もあれば、クラウドベンダーが発売するSaaS層のビッグデータ関連製品を直接利用する企業もあります。 「クラウド移行」において強調する必要がある傾向が 1 つあります。それは、ベンダー ロックインが発生しないことを誰もが非常に重視しているということです。基盤となるクラウドは、複数のパブリック クラウドとプライベート クラウドを統合したハイブリッド クラウドである場合があります。 2. クラウド コンピューティング ベンダーは、ビッグ データに基づく独自の付加価値サービスを継続的にリリースしています。主要なクラウド ベンダーは、市場競争力を高め、市場での地位をさらに強化/拡大するために、最も基本的な S3/OSS、EMR/E-MapReduce、前述の AWS RedShift、Alibaba Cloud の MaxCompute など、独自の統合ビッグ データ関連製品を積極的にリリースしています。さらに、さまざまなクラウド データベース、クラウド上のサーバーレス形式のさまざまなビッグ データ サービスなどがあります。次のスクリーンショットに示すように、このリストはまだ増え続けています。 3. 従来のビッグデータベンダーは、自社の製品やサービスを提供するためにクラウドに依存するようになりました。たとえば、Elastic は長年クラウドをベースとした独自の ELK テクノロジー スタックを提供しており、Databricks のビッグデータ プラットフォームと製品は常にクラウドをベースとして顧客にサービスを提供しており、Cloudera はビジネス モデルの変更を常に模索しています。 4. それぞれの特定のビッグデータ コンポーネントは、独自のアーキテクチャを積極的に変更し、クラウド ネイティブから「クラウド化」へと積極的に移行しています。概念レベルでは、ビッグデータは、初期の「データの局所性」と「モバイル データはモバイル コンピューティングほど優れていない」という重視から、現在の「ストレージとコンピューティングの分離」に進化しました。新しくリリースされた各コンポーネントとフレームワークは、クラウド ネイティブを積極的に採用しています。たとえば、Pulsa と TiDB は、ストレージとコンピューティングが分離されたクラウド ネイティブ アーキテクチャに基づいています。伝統的なコンポーネントには歴史的な負担が伴いますが、常に革新と変化を求めています。たとえば、Flink/Spark は深く統合されており、Kubernetes クラスター モードをサポートしています。 Kafka は、Zookeeper と Rebalance Protocol の静的メンバーシップへの依存を完全に排除するなど、フラワーのクラウド化も継続的に検討しています。古いことわざに「意志に従えば繁栄し、従わなければ滅びる」というのがあります。クラウド ネイティブ アーキテクチャに適さない一部の技術コンポーネントの市場は縮小しています。たとえば、多くのシナリオでは、Kubernetes が Yarn に取って代わり、オブジェクト ストレージ OSS/S3 も HDFS に取って代わります。また、Apache コミュニティによって Ozone がリリースされたことも注目しています。このコンポーネントはオブジェクト ストレージに基づいて、ファイル システム API も統合して起動します。このコンポーネントの背後には、元の HDFS コミュニティからの多くのコミッターがコードを提供しており、このコンポーネントは Cloudera CDP プラットフォームにも組み込まれています。次の図は、Flink/Spark と Kubernetes の深い統合を示しています。(k8s オペレーターを使用して k8s クラスターで Spark/Flink ジョブを実行するだけでなく、ネイティブの深い統合であることに注意してください) |
>>: SpringBootとデータベーステーブルレコードに基づく分散ロックの実装
現在、Google ウェブマスター ツール、Baidu ウェブマスター プラットフォーム、360 ウ...
昨晩Weiboをチェックしていたところ、興味深い話題が2つ見つかったので、返信し、ネットユーザーのコ...
ほとんどの SEM 担当者は、大規模な電子商取引サイトの検索エンジン マーケティングに関しては途方に...
今年の6月は、昨年の6月からちょうど1年になります。 昨年6月、 Clouderaは2020年第1四...
COVID-19パンデミックは、新たな技術やビジネスの発展をほとんど生み出していませんが、すでに進行...
オンラインストアを開設したり、様々なプロジェクトを行っています。何かを初めてやるときに、それを早くや...
dedione は Hostcat で 3 回紹介されていますが、今回はより優れた CN2 回線、無...
ウェブマスターの年次総会からしばらく経ち、メディアによるニュースも発表され、各ウェブマスターの感想も...
ヨーロッパにおけるフランスの重要性は、ほとんどの人が知っているはずです。データセンターとして、フラン...
Luobo Dataは香港を拠点に運営している会社であると主張しています。主に香港国際回線(100M...
PrometeusのシカゴデータセンターVPSはSSDハードドライブを使用しており、openvzとX...
2sync は 2009 年に設立されたインドのムンバイの会社です。現在の事業には、ドメイン名、仮想...
数日前、私は「企業ウェブサイトのマルチキーワードSEOは2013年に破滅する」というタイトルの記事を...
[51CTO.com からのオリジナル記事] インターネットや情報技術の発展に伴い、人々が知識を獲得...
昨日の朝、江西省南昌市警察は「ワンダフルライフ」本部で捜査を行った。 呉文昌の絵画モーニングポスト記...