クラウドストレージに隠されたデータを見つける方法

クラウドストレージに隠されたデータを見つける方法

クラウド オブジェクト リポジトリが事実上のデータ レイクになるにつれ、企業は蓄積されるすべてのデータを検索して把握するのに苦労していることが最近の調査で明らかになりました。

空きスペースがたくさんある人は、物が散らかっている傾向があり、それが人間の性なのかもしれません。クラウド オブジェクト ストレージが、ますます多くの企業にとって事実上のデータ レイクになりつつあるという傾向もあります。幸いなことに、クラウド オブジェクト ストレージは比較的安価で、拡張性が高く、アクセスしやすくなっています。たとえば、ほとんどのクラウド Hadoop サービスでは、オブジェクト ストレージを Hadoop 分散ファイル システム (HDFS) に置き換えており、アドホック クエリを提供したり、クラウド オブジェクト ストレージをデータ ウェアハウスの拡張テーブルとして扱ったりするサービスを提供するクラウド コンピューティング プロバイダーが増えています。

デフォルトのターゲットまたはデータ レイクとしてクラウド ストレージを利用するもう 1 つの側面は、共通のターゲットでのデータの蓄積を調整する必要性と、特に GDPR などの規制が発効した場合に、データのプライバシーやデータ保護についてより責任を持つ必要があることです。

今年の夏にクラウド ストレージ (現在は Amazon S3 として知られています) を追加するための SaaS プロバイダー向けの検索レイヤーを立ち上げる予定の Chaos Sumo が、クラウド導入者が感じている問題点の一部を示す調査結果を発表しました。

確かに、この調査は回答者が 120 名と大規模ではなく、主にデータ運用の専門家を対象としており、サンプルはクラウド コンピューティングをすでに導入している組織に偏っている可能性が高いです。たとえば、72% が現在何らかの形のクラウド オブジェクト ストレージを使用していると回答しています。 Amazon S3 を使用している回答者の 40% は、今後 1 年間で S3 ストレージの使用が少なくとも 50% 増加すると予想していると回答しました。

企業では、主にバックアップ、ストレージ、アーカイブに使用されます。しかし、28% の企業がすでにデータ レイクにオブジェクト ストレージを使用しており、さらに 18% の企業が今後 12 ~ 18 か月以内に実装する予定です。この AWS を多用するサンプルでは当然のことながら、同様の割合 (23%) が現在 Amazon Athena を使用していると報告しています。回答者の約半数がすでに Amazon Redshift データ ウェアハウスを使用していると回答しており、Spectrum では S3 を拡張テーブルとして表示できるようになりました。

Athena などのツールの革新により、ETL を必要とせずに、ストレージ用に最適化されていないシステムのデータへのインタラクティブなアクセスが可能になります (ただし、データは CSV、JSON、Parquet などの何らかの形式の半構造化ストレージである必要があります)。

しかし、グラフが示すように、オブジェクト ストレージにデータが集中するにつれて、説明責任の問題を懸念する少数派が増えています。これはまさに、何らかの形のデータ系統、セキュリティ、アクセス制御を存在意義とする、Hadoop などのプラットフォームや、分析およびデータ準備用のパッケージ化されたツールの商業的販売上の利点です。クラウド オブジェクト ストレージは、ガバナンスや境界セキュリティに関しては無防備です。これは従来、データを使用するデータ プラットフォーム、クラウド ホスト、または分析ツールの役割です。

その結果、回答者の 4 分の 1 は、データを分析するためにデータを移動する必要があることを懸念しており、少数ではあるものの統計的に有意な少数派が、データの検索、コンプライアンス、セキュリティについて懸念を表明しました。回答者の半数以上がデータのクリーニングと準備に多くの時間を費やしており、回答者の半数以上が週に少なくとも 6 時間費やしていると答え、約 40% がタスクの完了に週に 11 時間以上費やしていると答えています。

注目すべきは、現在オブジェクト ストレージ内のデータの分析は簡単だと答えた回答者はわずか 7% だったことです。それが、調査スポンサーであるChaos Sumoの事業目的です。同社は、既存の SaaS プロバイダーによる OEM 利用のために、S3 データを Elasticsearch に公開する「データ ファブリック」と呼ばれるものを今夏に導入する予定です。 S3 が、さらに多くの分析プラットフォームやツールに適した場所になることが期待されます。 Chaos Sumo にとって、SaaS プロバイダーに検索をユーティリティとして追加し、このデータの可視性を高めることは、クラウド ストレージのより優れたアプリケーションにつながる可能性があります。

<<:  8000億ドルのクラウドサービス市場:大手企業が覇権を競い、新興企業が「一口かじり取る」

>>:  華雲とその仲間たち | Huayun Data がハイパーコンバージェンスとハイブリッドクラウド製品をパートナーと共有

推薦する

K8s 使用率が 72% に達する、CNCF 中国クラウドネイティブ調査が発表

最近、Cloud Native Computing Foundation (CNCF) が第 3 回...

企業のデータ分析をクラウドに移行するのは簡単ではない

クラウド内の新しいプラットフォームでデータ ウェアハウスとデータ マートを最新化することを検討してい...

KMaaS を使用してマルチクラウドのキー管理の課題に対処する方法

今日のアプリケーションは暗号化テクノロジーで実行されており、クラウドでアプリケーションを実行するには...

SEO 外部リンクとフレンドリーリンクの Nofollow タグ

最近、Han Tang Tea Cityとのリンク交換で、相手のリンクコードに以下のようにnofol...

クラウドの停止中に企業は損失を回復できますか?

クラウド コンピューティングは、効率性の向上、データ セキュリティの強化、利益の増加という魅力的な可...

時間との競争: 機械業界におけるネットワーク マーケティングの解決策は何でしょうか?

今日、新しい同僚が会社に加わりました。彼は長い間、機械業界でオンライン販売に携わっていました。私たち...

JVM に固執する | Arthas を使用して JVM メモリをチェックするのは素晴らしいことです。

[[402910]]この記事はWeChatの公開アカウント「Mu Xiaonong」から転載したもの...

Weiboのトピックを見てSEOの価値を分析する

昨晩Weiboをチェックしていたところ、興味深い話題が2つ見つかったので、返信し、ネットユーザーのコ...

数千の共同購入サイトの戦いが再編される:わずか半年で1,500の共同購入サイトが消滅

共同購入は2010年に中国に参入した。1年以上の急速な発展の後、すぐに再編が行われた。昨年8月から半...

グリーンクラウドはいかがでしょうか?サンノゼデータセンターのAMDシリーズチキンのレビュー

グリーンクラウドはいかがでしょうか? greencloudvpsはどうですか?ブラックフライデー中に...

プライベートドメインのトラフィックがWeChatマーケティングに集中するのは良いことでしょうか?

「プライベートドメイントラフィック」という概念が普及して以来、WeChatは「プライベートドメイント...