クラウドストレージに隠されたデータを見つける方法

クラウドストレージに隠されたデータを見つける方法

クラウド オブジェクト リポジトリが事実上のデータ レイクになるにつれ、企業は蓄積されるすべてのデータを検索して把握するのに苦労していることが最近の調査で明らかになりました。

空きスペースがたくさんある人は、物が散らかっている傾向があり、それが人間の性なのかもしれません。クラウド オブジェクト ストレージが、ますます多くの企業にとって事実上のデータ レイクになりつつあるという傾向もあります。幸いなことに、クラウド オブジェクト ストレージは比較的安価で、拡張性が高く、アクセスしやすくなっています。たとえば、ほとんどのクラウド Hadoop サービスでは、オブジェクト ストレージを Hadoop 分散ファイル システム (HDFS) に置き換えており、アドホック クエリを提供したり、クラウド オブジェクト ストレージをデータ ウェアハウスの拡張テーブルとして扱ったりするサービスを提供するクラウド コンピューティング プロバイダーが増えています。

デフォルトのターゲットまたはデータ レイクとしてクラウド ストレージを利用するもう 1 つの側面は、共通のターゲットでのデータの蓄積を調整する必要性と、特に GDPR などの規制が発効した場合に、データのプライバシーやデータ保護についてより責任を持つ必要があることです。

今年の夏にクラウド ストレージ (現在は Amazon S3 として知られています) を追加するための SaaS プロバイダー向けの検索レイヤーを立ち上げる予定の Chaos Sumo が、クラウド導入者が感じている問題点の一部を示す調査結果を発表しました。

確かに、この調査は回答者が 120 名と大規模ではなく、主にデータ運用の専門家を対象としており、サンプルはクラウド コンピューティングをすでに導入している組織に偏っている可能性が高いです。たとえば、72% が現在何らかの形のクラウド オブジェクト ストレージを使用していると回答しています。 Amazon S3 を使用している回答者の 40% は、今後 1 年間で S3 ストレージの使用が少なくとも 50% 増加すると予想していると回答しました。

企業では、主にバックアップ、ストレージ、アーカイブに使用されます。しかし、28% の企業がすでにデータ レイクにオブジェクト ストレージを使用しており、さらに 18% の企業が今後 12 ~ 18 か月以内に実装する予定です。この AWS を多用するサンプルでは当然のことながら、同様の割合 (23%) が現在 Amazon Athena を使用していると報告しています。回答者の約半数がすでに Amazon Redshift データ ウェアハウスを使用していると回答しており、Spectrum では S3 を拡張テーブルとして表示できるようになりました。

Athena などのツールの革新により、ETL を必要とせずに、ストレージ用に最適化されていないシステムのデータへのインタラクティブなアクセスが可能になります (ただし、データは CSV、JSON、Parquet などの何らかの形式の半構造化ストレージである必要があります)。

しかし、グラフが示すように、オブジェクト ストレージにデータが集中するにつれて、説明責任の問題を懸念する少数派が増えています。これはまさに、何らかの形のデータ系統、セキュリティ、アクセス制御を存在意義とする、Hadoop などのプラットフォームや、分析およびデータ準備用のパッケージ化されたツールの商業的販売上の利点です。クラウド オブジェクト ストレージは、ガバナンスや境界セキュリティに関しては無防備です。これは従来、データを使用するデータ プラットフォーム、クラウド ホスト、または分析ツールの役割です。

その結果、回答者の 4 分の 1 は、データを分析するためにデータを移動する必要があることを懸念しており、少数ではあるものの統計的に有意な少数派が、データの検索、コンプライアンス、セキュリティについて懸念を表明しました。回答者の半数以上がデータのクリーニングと準備に多くの時間を費やしており、回答者の半数以上が週に少なくとも 6 時間費やしていると答え、約 40% がタスクの完了に週に 11 時間以上費やしていると答えています。

注目すべきは、現在オブジェクト ストレージ内のデータの分析は簡単だと答えた回答者はわずか 7% だったことです。それが、調査スポンサーであるChaos Sumoの事業目的です。同社は、既存の SaaS プロバイダーによる OEM 利用のために、S3 データを Elasticsearch に公開する「データ ファブリック」と呼ばれるものを今夏に導入する予定です。 S3 が、さらに多くの分析プラットフォームやツールに適した場所になることが期待されます。 Chaos Sumo にとって、SaaS プロバイダーに検索をユーティリティとして追加し、このデータの可視性を高めることは、クラウド ストレージのより優れたアプリケーションにつながる可能性があります。

<<:  8000億ドルのクラウドサービス市場:大手企業が覇権を競い、新興企業が「一口かじり取る」

>>:  華雲とその仲間たち | Huayun Data がハイパーコンバージェンスとハイブリッドクラウド製品をパートナーと共有

推薦する

動画の外部リンクを効果的に公開する方法

ウェブサイトを最適化する場合、ソフト記事の外部リンク、ビデオの外部リンク、ブログの外部リンク、フォー...

netcetera-5 ポンド/KVM/512M メモリ/10gSSD/1T トラフィック/マン島

netcetera.co.uk は、マン島(イギリスとアイルランドの間の海に浮かぶ、イギリスに属する...

報告書:貧しい地域ではインターネットへのアクセスにモバイルデバイスを使用する傾向が高い

中国インターネット情報センターの報告によると、2014年12月現在、中国のインターネット利用者数は6...

長い間ページがインデックスされていない場合、どうすれば Baidu に自分の Web サイトのインデックスを作成させることができますか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますウェブサイ...

Cohu、統合クラウド・プラットフォームの構築にOracle Fusion Cloud Applicationsを採用

世界有数の半導体装置メーカーである Cohu は、世界中で事業を拡大し続ける中で、統合システムとプロ...

openvirtuals-$7/4 コア/1g メモリ/2g スワップ/180g ハードディスク/3T トラフィック

Openvirtuals は 2003 年に設立された正式な会社です。同社の VPS は非常に高価で...

pq.hostingはどうですか?フィンランドVPSの簡単なレビュー

pq.hosting はフィンランドに独自のデータセンターと設備も所有しており、無制限のトラフィック...

Mivocloud: ロシアの OpenStack クラウド、5 ユーロ/2g メモリ/40g SSD/無制限トラフィック

モルドバの商人である moldova は、モルドバとルーマニアに独自のデータ センターを持っています...

外部リンクとフレンドリーリンクからのトラフィックを導入する方法について簡単に説明します

「コンテンツは王様、外部リンクは女王」という言葉の意味がまったく理解できませんでした。Web サイト...

コンテナ化された環境でインフラストラクチャを管理するための 9 つのベストプラクティス

コンテナ テクノロジーを採用すると、開発者の作業は楽になりますが、運用チームにとっては複雑になること...

世界のクラウド支出はIaaSの牽引により21.7%増加すると予想されている

ガートナーの新しい予測によると、インフラストラクチャ・アズ・ア・サービスがクラウド サービスに対する...

SEO の背後に隠された秘密のイベント マーケティング

SEO の専門家として、私たちは具体的に何をしているのでしょうか。実は、多くの人がこの質問をしたがり...

Pinterestタイプのウェブサイトを最適化する方法

Pinterestが米国で登場して以来、中国のインターネットは一夜にしてウォーターフォールフローに支...

pqhosting: ポルトガルの VPS、月額 3.7 ユーロから、1Gbps の帯域幅、無制限のトラフィック、Windows システム

pq.hosting、このモルドバの商人は非常に興味深いです。彼らは現在、比較的珍しいポルトガルのデ...

SaaS システムのユーザー権限設計の説明

クラウドコンピューティングの発展に伴い、ますます多くの企業の製品ビジネスがソフトウェア サービス プ...