クラウドストレージに隠されたデータを見つける方法

クラウドストレージに隠されたデータを見つける方法

クラウド オブジェクト リポジトリが事実上のデータ レイクになるにつれ、企業は蓄積されるすべてのデータを検索して把握するのに苦労していることが最近の調査で明らかになりました。

空きスペースがたくさんある人は、物が散らかっている傾向があり、それが人間の性なのかもしれません。クラウド オブジェクト ストレージが、ますます多くの企業にとって事実上のデータ レイクになりつつあるという傾向もあります。幸いなことに、クラウド オブジェクト ストレージは比較的安価で、拡張性が高く、アクセスしやすくなっています。たとえば、ほとんどのクラウド Hadoop サービスでは、オブジェクト ストレージを Hadoop 分散ファイル システム (HDFS) に置き換えており、アドホック クエリを提供したり、クラウド オブジェクト ストレージをデータ ウェアハウスの拡張テーブルとして扱ったりするサービスを提供するクラウド コンピューティング プロバイダーが増えています。

デフォルトのターゲットまたはデータ レイクとしてクラウド ストレージを利用するもう 1 つの側面は、共通のターゲットでのデータの蓄積を調整する必要性と、特に GDPR などの規制が発効した場合に、データのプライバシーやデータ保護についてより責任を持つ必要があることです。

今年の夏にクラウド ストレージ (現在は Amazon S3 として知られています) を追加するための SaaS プロバイダー向けの検索レイヤーを立ち上げる予定の Chaos Sumo が、クラウド導入者が感じている問題点の一部を示す調査結果を発表しました。

確かに、この調査は回答者が 120 名と大規模ではなく、主にデータ運用の専門家を対象としており、サンプルはクラウド コンピューティングをすでに導入している組織に偏っている可能性が高いです。たとえば、72% が現在何らかの形のクラウド オブジェクト ストレージを使用していると回答しています。 Amazon S3 を使用している回答者の 40% は、今後 1 年間で S3 ストレージの使用が少なくとも 50% 増加すると予想していると回答しました。

企業では、主にバックアップ、ストレージ、アーカイブに使用されます。しかし、28% の企業がすでにデータ レイクにオブジェクト ストレージを使用しており、さらに 18% の企業が今後 12 ~ 18 か月以内に実装する予定です。この AWS を多用するサンプルでは当然のことながら、同様の割合 (23%) が現在 Amazon Athena を使用していると報告しています。回答者の約半数がすでに Amazon Redshift データ ウェアハウスを使用していると回答しており、Spectrum では S3 を拡張テーブルとして表示できるようになりました。

Athena などのツールの革新により、ETL を必要とせずに、ストレージ用に最適化されていないシステムのデータへのインタラクティブなアクセスが可能になります (ただし、データは CSV、JSON、Parquet などの何らかの形式の半構造化ストレージである必要があります)。

しかし、グラフが示すように、オブジェクト ストレージにデータが集中するにつれて、説明責任の問題を懸念する少数派が増えています。これはまさに、何らかの形のデータ系統、セキュリティ、アクセス制御を存在意義とする、Hadoop などのプラットフォームや、分析およびデータ準備用のパッケージ化されたツールの商業的販売上の利点です。クラウド オブジェクト ストレージは、ガバナンスや境界セキュリティに関しては無防備です。これは従来、データを使用するデータ プラットフォーム、クラウド ホスト、または分析ツールの役割です。

その結果、回答者の 4 分の 1 は、データを分析するためにデータを移動する必要があることを懸念しており、少数ではあるものの統計的に有意な少数派が、データの検索、コンプライアンス、セキュリティについて懸念を表明しました。回答者の半数以上がデータのクリーニングと準備に多くの時間を費やしており、回答者の半数以上が週に少なくとも 6 時間費やしていると答え、約 40% がタスクの完了に週に 11 時間以上費やしていると答えています。

注目すべきは、現在オブジェクト ストレージ内のデータの分析は簡単だと答えた回答者はわずか 7% だったことです。それが、調査スポンサーであるChaos Sumoの事業目的です。同社は、既存の SaaS プロバイダーによる OEM 利用のために、S3 データを Elasticsearch に公開する「データ ファブリック」と呼ばれるものを今夏に導入する予定です。 S3 が、さらに多くの分析プラットフォームやツールに適した場所になることが期待されます。 Chaos Sumo にとって、SaaS プロバイダーに検索をユーティリティとして追加し、このデータの可視性を高めることは、クラウド ストレージのより優れたアプリケーションにつながる可能性があります。

<<:  8000億ドルのクラウドサービス市場:大手企業が覇権を競い、新興企業が「一口かじり取る」

>>:  華雲とその仲間たち | Huayun Data がハイパーコンバージェンスとハイブリッドクラウド製品をパートナーと共有

推薦する

調査と市場:世界のクラウドコンピューティングの収益は2025年までに3,420億ドルに達すると予想

調査会社リサーチ・アンド・マーケッツによれば、世界のクラウドコンピューティングの収益は2020年から...

百度が電子商取引の環境を再構築:愛楽火が5000万ドル以上を調達

「愛楽火」に初めてログインしたユーザーにとって、「美麗速」と「点評」の両方に似たウェブサイトから、こ...

hosteons: 1Gbps 無制限専用サーバーがたったの 85 ドル、ロサンゼルス、さらにハイエンドなオプションも利用可能

Hosteons から最新のプロモーションが届きました。米国西海岸ロサンゼルスの Psychz デー...

SEO シソーラスの完全ガイド

以前、SEO チャネルについてお話ししましたが、その中で非常に重要なステップは語彙データベースの確立...

インターネットマーケティングで失敗する運命にある企業はどれでしょうか?

月収10万元の起業の夢を実現するミニプログラム起業支援プラン企業にとって、インターネット マーケティ...

ブランドマーケティングプログラム運用マニュアル

私自身の業務経験や情報をもとにまとめたブランドマーケティング運用マニュアルです。ブランド マーケティ...

Hostens: バレンタインデー 50% オフ プロモーション、仮想ホスティング 50% オフ、2 年間 11.8 ドル

リトアニアの老舗商人「Interneto Vizija」の子会社であるHostensが、最新のバレン...

Dynatrace がガートナーの 2019 年 APM マジック クアドラントで 9 年連続リーダーに選出

エンタープライズ クラウド向けソフトウェア インテリジェンス企業である Dynatrace は本日、...

Google PageRank (PR) の数字の意味の詳細な説明

Google PageRank は、Google が Web ページを評価するために使用するスコアリ...

ブランドは七夕をどのように活用できるでしょうか?ここに 6 つのマーケティングのヒントをご紹介します。

七夕のマーケティングの勢いを活かすための、心からのエントリーポイントは何でしょうか? 1. 七夕の古...

オンラインプロモーションステーションのオンライン最適化後のいくつかの考察

同社は最近、製品ウェブサイトとオンラインプロモーションウェブサイトを立ち上げました。新しい会社である...

検索エンジンのリンク関連性の原則の簡単な分析

再び、検索エンジンとウェブサイトの最適化についてお話します。今日は、検索エンジン リンクの原則につい...

4月の世界の検索エンジン市場シェア動向:Googleが首位、Baiduが2位

IDC Review Network(idcps.com)は5月15日に次のように報じた。市場調査会...

Vultr VPS の使い方: 割引コード、再チャージして無料マネーを獲得、登録のヒント、使用方法のチュートリアル、Windows でプレイ

Vultr は、米国で最も人気のある VPS ベンダーの 1 つです。世界中に 15 のデータ セン...

ブラジルワールドカップに関連したポルトガルのウェブサイト構築における見落とされがちな問題

次回のワールドカップは2年後にブラジルで開催されます。ワールドカップはサッカーの祭典であると同時に、...