今日、ビッグデータと分析は、より成熟した展開段階に入りつつあります。これは、これらのテクノロジーを導入し、自社のビッグデータ アーキテクチャの定義に苦労している中小企業にとって素晴らしいニュースです。 ビッグデータと分析の全体的なアーキテクチャをどのように定義するかについての不確実性は、中小企業がビッグデータと分析の導入で遅れをとる理由の 1 つです。多くの場合、ハイブリッド コンピューティング、データ マート、マスター データベース、セキュリティとガバナンスの制御などのトレンドがどのように展開するかを待ち、見守っています。
最後に、誰もが従うことができる新しいベスト プラクティス データ アーキテクチャが提供されます。このアーキテクチャでは、クラウド コンピューティング サービスがビッグ データの保存と処理に使用され、オンプレミス データ センターが企業内のローカル データ マートの開発に使用されます。 このビッグデータと分析アーキテクチャの背後にある理由を詳しく見てみましょう。 クラウドコンピューティングの役割 企業が小規模な場合、ビッグデータを並列処理するためにデータセンターにサーバーのクラスターを購入するのは費用がかかり、並列処理環境を最適化、アップグレード、維持する方法を知っている非常に高額な専門家を雇用またはトレーニングするのは言うまでもありません。オンサイトでデータを処理および保存することを選択する企業は、ハードウェア、ソフトウェア、およびストレージ機器にも多額の投資を行います。ビッグデータ用のハードウェアとソフトウェアの購入、そしてコンピューティング処理とストレージをクラウドにアウトソーシングするには、多額の費用がかかります。 オンプレミスコンピューティング データ ガバナンス (セキュリティやコンプライアンスの問題など) は、管理がより困難になるため、企業がすべてのミッション クリティカルなデータをクラウドに委託することに消極的な理由の 1 つです。そのため、クラウドでデータが処理されると、多くの企業はデータを自社の内部データセンターに移行することを選択します。 多くの企業がデータ センターの使用を選択する理由は他にもあります。それは、そのデータを作成する独自のアプリケーションとアルゴリズムを監視するためです。多くのクラウド コンピューティング プロバイダーは、顧客がクラウドで開発したアプリケーションは他の顧客と共有できるというポリシーを採用しています。 アプリケーションをオンプレミスに維持し、小規模なデータ マートを分離できるローカル マスター データ セットを開発することで、企業はデータとアプリケーションを直接制御できるようになります。 アナリティクス マネージャーには何が必要ですか? (1)企業は、クラウドコンピューティングプロバイダーが自社のデータを処理し保護することを理解し、同意する必要がある。 たとえば、企業がデータを匿名化する必要がある場合、クラウド プロバイダーが匿名化を実行するため、実装するプロセスを文書化し、クラウド プロバイダーと合意する必要があります。企業が自社のデータをクリーンアップしたい場合は、クリーンアップのプロセスもクラウド プロバイダーに詳細に文書で説明する必要があります。たとえば、企業は米国のすべての州の略語を単に統一したいだけでしょうか (例: 「Tenn」と「Tennessee」を「TN」に統一したいのでしょうか)、それとも、データを編集して統一し、処理しやすくしたいのでしょうか。最後に、企業のビジネスがクラウド サービス プロバイダーの専用テナントで実行されているか、マルチテナント環境で実行されているかに関係なく、クラウド プロバイダーは、企業のデータが他の顧客と共有されないことを保証できる必要があります。 (2)企業のローカルビッグデータおよび分析アーキテクチャは、ビッグデータのニーズを満たす新しいポリシーと手順を文書化する必要がある。 企業全体の多くの IT 部門では、このタスクをまったく実行していません。彼らはビッグデータ プロジェクトの実装を開始したばかりで、既存のアプリケーション開発ポリシーと手順がトランザクション アプリケーション ドメインから来ていることを忘れています。企業はこのような間違いを犯してはいけません。代わりに、組織は、ビッグデータとやり取りする可能性が高い領域 (ストレージ、データベース管理、アプリケーションなど) のポリシーと手順を改訂する必要があります。 (3)オンプレミスおよびクラウドに展開する場合、災害復旧計画はビッグデータに合わせて更新およびテストする必要がある。 クラウドベースの DR テストの場合、組織は DR を文書化して実行するための規定を契約に含める必要があります。災害復旧 (DR) 計画 (トランザクション データとシステムに重点を置く) も更新し、ビッグ データと分析の復旧およびテスト スクリプトを含める必要があります。 |
<<: Hadoop分散クラスタを構築し、ビッグデータに取り組む方法を教えます
>>: オートナビは産学研を連携させる未来交通・都市コンピューティング共同研究所を設立し、「100万計画」を開始した。
8月17日午前、豆瓣(douban.com)が本日公開した一部の運営データによると、同社の月間独立ユ...
シェフとソは、全く関係のない職業のように思えます。実際、同じではありません。しかし、私はいつも空想に...
Greenyhosting は常に高品質の xen vps として宣伝しており、現在公式に 25% ...
ウェブマスターはかつて、buyvm はウェブサイト構築 + ストレージのコスト効率の高いソリューショ...
インターネット マーケティング ブランドを確立するための運用コンセプトと実行戦略を見てみましょう。運...
今日、企業が「顧客だけが一番よく知っている」という教訓を学ぶには長い時間がかかります。システム管理者...
Linode のバージョンアップがどんどん面白くなってきて、見てたら買いたくなりました! 512M ...
数多くの新興プラットフォームが、最も魅力的な IT 機能を可能な限り低コストで提供しているため、企業...
民間病院の活路は「広告」にほぼ絞られており、一般的な広告形式はテレビ広告、看板広告、新聞広告、病院自...
Myhosting は 1997 年に設立されたホスティング会社で、カナダの SoftCom Inc...
zji.net は香港データセンターの特別なマルチライン物理サーバーにインストールされ、Alibab...
【編集者注】この記事はWeibo UDCから転載したもので、著者は@沈勇有梦想です。筆者は2004年...
私は最近、昨年 8 月に構築した画像サイトを引き継ぎました。問題はトラフィックもランキングもなかった...
序文: ペンを紙に走らせるたびに、私は文学的なゴミを生み出すのではないかという恐怖に震えています。良...
1. 概要REmote DIctionary Server (Redis) は、Salvatore ...