最近の調査によると、企業の 50% が業務をクラウドからデータ センターに戻したいと考えていることがわかりました。このスイング効果には多くの理由がありますが、データの一貫性の欠如が主な理由の 1 つです。 CAP 定理は、分散ストレージ システムが一貫性、可用性、パーティション耐性の 3 つの要素のうち 2 つしか提供できないことを説明しています。クラウド コンピューティング移行アプリケーションを検討する場合、CAP 理論を適用して、クラウド コンピューティング ストレージ アーキテクチャが各アプリケーションのニーズに適しているかどうかを判断する必要があります。
CAP定理を理解する CAP 定理は、AWS、Google Cloud Platform、Microsoft Azure などのクラウド コンピューティング サービス プロバイダーが使用する主流の設計である分散データ ストレージに重点を置いています。分散データ ストレージは、ノードと呼ばれる一連のサーバーから構築されます。各ノードには内部ストレージがあり、ノードがクラスター化されるとグローバル ストレージ プールになります。データがストレージに書き込まれると、各オブジェクトまたはオブジェクトのサブセグメントの消去コーディングを複製することによって、ノード間に分散されます。 CAP 定理によれば、分散データ ストレージは、一貫性、可用性、パーティション耐性の 3 つの要素のうち 2 つしか提供できません。 パーティション耐性とは、ネットワーク障害が発生し、ノード間で任意の数のメッセージが失われたり遅延したりした場合でも、分散ストレージが引き続きデータを提供できる能力を指します。あらゆるグローバル クラウドベースのストレージ サービスではネットワーク障害は避けられないため、すべてのシステムはパーティション耐性を備えている必要があります。したがって、クラウド ストレージ ソリューションを検討する場合、企業の IT 部門は一貫性と可用性のどちらかを選択する必要があります。 一貫性とは、アプリケーションまたは対応するプロセスを続行する前に、システムが各書き込み操作を確認する必要があることを意味します。確認の必要性はデータ保護にも適用されます。たとえば、一貫性のあるデータ ストアでは、全体の書き込みを確認する前に、オブジェクトを別のノードに複製し、完了を確認する必要があります。一貫性のあるモデルを提供するには、特に分散アーキテクチャではコストがかかります。これは、特定の時点ですべてのノードが同じデータを持つ必要があるためです。分散ストレージでアプリケーションのパフォーマンスを損なうことなく一貫性を実現するには、高速なノード内ネットワーク、ノード間の距離、および高性能なストレージ メディアが必要になります。ノード自体も高価になり、データの処理速度が速くなります。 コストは高いものの、一貫性に重点を置くことは絶対に必要です。たとえば、金融機関をサポートするストレージ インフラストラクチャでは、すべてのノードが常に同期していることを保証する必要があります。 100 万ドルの取引が行われ、これらのノードが更新されなかった場合、深刻な問題が発生します。より一般的には、ストレージ インフラストラクチャ全体ですべてのデータが常に同期されていない場合、一貫性を期待するアプリケーションは簡単に壊れる可能性があります。 ユーザビリティに関する懸念 一貫性のある分散データ ストアの構築にはコストがかかることから、ほとんどのクラウド コンピューティング プロバイダーは、可用性モデルまたは最終的に一貫性のあるモデルのいずれかに重点を置いています。可用性に重点を置くということは、最初の書き込みが発生したときに、バックグラウンドでデータの複製または消去コーディングを実行してデータ保護要件が満たされるまで、遅延確認応答が遅延されることを意味します。他のノードの位置に応じて、コンセンサス時間は数秒から数分の範囲になります。また、トランザクションの多い環境では、一貫した状態に到達できない可能性があります。 可用性に重点を置くことには多くの利点がありますが、その主な利点はコストの削減です。ノード間のネットワーク、ノード内のストレージ メディア、およびノード自体の処理能力は、一貫性が懸念される分散ストレージ システムの機能の範囲内で実行する必要はありません。 さらに、可用性の懸念はデータ配布に最適です。地域的な災害から保護する場合でも、データが可能な限りユーザーに地理的に近い場所にあることを保証する場合でも、可用性に関する懸念により、元のユーザーまたはアプリケーションに必ずしもパフォーマンスを提供しなくても配信が可能になります。 NAS とオブジェクト ストレージ (クラウド ストレージ) に CAP を適用する クラウドへの移行が検討されているオンプレミス アプリケーションでは、多くの場合、ネットワーク接続ストレージ (NAS) が使用されます。これらのネットワーク接続ストレージ (NAS) システムは、従来から一貫性の特性を備えていますが、ほとんどのデータは、一貫性は劣るものの可用性が高い設計でも問題なく動作します。一貫性を維持するために、NAS システムは通常、スケールアウト機能 (つまり、すべてのデータ アクセスが単一のノードを経由) を提供するか、密に結合されたクラスターと比較的少数のノード数による非常に限定されたスケーリングを提供します。これらのネットワーク接続ストレージ (NAS) システムは、共有ストレージへの低遅延アクセスを提供し、厳密な一貫性を維持できます。これらは、アプリケーションの確認の前に読み取り書き込み前の検証、または従来の POSIX ファイル システム セマンティクスを利用します。 ネットワーク接続ストレージ (NAS) システムには、他のストレージ システムと同じ欠点 (高コスト、規模の制限、可用性の制限) があります。ほとんどのネットワーク接続ストレージ (NAS) システムは災害復旧のためにレプリケーションを提供していますが、このレプリケーションは非同期で実行されます (最終的には一貫性が保たれます)。このプロセスはネットワーク パフォーマンスに敏感であり、ほとんどの場合、同一のシステムであり、セカンダリ システムは最終的にプライマリ システムのミラー イメージになります。 NAS 上のすべてのデータに一貫したアーキテクチャの機能が必要なわけではありません。実際、NAS 上のほとんどのデータは可用性に重点を置いたアーキテクチャ上にあります。一貫性が求められるネットワーク接続ストレージ (NAS) 上のデータ セットの場合でも、可用性モデルに適したデータのサブセットが存在することがよくあります。 利用可能なストレージ システムの中で最も一般的なタイプはオブジェクト ストレージです。これは、すべてのクラウド コンピューティング プロバイダーが手頃な価格のストレージ層に使用している設計です。オブジェクト ストレージは低コストで、数千のノードまで拡張可能です。また、データを広範囲の地理的領域に分散させることも容易であり、アクセスや回復も容易になります。 CAP を使用してクラウド対応アプリケーションを識別する CAP を理解し、クラウド プロバイダーの最もコスト効率の高いストレージは可用性中心であるという認識があれば、組織はクラウドでの使用に最適なアプリケーションをより簡単に判断できるようになります。 最初のステップは、一貫性が問題にならないデータセットを特定することです。代表的な例は、非アクティブまたは休止状態の非構造化データセットです。通常使用されるネットワーク接続ストレージ (NAS) 容量の 80% 以上は非アクティブ データです。これらのデータセット全体を、可用性に重点を置いた、より安価な分散ストレージに移動する必要があります。このデータを可用性重視のストレージに移動すると、このデータを保持するコストが削減されるだけでなく、このタイプのストレージ アーキテクチャは長期保存に適しています。企業にとっての課題は、非アクティブなデータを特定してそのデータをクラウドに移行するだけでなく、データが再度必要になったときにユーザーが引き続き利用できるようにすることです。 次のステップは、アクティブなデータセット内に休止状態のサブセットがあるかどうかを判断することです。問題は、これらのデータのサブセットを識別して移動することがはるかに困難であることです。最後のステップは、非常にアクティブであり、ストレージ アーキテクチャ全体で一貫して表現する必要があるデータを識別することです。 一貫性が重要なアプリケーションをクラウドに移行する 3 種類のデータは手動で識別して移動できますが、このプロセスには時間がかかり、IT 部門による継続的な監視が必要です。手動識別プロセス (およびそれを自動化すると主張する一部のプロジェクト) では、一貫性が重要なアクティブ データ用に個別のストレージ コンテナーを管理する必要があることを意味します。 もう 1 つのアプローチは、アクセス パターンに基づいてデータを自動的に分類し、最も適切なストレージ タイプに配置するクラウド対応ファイル システムを活用することです。このソリューションは、一貫性のある機密データに対応するように設計された、より小さなストレージ フットプリントを備えたオンプレミスの高性能ネットワーク接続ストレージ (NAS) の代替品です。 IT スタッフの介入を必要とせず、IT の監視なしにオンプレミスとクラウド ストレージ間でデータを自動的に移動する必要があります。同時に、ローカル ストレージとクラウド ストレージをグローバル ファイル システムでオーバーレイして、ユーザーが常に同じパスとプロトコルを通じてデータにアクセスできるようにし、クラウドへのシームレスなアクセスを実現する必要があります。 クラウドコンピューティングの一貫性 クラウド対応のファイル システムもクラウドで実行される必要があるため、組織はアプリケーションを変更することなく、シームレスにクラウドに移動できます。アプリケーションはクラウド プロバイダーの一貫性のあるストレージ バージョンで実行できますが、ファイル システムでは、一貫性を必要としないプロバイダーの低コストのオブジェクト ストレージ層にデータが自動的に移動されるため、その投資を最小限に抑えることができます。 ローカル ストレージとクラウド ストレージをクラウド ファイル システム データと組み合わせると、アプリケーションをローカル展開とクラウド間で自由に移動できるようになります。企業のニーズに応じて、クラウド ストレージはアーカイブとして使用したり、アプリケーションを永続的に実行する場所として使用したりできます。 結論は ほとんどのクラウド コンピューティング イニシアチブの反動効果は、データ セットのパフォーマンス要件と組織のコスト削減目標の不一致の結果であることが多いです。両者のギャップにより、組織は多くの場合、アプリケーションをオンプレミスに移行することになりますが、それが裏目に出たり、一貫性のあるクラウド ストレージに多額の投資をしなければならなくなったりします。クラウド ファイル システムはこのギャップを埋め、組織がコスト効率よく任意のアプリケーションをどこにでも配置できるようにし、高パフォーマンスの一貫性とコスト効率の良い可用性の適切なバランスを見つけられるようにします。 |
>>: KubernetesとDockerの基本概念と共通コマンドの比較
Dell、新しいPowerEdgeサーバーおよびデータ管理ソリューションを発表現在、仮想化は新興技術...
Dedipath はサイバーマンデー プロモーションを開始しました。米国の複数のデータセンターにある...
[51CTO.com からのオリジナル記事] 2018 年は例外的な年であり、IT 業界は多くの変化...
現在(2018年4月)、locvpsは香港の自社葵湾データセンターのVPSのプロモーションを実施して...
[[404840]] React でバーチャルリアリティ (VR) を体験してみませんか?これは本当...
最近、淘宝網で売れているのは『童謡三百首』だけではない。国華、合中、紅康の3つの生命保険会社の金融商...
百度ウェイトという用語はかなり前から提案されており、主要なSEOツールもこの機能を導入しています。現...
クラウド コンピューティングのトレンドが到来していることは誰もが知っています。過ぎ去ろうとしている ...
クラウド コンピューティングは、テクノロジーの世界に変革をもたらし、急速に成長し続けています。 20...
今日は、Feimaipin Studio の Web サイトを最適化する最近の精神的な旅についてお話...
みなさんこんにちは。私は徐子宇です。現在、多くの大規模ウェブサイトのSEOは十分に行われていませんが...
1年ほど前から噂されていたテンセントのプライベートバンクの準備がついに完了した。深セン金融事務所によ...
interserver.net は 16 年の歴史を持つホスティング会社です。現在、ブラック フライ...
クラウド コンピューティングがビジネスの運営方法を根本的に変えたことは周知の事実です。 CRM (顧...
12月19日から20日にかけて、テンセント主催の2020 TECHO PARK開発者会議が北京ファッ...