分散ストレージシステムの理論的指針をCAPからPACELCに移行する時期が来ている

分散ストレージシステムの理論的指針をCAPからPACELCに移行する時期が来ている

CAP 理論は、分散ストレージ システムの現在の設計に対する理論的ガイドラインであり、PACELC 理論は CAP 理論の拡張です。分散ストレージ システムの設計の理論的基礎を CAP 理論から PACELC 理論に拡張する時期が来ています。

WikiにおけるPACELCの定義は

「分散コンピュータ システムでネットワーク分割 (P) が発生した場合、CAP 定理に従って可用性 (A) と一貫性 (C) のどちらかを選択する必要があるが、それ以外の場合 (E) は、分割が行われずにシステムが正常に動作している場合でも、レイテンシ (L) と一貫性 (C) のどちらかを選択する必要がある」と述べています。

簡単に言えば、これは次のことを意味します。「パーティション (P) がある場合、システムは可用性と一貫性 (A と C) のバランスを取る必要があります。そうでない場合 (E)、システムがパーティションなしで実行されている場合、システムはレイテンシ (L) と一貫性 (C) のバランスを取る必要があります。」

[[232158]]

CAP 理論では、次の 3 つを同時に満たすことはできないとされています。

1) 一貫性: すべてのノードが同時にまったく同じデータを持ちます。

2) 可用性: ノード障害はシステムの IO に影響を与えません。

3) パーティション耐性: システムはネットワーク パーティション (ネットワーク接続障害) をサポートし、パーティション間のメッセージが失われた場合でも正常に動作します。

ビジネス シナリオに応じて、さまざまな分散ストレージ システムが、独自のビジネス ニーズに基づいて 3 つの CAP 要素間でトレードオフを行います。 CAP 理論の重要性は、3 つの要素のうち 2 つを選択するのではなく、分散ストレージ システムを設計するときに考慮する必要がある要素にあります。また、CAP 理論ではレイテンシについては触れられていませんが、レイテンシは非常に重要な可用性指標です。

CAP はシステムのレイテンシ要因を考慮していないため、次の図に示すように、レイテンシを追加した新しいモデル PACELC が定義されます。

現在の分散ストレージ システム設計ガイダンス理論では、次の理由により、CAP 理論ではなく PACELC 理論を使用する必要があります。

1) PACELC は、実際の運用における分散ストレージ作業シナリオをより適切に満たすことができ、より優れたエンジニアリング実装戦略です。

2) パーティション (P) が存在する場合、可用性と一貫性 (A と C) の間でトレードオフを行う必要があります。実際、分散システムではほとんどの場合パーティション (P) は存在しないため、レイテンシ (L) と一貫性 (C) の間でトレードオフを行う必要があります。

3) 可用性は、パーティション (P) がない場合にはレイテンシと関連付けられ、パーティション (P) がある場合には信頼性と関連付けられます。

4) PACELC はレイテンシと一貫性のバランスを実現できます。

5) CAP 定理は、一貫性とレイテンシの間のトレードオフを無視します。

PACELC は CAP の上に構築されており、どちらも一貫性、可用性、パーティション耐性の間の制限とトレードオフを記述しています。 PACELC はさらに、パーティションがない場合でも、レイテンシと一貫性の間にトレードオフがあることを説明しており、分散システムの一貫性モデルのより完全な理論的根拠を提供しています。

システムの高可用性を確保するには、データを複製する必要があります。ただし、データのレプリケーションでは、一貫性とレイテンシの間でトレードオフが必要になります。

以下に示す PACELC アプリケーション シナリオの例を見てみましょう。

1. 強力な一貫性レプリケーション シナリオでは、クライアントに OK を返す前に、3 つのレプリカすべてをディスクに保存する必要があります。マスターはデータをスレーブにコピーし、レイテンシ制限は 20 ミリ秒です。場合によっては、スレーブ 2 のハードディスクまたはネットワークに障害が発生し、マスターがスレーブにデータをコピーする際の遅延が 20 ミリ秒を超えることがあります。このとき、スレーブ 2 が結果を返すまで待ってからクライアントに通知すると、パフォーマンスとレイテンシのジッタが発生し、このジッタは頻繁に発生するロングテール効果です。

2. PACELC 理論によれば、一貫性とレイテンシの間でトレードオフを行うことができます。たとえば、スレーブ 2 ノードのレイテンシが 20 ミリ秒を超える場合、スレーブ 2 が戻るのを待たずに、マスターとスレーブ 1 が結果をクライアントに返すことができます。スレーブ 2 が 5 回以上タイムアウトした場合、このノードに障害がある可能性があるとみなされ、後続の処理のために障害ラベルが追加されます。

<<:  分散ストレージシステムにおける Raft と Paxos のアプリケーションの違い

>>:  クラウド コンピューティングのコスト評価の問題と解決策

推薦する

技術力を活かして異なるJD Cloudセキュリティを構築

[51CTO.comより引用] 2018年に入り、クラウドコンピューティング分野でセキュリティインシ...

Green Radishアルゴリズムの第2世代アップグレード後の外部リンク構築への対処方法

緑大根アルゴリズムは主に外部リンクの最適化を目的としており、ザクロアルゴリズムはウェブサイトのオリジ...

SITEウェブサイトのホームページが1位ではない理由の分析

Baidu は最近非常に熱心に取り組んでおり、頻繁に更新しています。そのため、ウェブマスターとして、...

georgedatacenter: 年間 25 ドル、ロサンゼルス VPS、1G メモリ/25g NVMe/1T 帯域幅、VMware Hypervisor

georgedatacenter は 2006 年に設立されました。このサイトで割引プロモーションが...

中国検索は検索戦争を混乱させ、その統合能力はまだテストされていない

検索エンジンはインターネットへの最初の入り口であり、5億人を超えるユーザーベースを擁し、常に「戦場」...

動画の外部リンクを効果的に公開する方法

ウェブサイトを最適化する場合、ソフト記事の外部リンク、ビデオの外部リンク、ブログの外部リンク、フォー...

Banwagonhost の香港 VPS 割引コード、香港 VPS、大容量帯域幅、格安香港 VPS

待望のBandwagonhost香港VPSがついにオンラインになりました。香港では1Gbpsの帯域幅...

Kua Kua グループのレビュー: 人気商品はわずか 24 時間ですぐに時代遅れになります。

3月、春が訪れて花が咲くと、WeChatやQQのグループには雨後の筍のように賛美グループが突然現れま...

Teamsun: 業界の変革を促進する優れたクラウド基盤の構築

[51CTO.com からのオリジナル記事] クラウド コンピューティング テクノロジーが成熟するに...

Redisson 分散ロック ソースコード 1: 再入可能ロック

[[407548]]序文誰もが分散サービスを使用しているため、分散サービスでの同時データ更新の問題は...

過熱するWeChatの裏に隠された運用価値とは?

WeChatは最近再び話題になっており、議論の焦点は主にWeChatの製品特性に集中しています。 W...

onrahost-$4/Xen-HVM/512m/100g ハードディスク/1.5T トラフィック/ロサンゼルス

onrahost (フロリダ州に登録、登録番号 G12000004524) には、Xen-HVM 仮...

SEO は戦争のようなものです。私たちの武器は何でしょうか?

SEO は戦争のようなものです。私たちの武器は何でしょうか? 人気のキーワードに直面したとき、権威の...

ウェブサイトの統計をバロメーターとして使用して、ウェブサイトの改善の必要性を確認します。

ユーザーのニーズは一定ではないため、Web サイトは常に最新のユーザー ニーズに合わせて調整する必要...

サービス メッシュは本当にクラウド ネイティブ アプリケーションに最適ですか?

マイクロサービス アーキテクチャを実装する企業が増えるにつれて、コミュニティにおけるサービス メッシ...