分散ストレージシステムの理論的指針をCAPからPACELCに移行する時期が来ている

分散ストレージシステムの理論的指針をCAPからPACELCに移行する時期が来ている

CAP 理論は、分散ストレージ システムの現在の設計に対する理論的ガイドラインであり、PACELC 理論は CAP 理論の拡張です。分散ストレージ システムの設計の理論的基礎を CAP 理論から PACELC 理論に拡張する時期が来ています。

WikiにおけるPACELCの定義は

「分散コンピュータ システムでネットワーク分割 (P) が発生した場合、CAP 定理に従って可用性 (A) と一貫性 (C) のどちらかを選択する必要があるが、それ以外の場合 (E) は、分割が行われずにシステムが正常に動作している場合でも、レイテンシ (L) と一貫性 (C) のどちらかを選択する必要がある」と述べています。

簡単に言えば、これは次のことを意味します。「パーティション (P) がある場合、システムは可用性と一貫性 (A と C) のバランスを取る必要があります。そうでない場合 (E)、システムがパーティションなしで実行されている場合、システムはレイテンシ (L) と一貫性 (C) のバランスを取る必要があります。」

[[232158]]

CAP 理論では、次の 3 つを同時に満たすことはできないとされています。

1) 一貫性: すべてのノードが同時にまったく同じデータを持ちます。

2) 可用性: ノード障害はシステムの IO に影響を与えません。

3) パーティション耐性: システムはネットワーク パーティション (ネットワーク接続障害) をサポートし、パーティション間のメッセージが失われた場合でも正常に動作します。

ビジネス シナリオに応じて、さまざまな分散ストレージ システムが、独自のビジネス ニーズに基づいて 3 つの CAP 要素間でトレードオフを行います。 CAP 理論の重要性は、3 つの要素のうち 2 つを選択するのではなく、分散ストレージ システムを設計するときに考慮する必要がある要素にあります。また、CAP 理論ではレイテンシについては触れられていませんが、レイテンシは非常に重要な可用性指標です。

CAP はシステムのレイテンシ要因を考慮していないため、次の図に示すように、レイテンシを追加した新しいモデル PACELC が定義されます。

現在の分散ストレージ システム設計ガイダンス理論では、次の理由により、CAP 理論ではなく PACELC 理論を使用する必要があります。

1) PACELC は、実際の運用における分散ストレージ作業シナリオをより適切に満たすことができ、より優れたエンジニアリング実装戦略です。

2) パーティション (P) が存在する場合、可用性と一貫性 (A と C) の間でトレードオフを行う必要があります。実際、分散システムではほとんどの場合パーティション (P) は存在しないため、レイテンシ (L) と一貫性 (C) の間でトレードオフを行う必要があります。

3) 可用性は、パーティション (P) がない場合にはレイテンシと関連付けられ、パーティション (P) がある場合には信頼性と関連付けられます。

4) PACELC はレイテンシと一貫性のバランスを実現できます。

5) CAP 定理は、一貫性とレイテンシの間のトレードオフを無視します。

PACELC は CAP の上に構築されており、どちらも一貫性、可用性、パーティション耐性の間の制限とトレードオフを記述しています。 PACELC はさらに、パーティションがない場合でも、レイテンシと一貫性の間にトレードオフがあることを説明しており、分散システムの一貫性モデルのより完全な理論的根拠を提供しています。

システムの高可用性を確保するには、データを複製する必要があります。ただし、データのレプリケーションでは、一貫性とレイテンシの間でトレードオフが必要になります。

以下に示す PACELC アプリケーション シナリオの例を見てみましょう。

1. 強力な一貫性レプリケーション シナリオでは、クライアントに OK を返す前に、3 つのレプリカすべてをディスクに保存する必要があります。マスターはデータをスレーブにコピーし、レイテンシ制限は 20 ミリ秒です。場合によっては、スレーブ 2 のハードディスクまたはネットワークに障害が発生し、マスターがスレーブにデータをコピーする際の遅延が 20 ミリ秒を超えることがあります。このとき、スレーブ 2 が結果を返すまで待ってからクライアントに通知すると、パフォーマンスとレイテンシのジッタが発生し、このジッタは頻繁に発生するロングテール効果です。

2. PACELC 理論によれば、一貫性とレイテンシの間でトレードオフを行うことができます。たとえば、スレーブ 2 ノードのレイテンシが 20 ミリ秒を超える場合、スレーブ 2 が戻るのを待たずに、マスターとスレーブ 1 が結果をクライアントに返すことができます。スレーブ 2 が 5 回以上タイムアウトした場合、このノードに障害がある可能性があるとみなされ、後続の処理のために障害ラベルが追加されます。

<<:  分散ストレージシステムにおける Raft と Paxos のアプリケーションの違い

>>:  クラウド コンピューティングのコスト評価の問題と解決策

推薦する

張文毅氏がAWSに就任し、AWSの5つの大きな利点を強調した。

2019年7月31日、AWSグローバルテクノロジーサミット(北京)が国家会議センターで開催されました...

新しいウェブサイトで詳細な外部最適化分析を実行する方法

ウェブサイトを包括的かつ深く分析し、計画を立てることは、すべてのSEO担当者が備えていなければならな...

2022年のクラウド大手の「エコ革命」第一歩:リベートの削減、転売の抑制、発言権の競争

「アリババ、テンセント、ファーウェイクラウドのエコ政策は今年、いずれも大きな変化を遂げるだろう。」最...

Baidu トラフィックの式 = P*Baidu の重み?

SEO を行う人なら誰でも、Baidu を通じて大量のトラフィックを呼び込みたいと願うはずです。トラ...

VPS Alipay 支払い問題を修正

修正された VPS を好む多くの人々は、修正された VPS がなぜ Alipay をサポートしないの...

ウェブサイトは降格されました。ウェブサイトの日記を保存

まず、スナップショットが 26 日にロールバックされました。他のすべてが正常だったので、あまり気にし...

Yixin PRの最初のユーザーがモデルを再交渉するのは時期尚早です

易心はここ2日間で本当に人気を博しています。伝統的な権威あるメディアは易心に注目し、オンラインメディ...

2021年、中国の基礎クラウドサービス産業の市場規模は2,256億元に達した

今年、国内クラウドサービス市場規模は2,256億元と過去最高を記録した。感染症の流行によりオフライン...

regolithmedia 月額 5 ドル 256 メモリ/KVM/G ポート/ダラス

REGOLITH MEDIA は英国と米国の両方に登録された会社です。現在は KVM ベースの VP...

ウェブサイトの関連性は奇妙な花のようなものです。関連性をうまく保つことは、一枚板の橋を渡るようなもの (パート 1)

エッセイを書いたことがある友人なら、エッセイがタイトルと一致していなければ、質の高いエッセイとは言え...

満足のいくユーザー体験を実現するには、実践からマーケティング経験を積むことが必要

私は以前、ウェブサイトの最適化業務に従事していました。マーケティングの仕事を始めた当初は、マーケティ...

SEO 外部リンク構築でよくある 8 つの一方的な実践

SEO 担当者は、ウェブサイトに最適化されたキーワードがキーワード検索ランキングで上位に表示されるよ...

10日間でホームページにキーワードを掲載する方法

寒い冬が到来し、今年も終わりに近づいている。SEO 担当者として他に何ができるだろうか? 諦めてラン...

電子商取引ウェブサイトの各ページのキーワードを合理的にレイアウトする方法について簡単に説明します。

最近、私はアイウェア業界の小規模な電子商取引ウェブサイトを最適化していました。最適化の過程で、多くの...