フレームワーク: 分散理論 CAP、BASE

フレームワーク: 分散理論 CAP、BASE

[[403371]]

この記事はWeChatの公開アカウント「Sneak Forward」から転載したもので、著者はcscwです。この記事を転載する場合は、Qianxingqianxing の公開アカウントにご連絡ください。

序文

事業が拡大するにつれて、どんどん機能が追加されていきます。すべての機能を同じサービス下に置くと、コードが混在し、メンテナンスが困難になります。小さなバグが原因でサービス全体が利用できなくなることもよくあります。そこで、業務機能に応じて複数の異なるサービスに分割します(マイクロサービス化)。複数のサービスから構成されるシステムは、「分散システム」という別名を持っています。システム内でサービスステータスをどのように管理するのでしょうか?関連する理論は何ですか?

  • 分散型とクラスター型
  • データベーストランザクション
  • 分散トランザクション
  • 分散データの一貫性
  • CAP理論
  • ベース理論

分散型とクラスター型

分散とは、ネットワークを介して接続され、情報を交換することで連携する複数のサービスまたはコンポーネントによって形成されるシステムを指します。

クラスターは、同じサービス コンポーネントの複数のインスタンスの集合です。

これら 2 つの概念は完全に矛盾するものではなく、分散システムはクラスターになることもできます。 Zookeeper クラスターも分散システムであり、そのサービスは相互に通信して連携します。

クラスターは分散システムではありません。たとえば、複数の負荷分散された HTTP サーバーは相互に通信しません。負荷分散されていない場合は、分散システムとは言えません。

データベーストランザクション

  • トランザクションはデータ操作に基づいており、通常はトランザクション データがデータベースに保存されるようにする必要があります。したがって、トランザクションを導入するときは、データベース トランザクションの ACID 特性を導入する必要があります。
  • 原子性: トランザクション全体のすべての操作は完了するか、まったく完了しないかのいずれかであり、途中のリンクで操作が停止することは不可能です。
  • 一貫性: トランザクションの開始前と終了前、および終了後にデータベース データの一貫性制約に違反しません。
  • 分離: 分離により、複数のトランザクションが同時に実行されるときに、相互実行によって発生するデータの不整合を防ぐことができます。
  • 耐久性: トランザクションが完了すると、データへの変更は永続的になり、システムに障害が発生しても失われません。

分散トランザクション

分散システムは一般に複数の独立したサブシステムで構成され、ネットワーク通信を通じて相互に連携してさまざまな機能を実行します。このコラボレーション プロセスでは、各システムのデータの一貫性を確保する必要があります。このシステム間トランザクションを分散トランザクションと呼びます。

上記のシナリオには複数のケースがあります。在庫サービスと注文サービスの両方が成功します。あるいは、在庫サービスと注文サービスは部分的に成功しているが、従来の単一マシントランザクション理論はもはや適用されない。

分散トランザクションの難しさ

原子性: トランザクション操作は異なるノードにまたがります。複数のノードのうちの 1 つでの操作が失敗した場合、複数のノードでの操作が何も実行されないか、すべて実行されるようにする必要があります。

一貫性: ネットワーク伝送障害またはノード障害が発生すると、ノード間のデータ複製チャネルが中断され、トランザクション操作中にデータの一貫性を確保する必要があります。

分離: 分散トランザクション制御では、非同期送信が発生し、「部分的に送信された」トランザクションが表示される場合があります。

分散データの一貫性

ACID は分散トランザクションには適していません。分散トランザクションの難しさには、最終的にデータの不整合につながる問題が伴います。したがって、分散システムでは、システムの一貫性を確保することに重点が置かれます。

CAP理論

  • 上で述べた分散トランザクションの難しさには、最終的にデータの不整合につながる問題が伴います。以下では、分散システムの一貫性の問題を理論的に分析し、これらの理論に基づいて分散ソリューションを紹介します(可用性と一貫性の対立:CAP理論)
  • 一貫性: すべてのノードが最新かつ同一のデータコピーにアクセスする
  • 可用性: 障害のないノードは、妥当な時間内に妥当な応答を返します (エラーやタイムアウトではありません)
  • パーティション耐性: 分散システムがパーティション化された場合でも、外部にサービスを提供し続けることができます。

ネットワークパーティションが発生した場合、サービスの提供を継続するには、強力な一貫性と可用性のどちらかを選択するしかありません。つまり、ネットワーク分割後は P が前提条件となり、P が決定された後にのみ C と A を選択できます。つまり、パーティション耐性を実現する必要があります。

なぜ同時に CA を保証できないのでしょうか?

システムが「パーティション分割」されている場合、システム内のノードが書き込み操作を実行しています。一貫性 C を確保するには、他のノードの読み取りおよび書き込み操作を禁止する必要がありますが、これは A と競合します。 A を保証するために他のノードの読み取りおよび書き込み操作が正常である場合、データの一貫性は保証できず、C と矛盾します。

CAP実践事例

ZooKeeper は CP を保証します。 ZooKeeper への読み取り要求はいつでも一貫した結果を得ることができますが、ZooKeeper は各要求の可用性を保証するものではありません。たとえば、リーダー選出プロセス中や、マシンの半分以上が使用できない場合は、サービスを利用できません。

EurekaはAPを保証します。 Eureka は A (可用性) を優先するように設計されています。 Eureka にはリーダー ノードはありません。すべてのノードは同じであり、平等です。したがって、Eureka は、選出プロセス中にサービスが利用できなくなったり、マシンの半分以上が利用できなくなったりする ZooKeeper のような状態になりません。 Eureka は、ほとんどのノードに障害が発生した場合でも、1 つのノードが利用可能である限り、サービスの通常の提供に影響が及ばないことを保証します。ただし、このノード上のデータは最新ではない可能性があります。

ベース理論

BASE は、Basically Available (基本的に利用可能)、Soft-state (ソフトステート)、Eventually Consistent (最終的に一貫性がある) の略です。 BASE 理論は、CAP における一貫性 (C) と可用性 (A) のトレードオフの結果です。

結果的一貫性は、弱い一貫性の特殊なケースです。システムは、一定期間内にデータの一貫性状態が達成されることを保証します。

基本的な使いやすさ

基本的な可用性とは、分散システムで予期しない障害が発生した場合に、ある程度の可用性が失われることが許容されることを意味します。では、可用性をいくらか失うことを許可するということはどういう意味でしょうか?

応答時間の損失: 通常、ユーザー要求を処理して結果を返すのに0.5秒かかりますが、システム障害により、ユーザー要求の処理時間は3秒になります。

システム機能の損失: 通常の状況では、ユーザーはすべてのシステム機能を使用できますが、システムトラフィックの急増により、システムの一部のコア以外の機能が使用できなくなります。

ソフトステート

ソフト状態とは、システム内のデータが中間状態(CAP 理論におけるデータの不整合)を持つことが許可され、この中間状態の存在がシステム全体の可用性に影響を与えないと考えられる状態、つまり、異なるノード上のデータ コピー間でデータを同期するプロセスで遅延が発生することがシステムで許可されている状態を意味します。

最終的な一貫性

最終的な一貫性は、システム内のすべてのデータ コピーが、同期期間の後に最終的に一貫した状態に到達できることを強調します。したがって、最終的な一貫性の本質は、システム データの強力な一貫性をリアルタイムで保証する必要はなく、最終的なデータの一貫性をシステムが保証する必要があることです。

参考文献

CAP理論とBASE理論をご存知ですか?実際の例を挙げて説明していただけますか?

ディストリビューションとクラスターの違いは何ですか?[1]

データの一貫性の問題[2]

<<:  アリババは、脆弱なネットワークの「ラストマイル」を埋めるために独自の次世代ネットワークプロトコルXLINKを開発しました。

>>:  Redis に基づく分散ロックと Redlock アルゴリズム

推薦する

SaaS アクセラレーションはパブリック クラウドの転換点となるでしょうか?

[[401146]] 2021 年の初めに、クラウド コンピューティングに関する次のようなトレンドを...

ウェブサイトの基盤と検索エンジンのアルゴリズムを相互に補完させる方法について説明します

Baidu におけるウェブサイトのランキングの変動は、多くのウェブマスターにとって頭痛の種となってい...

SEO 最適化: 準備が成功の鍵であり、準備不足が失敗の鍵です

ウェブマスターとして、私はウェブサイトの最適化が簡単な作業ではないことを深く理解しています。私たちが...

AWS Lambda のベストプラクティス

【51CTO.com クイック翻訳】概要今日、サーバーレスはさまざまなクラウド アプリケーションで最...

ユーザーの欲望と欲求を利用したマーケティングの簡単な分析

百度と360は最近、非常に盛り上がっています。例えば、今月初めには「本物のウイルス対策、安心」をテー...

WeChatの輝きが薄れる中、テンセントは成長停滞の苦境に陥っている

テンセントは微妙な岐路に立っている。テンセントの株価が史上最高値に達した後、資本市場の不安がついに表...

王通: SEOを素早く学んでお金を稼ぐ方法

SEO は自慢ではなく実践にかかっているので、2 年前に私は 100 を超える Web サイトを最適...

B2CウェブサイトがSEOを利用してトラフィックを獲得する方法について簡単に説明します。

ご存知のとおり、B2C ウェブサイトは、フォーラムや情報ウェブサイトのように人気を集めて広告を販売し...

最初にウェブサイトを運営し、宣伝する方法 - A5 Webmaster Network

初期の開発中に Web サイトを引き継いだ Web マスターであれば、おめでとうございます。これは良...

ソフトコンテンツマーケティングの一貫性についての簡単な議論

ソフトテキスト マーケティングについては、皆さんもよくご存知だと思います。ソフトテキストの役割につい...

クラウド変革の 3 つの段階は何ですか?

クラウド変革とは、柔軟性、拡張性、効率性を向上させるために、従来の IT インフラストラクチャとアプ...

中国のクラウドコンピューティング市場のプレーヤーの解釈:戦略、遺伝子、テクノロジー、新しいルール

欧州GPDRの最近の導入は世界的な注目を集めています。データのプライバシーとデータの所有権は、クラウ...

外部リンクリソースをより効果的に収集または取得する方法

検索エンジンが重み付けをする際に外部リンクが重要なパラメータであることは誰もが理解しており、また、良...

ftpit: 新年のプロモーション、米国 VPS の年間支払いは 15 ドルから、ロサンゼルス/フリーモント/ダラス/ニューヨーク

ftpit から新年のプロモーションが送られてきました。これには年間支払いの VPS がいくつか含ま...

こんなに多くのバグがあるのに、なぜゲーム会社はいまだに KFC とのコラボレーションを好むのでしょうか?

人気ゲーム「原神」が6週間ぶりに新バージョン1.4にアップデートしました。こうしたことが起こるたびに...