一目でわかる「分散ロック」の原理

分散ロックの原理は、私たちが普段話しているロックと基本的に同じです。目的は、複数のスレッドが同時に実行されている場合に、1 つのスレッドだけが同時にビジネス、メソッド、または変数を操作するようにすることです。

プロセス、つまり JVM またはアプリケーションでは、制御を処理するのは簡単です。 jdk java.util 並行性パッケージには、これを処理できる Synchronized キーワードや Lock ロックなどのロックメソッドが用意されています。

ただし、現在のアプリケーションが 1 台のサーバーにのみデプロイされている場合、同時実行性は非常に低くなります。一度に数万件ものリクエストがあった場合、サーバーが過負荷になり麻痺してしまう可能性が高くなります。

ダブルイレブンや大晦日の夜10時にアリペイの紅包を配布するなどのビジネスシナリオを考えてみましょう。当然、これらの業務を同時に処理するには複数のサーバーが必要になります。これらのサービスは、同時に数百台のサーバーによって処理される場合があります。

しかし、考えてみてください。紅包配布ビジネスを扱うサーバーが 100 台あり、紅包が 1 億個あり、1,000 万人がランダムな量でそれを分配すると仮定すると、このビジネスシナリオでは、これらの 1,000 万人が配布した紅包の合計量が 1 億個になるようにする必要がありますか?

[[267555]]

うまく処理されず、全員が100万ドルを受け取ることになったら、ジャック・マーはおそらく旧正月の初日に破産を宣言しなければならないだろう。

通常のロックでは何が起こりますか?

まず、クラスターを構築する必要がある理由について説明します。簡単に言えば、需要（同時リクエスト量）が増加し、1 人のワーカーの処理能力が制限されると、より多くのワーカーを募集して一緒に処理することができます。

1,000 万件のリクエストが 100 台のサーバーに均等に分散され、各サーバーが 10 万件のリクエストを受信すると仮定します。

これらの 100,000 件のリクエストは同じ秒数内に届いたわけではなく、1 ～ 2 時間以内に届いた可能性があります。 3月30日の夜に紅包を開けるようなものだと想像してください。10時20分にすぐに開けた人もいれば、12時まで開けたことに気づかなかった人もいます。

この場合、1 秒あたりの平均リクエスト数は 1,000 未満であり、通常のサーバーはまだこの負荷に耐えることができます。

*** ユーザーが共有しに来ます。要請が来たら、彼に1億円の一部を与える必要がある。金額はランダムです。 ***人が100人獲得すると仮定すると、1億から100元を差し引く必要があり、残りは99,999,900元になります。
2 番目のユーザーがランダムな金額、今回は 200 元でお金を分けに来ます。次に残りの 99999900 元から 200 元を差し引いて、99999700 元を残す必要があります。
10 万人目のユーザーが来て、まだ 1,000 万人いるとわかれば、1,000 万人すべてが彼のものになります。

これは、各サーバーに 1 億を分配すること、つまり 10 万人のユーザーが 1 億を共有し、合計 100 台のサーバーがあるため、100 億が必要になることに相当します。

もしこれが本当なら、ジャック・マーは破産しないものの（***の統計によると、ジャック・マーは2,300億人民元を保有している）、ボーナスを受け取る開発プロジェクトチームと製品マネージャーは破産する可能性があります。

簡略化された構造図は次のとおりです。

分散ロックをどのように処理しますか?

したがって、この問題を解決するには、1,000 万人のユーザーが 100 億ではなく 1 億だけを共有できるようにします。このとき、分散ロックが役立ちます。

分散ロックはクラスター全体をアプリケーションとして扱うことができるため、ロックはサービス内ではなく各サービスから独立している必要があります。

最初のサーバーがユーザー 1 からのリクエストを受信した後、独自のアプリケーションで配布可能な金額を判断できるだけでなく、1 億枚の紅包の管理を特に担当する人物 (サービス) に外部リクエストを送信して、「100 元欲しいので、100 元ください」と依頼する必要があるとします。

紅包（サービス）を担当する女の子は、まだ1億あるのを見て、「わかりました。100元あげます。99,999,900元残ります」と言いました。

2番目のリクエストが到着した後、サーバー2で受信され、赤い封筒を管理する女の子に、10元を分けたいと引き続き尋ねます。紅包を管理する女の子が最初に確認し、99999900元が残っていることがわかったので、彼女は言いました。「わかりました。10元あげます。それで、残りは99999890元です。」

1000wth リクエストが到着すると、サーバー 100 がリクエストを受け取り、赤い封筒を管理する女の子に「100 個欲しい」と尋ね続けます。女の子は目を回してあなたに言います。「あと1元しかありません。受け取るか受け取らないかはあなた次第です。」現時点では、1元しかお渡しできません（1元もお金です。辛いバーを買うには十分です）。

これらのリクエスト番号 1 と 2 は実行順序を表すものではありません。正式なシナリオでは、100 台のサーバーがあり、各サーバーには、赤い封筒の管理を担当する女の子 (サービス) へのアクセス要求が保持されます。

すると、紅包担当の女の子は同時に100件のリクエストを受け取ることになります。このとき、赤い封筒を担当する女の子（ボールを投げる）にロックを追加するだけです。 100 人のサーバーのうちロックを獲得した (ボールを掴んだ) 人は誰でも入って来て私に話しかけることができます。私はあなたにその分け前をあげます、そして他の人たちはただ待っていてください。

上記の分散ロック処理の後、ジャック・マーはようやく安心し、紅封筒チームのメンバー全員に鶏の脚を与えることにしました。

簡略化された構造図は次のとおりです。

分散ロックの実装は何ですか?

分散ロックの実装に関しては、データベース方式、Redis 分散ロック、Zookeeper 分散ロックなど、まだまだたくさんあります。

Redis を分散ロックとして使用すると、上の図の「赤い封筒を担当する女の子 (サービス)」を Redis に置き換えることができます。想像力を働かせてください。

①Redis が分散ロックを実装できるのはなぜですか?

まず、Redis はシングルスレッドです。ここでのシングルスレッドとは、ネットワーク要求モジュールが 1 つのスレッドを使用する (したがって、同時実行の安全性を考慮する必要がない)、つまり、1 つのスレッドがすべてのネットワーク要求を処理し、他のモジュールは引き続き複数のスレッドを使用することを意味します。

実際の操作では、プロセスはおおよそ次のようになります。サーバー 1 は、赤い封筒を送った女の子、つまり Redis にアクセスしたいので、「setnx key value」操作を通じて Redis にキーを設定します。値が何であるかは問題ではありません。重要なのは、キー、つまりマークがなければならないということです。

すべてのサーバーが同じキーを持っている限り、このキーを好きなように呼ぶことができます。

以下のように設定するとします。

すると、成功を意味する 1 が返されることがわかります。

次のように、同じキーを設定するための別のリクエストが届いた場合:

このとき、失敗を意味する 0 が返されます。

次に、この操作を使用して、現時点でロックを取得できるかどうか、または「赤い封筒を送る責任がある女の子」を訪問できるかどうかを判断できます。 1 が返された場合は、後続のロジックの実行を開始します。 0 が返された場合は、すでに誰かに占有されていることを意味するので、待機を継続する必要があります。

サーバー 1 はロックを取得した後、ビジネス処理を実行し、完了したら次の図に示すようにロックを解除する必要があります。

削除が成功すると 1 が返され、他のサーバーは上記の手順を繰り返してこのキーを設定し、ロックを取得する目的を達成できます。

もちろん、上記の操作は Redis クライアントで直接実行されます。プログラムを通じて呼び出される場合は、このように記述することはできません。たとえば、Java は Jedis を介して呼び出す必要がありますが、処理ロジック全体は基本的に同じです。

上記の方法により、分散ロックの問題は解決したように見えますが、何か問題があるかどうか考えてみましょう。

はい、まだ問題が残っています。デッドロックが発生する可能性があります。たとえば、サーバー 1 がセットアップされ、ロックを取得した後、突然クラッシュします。

その後のキー削除操作は実行できません。このキーは常に Redis に存在します。他のサーバーがそれをチェックするたびに、0 が返されます。誰かがロックを使用していると判断され、待機する必要があります。

このデッドロック問題を解決するには、キーの有効期間を設定する必要があります。設定方法は2つあります:

1 つ目は、キーを設定した後にキーの有効期間「有効期限切れキータイムアウト」を直接設定し、キーのタイムアウト期間を秒単位で設定することです。この時間が経過すると、デッドロックを回避するためにロックは自動的に解除されます。

この方法は、ロックの有効期間を Redis に渡して制御することと同じです。時間が経過してもキーを削除していない場合、Redis が直接キーを削除し、他のサーバーは引き続き Setnx を使用してロックを取得できます。

2 番目の方法は、キーを削除する権限を他のサーバーに付与することです。この場合、Value 値が必要になります。たとえば、サーバー 1 は値、つまりタイムアウトを現在の時刻 + 1 秒に設定します。

この時点で、サーバー 2 は Get を通じて、時間が現在のシステム時間を超えていることを検出します。これは、サーバー 1 がロックを解除しておらず、サーバー 1 に問題がある可能性があることを意味します。サーバー 2 は Delete Key 操作の実行を開始し、Setnx 操作の実行を続行します。

しかし、ここで問題があります。つまり、サーバー 2 がサーバー 1 のタイムアウトを検出するだけでなく、サーバー 3 でも検出される可能性があるということです。サーバー 2 の Setnx 操作が完了し、サーバー 3 が削除された場合、サーバー 3 でも正常に Setnx を実行できますか?

つまり、サーバー 2 とサーバー 3 の両方がロックを取得したことになりますが、これは大きな問題です。こういう時どうすればいいでしょうか？

このとき、「GETSET キー値」コマンドを使用する必要があります。このコマンドの意味は、現在のキー値を取得し、新しい値を設定することです。

サーバー 2 がキーの有効期限が切れていることを検出し、getset コマンドの呼び出しを開始し、取得した時間を使用してキーの有効期限が切れているかどうかを判断します。取得した時間がまだ期限切れになっている場合は、ロックが取得されたことを意味します。

そうでない場合は、サービス 2 が getset を実行する前に、サーバー 3 もロックの有効期限が切れていることを検出し、サーバー 2 より前に getset 操作を実行して有効期限をリセットすることになります。

その後、サーバー 2 は後続の操作を中止し、サーバー 3 がロックを解除するか、キーの有効期限が切れたかどうかを監視し続ける必要があります。

実はここには小さな問題があります。サーバー 3 は既に有効期間を変更しています。ロックを取得した後、サーバー 2 も有効期間を変更しましたが、ロックを取得できませんでした。

ただし、サーバー 3 に基づいて有効期間が延長されましたが、影響はまだ非常に小さく、ほとんど無視できます。

②Zookeeper が分散ロックを実装できるのはなぜですか?

Baidu Encyclopedia では次のように紹介しています: ZooKeeper は、分散型のオープンソース分散アプリケーション調整サービスです。これは、Google の Chubby のオープンソース実装であり、Hadoop と Hbase の重要なコンポーネントです。

ZooKeeper を初めて使う人にとっては、ZooKeeper がコンピュータのファイルシステムのようなものだということがお分かりいただけると思います。ドライブ D にフォルダー a を作成し、フォルダー a にフォルダー a1 と a2 を続けて作成できます。

では、私たちのファイルシステムの特徴は何でしょうか?つまり、同じディレクトリ内でファイル名を繰り返すことはできません。これは ZooKeeper の場合も同様です。

ZooKeeper 内のすべてのノード、つまりフォルダーは Znode と呼ばれ、この Znode ノードにデータを保存できます。

「create /zkjjj nice」でノードを作成できます。このコマンドは、ルートディレクトリに nice の値を持つ zkjjj ノードを作成することを意味します。

ここでの値は、先ほど述べた Redis の値と同じで、意味はなく、好きな値を指定できます。

さらに、ZooKeeper は次の 4 種類のノードを作成できます。

永続ノード
永続シーケンスノード
一時ノード
一時シーケンスノード

まず、永続ノードと一時ノードの違いについて説明します。

永続ノードとは、このノードを作成すると、ZooKeeper クライアントが切断されているかどうかに関係なく、ZooKeeper サーバーがこのノードを記録することを意味します。
一時ノードは正反対です。 ZooKeeper クライアントが切断されると、ZooKeeper サーバーはノードを保存しなくなります。
さて、シーケンシャルノードについてお話しましょう。連続ノードとは、ノードを作成するときに、ZooKeeper がノードに 0000001、0000002 などの番号を自動的に付けることを意味します。

Zookeeper には監視メカニズムがあります。クライアントは、関心のあるディレクトリノードを監視するために登録します。ディレクトリノードが変更されると (データの変更、削除、サブディレクトリノードの追加または削除)、Zookeeper はクライアントに通知します。

Zookeeper をロックするにはどうすればいいですか?

次に、上記の配当分配シナリオに基づいて、Zookeeper をロックインする方法について説明します。

サーバー 1 がノード /zkjjj を正常に作成し、サーバー 1 がロックを取得したとします。サーバー 2 が同じロックを再度作成しようとすると、失敗します。現時点では、このノードの変更のみを監視できます。

サーバー 1 が業務の処理を終了し、ノードを削除すると、通知が送信され、同じノードが作成され、業務を処理するためのロックが取得されてから、ノードが削除されます。後続の 100 台のサーバーも同様です。

ここで、100 台のサーバーは上記のノード作成操作を 1 つずつ実行するのではなく、同時に実行することに注意してください。サーバー 1 が正常に作成されると、残りの 99 台がこのノードをリッスンして通知を待機するように登録されます。

しかし、ここでまだ問題があり、デッドロックがまだ発生することに気付きましたか?

サーバー 1 がノードの作成後にクラッシュし、削除に失敗すると、他の 99 台のサーバーは通知を待機し続け、それで終わりになります。

このとき、一時的なノードが必要になります。前に述べたように、一時ノードの特性は、クライアントが切断されると失われることです。

つまり、サーバー 1 がノードを作成した後、サーバー 1 がクラッシュすると、そのノードは自動的に削除され、後続のサーバーが引き続きノードを作成し、ロックを取得できるようになります。

しかし、衝撃的な群集効果という点にも注意を払う必要があるかもしれません。非常に単純な例を挙げると、ハトの群れの真ん中に食べ物を投げると、最終的に食べ物をつかむのは 1 羽のハトだけであっても、すべてのハトが驚いて食べ物を奪い合い、つかまなかったハトは…

つまり、サーバー 1 ノードに変更があった場合、残りの 99 台のサーバーに通知されますが、最終的に正常に作成されるのは 1 台のサーバーのみなので、98 台はまだ監視を待つ必要があります。この状況に対処するには、一時的なシーケンシャルノードが必要です。

一般的な意味は、以前は 99 台のサーバーすべてが 1 つのノードをリッスンしていましたが、現在は各サーバーがその前にあるノードをリッスンするということです。

100 台のサーバーが同時にリクエストを送信すると、/zkjjj ノードの下に、/zkjjj/000000001、/zkjjj/000000002、…、/zkjjj/000000100 までの 100 個の一時的な連続ノードが作成されます。この数値は、ロックを取得する順序を設定することと同じです。

ノード 001 が処理されて削除されると、ノード 002 が通知を受信し、ロックを取得して実行を開始し、実行が完了したらノードを削除して、ノード 003 に通知する、という処理が行われます。

<<: 3年間のJavaバックエンド開発では、JVMを知っておく必要があります

>>: 中国におけるSAP: 業界の変革とアップグレードを支援

JD.com の 3 段階分類ページの SEO、ユーザーエクスペリエンス、マーケティング手法の簡単な分析 (パート 2)

一目でわかる「分散ロック」の原理

JD.com の 3 段階分類ページの SEO、ユーザーエクスペリエンス、マーケティング手法の簡単な分析 (パート 2)

エッジコンピューティングによるネットワークの革新

Kyverno による Kubernetes ポリシー管理

pqhosting: ポルトガルの VPS、月額 3.7 ユーロから、1Gbps の帯域幅、無制限のトラフィック、Windows システム

rethinkvps-$5.96/4IP/512m メモリ/1gSwap/30g ハードディスク/無制限 G ポート

クラウドコンピューティングの運命: 世界が 1 台のコンピューターに統合され、サーバーレス運用がサポートされる

Zulily の収益性の秘密は配達の遅延？

弾幕システムアップデートの血と涙

ドラゴンボートフェスティバルが今年もやって来ました。ブランドはこのようにマーケティング活動を活用します。

アプリプロモーション：オフラインチャネルプロモーション方法11選！

推薦する

Baiduスパイダークローリングの簡単な分析

企業のウェブサイトをどのように運営すべきかについて話しましょう。

ウェブサイトの SEO 診断分析とは具体的に何でしょうか?

個人情報保護に関する国家基準が今月初めに施行されたが、電子商取引企業はまだ通知を開始していない。

クラウドネイティブは、Kubernetes 以降の時代における企業の継続的なイノベーションを支援します_クラウドコンピューティングセミマンスリー第 41 号

モバイルインターネットはどうやって儲かるのか？馬化騰氏はゲーム業界に最も楽観的だ

学術委員の呉和全氏: エッジコンピューティングに関する「10 の新たな疑問」

SEO検索エンジン最適化のヒント

locvpsオランダcn2 gia回線のVPSの簡単な評価、発信ルートは中国移動を除いてcn2、戻りルートは3つのネットワークに対してcn2 giaを使用するように強制されます

パブリッククラウドのコスト管理に役立つ28の効果的な対策

Filezilla Server を使用して Windows Server 2008 上に FTP サーバーを構築する

#BlackFriday# tmhhost: すべてのリチャージに10%のリチャージバック、日本cn2\日本ソフトバンク\韓国CN2\香港cn2\米国3ネットワークcn2、今年最低価格

泰上老君の錬金術炉分散クォーラムNWR

企業はどのようにワークロードをクラウドに移行するのでしょうか?

最適なクラウドデータ管理ソリューションを選択するための3つのルール