Alibaba第2回インタビュー:Redis分散ロックの有効期限が切れたが、業務が完了していない場合はどうすればよいですか?

Alibaba第2回インタビュー:Redis分散ロックの有効期限が切れたが、業務が完了していない場合はどうすればよいですか?

[[420487]]

インタビュアー: あなたのシステムでは分散ロックをどのように実装していますか?

:Redis 分散ロックを使用しました。具体的なアプローチとしては、バックエンドがリクエストを受信した後、分散ロックを追加します。ロックが成功すると、ビジネスが実行されます。ロックが失敗した場合は、ロックを待機するか、要求を拒否します。業務実行が完了するとロックが解除されます。

インタビュアー:具体的にどのようなコマンドが使われているのか教えていただけますか?

: SETNX コマンドは次のように使用します。

  1. SETNX キー名値

設定が成功した場合は 1 が返されます。それ以外の場合は 0 が返されます。次の図に示すように、クライアント 1 はロックを正常にロックしましたが、クライアント 2 はロックを取得できませんでした。

インタビュアー:この設定に問題はありますか?正常にロックされたクライアントがクラッシュした場合はどうなりますか?

:例えば、上の図のクライアント 1 がクラッシュした場合、ロックを解除することはできません。有効期限を設定できます。コマンドは次のとおりです。

  1. セット キー値 [EX 秒] [PX ミリ秒] NX

インタビュアー:有効期限を設定した場合、業務が完了していないのにRedisロックの有効期限が切れてしまった場合はどうすればいいでしょうか?

:鍵を交換しなければなりません。

インタビュアー:どのように機能するのか教えていただけますか?

: ロックの設定に成功したら、ウォッチドッグを起動して、一定時間 (たとえば 10 秒) ごとに現在の分散ロックを更新します。つまり、現在のキーのタイムアウトを 10 秒ごとにリセットします。コマンドは次のとおりです。

  1. EXPIRE <キー> <秒数>

全体のプロセスは次のとおりです。

インタビュアー: ウォッチドッグを実装するにはどうすればいいですか?

: クライアントが正常にロックされると、スケジュールされたタスクが開始され、10 秒ごとに (できれば構成サポートを使用して) ビジネスが処理されたかどうかを確認できます。検出の基礎は、分散ロックのキーがまだ存在するかどうかを判断することです。そうであれば更新されます。

インタビュアー: 現在のスレッドが処理されている場合、このキーは別のクライアントによって書き込まれますか?

: クライアントごとに clientID を指定し、VALUE に clientID プレフィックスを追加できます。このように、ロックを更新するときに、現在の分散ロックの値のプレフィックスを判断して、それが現在のクライアントに属しているかどうかを判断できます。一致する場合はロックを更新し、そうでない場合は何もしません。

インタビュアー:再ロック機能はご自身で実装されたのですか?

:私たちはredissonの分散ロックソリューションを使用しています。 redisson を使用して分散ロックを取得するのは非常に簡単です。コードは次のとおりです。

  1. RLock ロック = redisson.getLock( "クライアントロック" );
  2. ロック。ロック();
  3. 試す {
  4. //加工事業
  5. } キャッチ (例外 e) {
  6. //例外を処理する
  7. ついに
  8. ロックを解除します。
  9. }

具体的な原則は次のとおりです。クライアント 1 が正常にロックした場合、この分散ロックのデフォルトのタイムアウトは 30 秒です (Config.lockWatchdogTimeout を通じて変更できます)。ロックが正常に追加されると、ウォッチドッグが開始されます。ウォッチドッグは、クライアント 1 がまだロック キーを保持しているかどうかを 10 秒ごとにチェックするバックグラウンド スレッドです。そうであれば、ロックキーの寿命が延長されます。拡張操作は、ロック キーのタイムアウトを再度 30 秒に設定することです。

インタビュアー:redisson ではタイマーはどのように実装されていますか?

: redisson タイマーは、netty-common パッケージの HashedWheelTime を使用して実装されています。

インタビュアー: クライアント1がクラッシュした場合、分散ロックは更新できますか?

:分散ロックの更新はクライアント上で実行されるため、クライアント1がダウンすると更新スレッドが動作できなくなり、ロックを更新できなくなります。この時点で、分散ロックは削除され、他のクライアントが取得できるようにする必要があります。

インタビュアー: クライアント 1 がクラッシュした場合、他のクライアントはロックを取得するのに 30 秒待たなければなりません。ロックをすぐに削除する方法はありますか?

: client1 がダウンしているため、タイムアウト期間後にロックが自動的に削除されるまで待つことしかできません。すぐに削除したい場合は、センチネルがすべての Redis クライアントのリストを維持できるようにセンチネル メカニズムを追加するなどの追加作業を行う必要があります。センチネルはクライアントがダウンしているかどうかを定期的に監視します。ダウンタイムが検出されると、クライアントのロックは直ちに削除されます。以下のように表示されます。

ここでのセンチネルは、Redis のセンチネルではなく、クライアントの障害を検出するためにビジネス システム自体によって作成されたセンチネルです。

インタビュアー:redisson を使用しない場合、分散ロック継続をどのように実装しますか?たとえば、springboot2.0 で使用されるデフォルトの Redis クライアントは Lettuce です。

:Lettuce は redisson のようなウォッチドッグ メカニズムを提供していないため、ロックの更新はビジネス システム自体で実装する必要があります。これは次の手順で実現できます。

1. ロック コマンドについては、Spring パッケージ内の分散ロック コードを参照します。ロックが存在し、現在のクライアントによって追加された場合は、ロックを更新します。ロックが存在しない場合は、ロックを追加します。コードは次のとおりです。

  1. プライベート静的最終文字列 OBTAIN_LOCK_SCRIPT =
  2. "ローカル lockClientId = redis.call('GET', KEYS[1])\n" +
  3. "lockClientId == ARGV[1] の場合\n" +
  4. " redis.call('PEXPIRE', KEYS[1], ARGV[2])\n" +
  5. " true を返す\n" +
  6. "そうでなければ lockClientId ではない\n" +
  7. " redis.call('SET', KEYS[1], ARGV[1], 'PX', ARGV[2])\n" +
  8. " true を返す\n" +
  9. "終了\n" +
  10. "falseを返す" ;

2. ロックを HashMap などのデータ構造に保存します。スケジュールされたタスクは定期的にマップをスキャンし、各ロックを更新します。コードは次のとおりです。

  1. プライベート最終 Map<String, RedisLock> locks = new ConcurrentHashMap<>();

3. 再ロックコマンド

  1. プライベート静的最終文字列 RENEW_LOCK_SCRIPT =
  2. "ローカル lockClientId = redis.call('GET', KEYS[1])\n" +
  3. "lockClientId == ARGV[1] の場合\n" +
  4. " redis.call('PEXPIRE', KEYS[1], ARGV[2])\n" +
  5. " true を返す\n" +
  6. "終了\n" +
  7. "falseを返す" ;

4. 現在のクライアントによってロックが追加された場合はロックを更新し、そうでない場合は失敗します。

ロック継続コードを定期的に実行するスケジュールされたタスクを記述します。

  1. redisTemplate.execute ( renewLockScript
  2. Collections.singletonList(lockKey)、クライアントID、
  3. 文字列.valueOf(expireAfter));

インタビュアー:この質問はここまでにしましょう。次の質問に移りましょう...

<<:  Kafka の運用とメンテナンス |データ移行を本当に理解していますか?

>>:  HarmonyOSJS 分散機能 - 学習ノート

推薦する

禁止されたウェブサイトを迅速に復元する方法の分析例

ウェブサイトが K アウトされることは、ウェブマスターが最も恐れる状況です。ウェブサイトが K アウ...

エッジコンピューティングの必要性を再検討する

エッジ コンピューティングには、限られたスペースに収まり、過酷な条件に耐え、複雑な分析ルーチンを実行...

ウェブサイトのコンテンツ内のアンカーテキスト内部リンクの目的は何ですか?

SEO 担当者なら誰でも、競合他社のサイトを頻繁に注目していると思います。それらのサイトでは、ほぼす...

Google 画像検索のトラフィックを 35% 増やす方法

近年、多くの企業が検索結果における自社のウェブサイトの外観を制御するために、目を引く 65 ~ 75...

外部リンクを作成するための21のチャネル

SEO に携わる友人の皆さん、フレンドリーなリンクを取得するのは本当に時間のかかる作業なので、私たち...

SEOフォーラムの現状分析からより有益なSEO情報を得る方法

SEO 実践者として、私と同じように貴重な SEO 情報を見つけるためにフォーラムに行くことを好む人...

母子とペットの買い物シェアコミュニティが次のモグジエになるかもしれない

Analysys International:Mogujieは2011年2月にオンライン化されて以来...

インターネット プラットフォームがどれだけ長く存続できるかは重要ではありません。重要なのは、どれだけ長くプレイできるかです。

インターネット時代に、誰もがよく言う言葉が時代遅れです。上級インターネットマーケティング担当者である...

タオバオアフィリエイトステーションの百度の最新アルゴリズムへの対応戦略

幸せな春節を祝った後、多くのウェブマスターが百度によって大打撃を受けたと思います。1月下旬から2月上...

新しいアルゴリズムでは外部リンク プラットフォームはどうなるのでしょうか?

Baidu は最近、いわゆる「Green Radish」アルゴリズムを導入しました。業界ではこれを新...

日々の話題:Xiaomiのような存在になったVanclは、かつての栄光を取り戻すことができるのか?

A5ウェブマスターネットワーク(www.admin5.com)は4月1日、かつて数多くの若者に愛され...

reprisehosting-$32/L5520/2G メモリ/120g SSD/10T トラフィック/IPMI/シアトル

設立から2年以上の格安サーバープロバイダーであるreprisehosting(AS番号AS62838...

ByteDanceは本当にBaiduに取って代わることができるのか?

ByteDance がBaidu の BAT ステータスを置き換えようとしています。 Baidu の...