Alibaba第2回インタビュー:Redis分散ロックの有効期限が切れたが、業務が完了していない場合はどうすればよいですか?

Alibaba第2回インタビュー:Redis分散ロックの有効期限が切れたが、業務が完了していない場合はどうすればよいですか?

[[420487]]

インタビュアー: あなたのシステムでは分散ロックをどのように実装していますか?

:Redis 分散ロックを使用しました。具体的なアプローチとしては、バックエンドがリクエストを受信した後、分散ロックを追加します。ロックが成功すると、ビジネスが実行されます。ロックが失敗した場合は、ロックを待機するか、要求を拒否します。業務実行が完了するとロックが解除されます。

インタビュアー:具体的にどのようなコマンドが使われているのか教えていただけますか?

: SETNX コマンドは次のように使用します。

  1. SETNX キー名値

設定が成功した場合は 1 が返されます。それ以外の場合は 0 が返されます。次の図に示すように、クライアント 1 はロックを正常にロックしましたが、クライアント 2 はロックを取得できませんでした。

インタビュアー:この設定に問題はありますか?正常にロックされたクライアントがクラッシュした場合はどうなりますか?

:例えば、上の図のクライアント 1 がクラッシュした場合、ロックを解除することはできません。有効期限を設定できます。コマンドは次のとおりです。

  1. セット キー値 [EX 秒] [PX ミリ秒] NX

インタビュアー:有効期限を設定した場合、業務が完了していないのにRedisロックの有効期限が切れてしまった場合はどうすればいいでしょうか?

:鍵を交換しなければなりません。

インタビュアー:どのように機能するのか教えていただけますか?

: ロックの設定に成功したら、ウォッチドッグを起動して、一定時間 (たとえば 10 秒) ごとに現在の分散ロックを更新します。つまり、現在のキーのタイムアウトを 10 秒ごとにリセットします。コマンドは次のとおりです。

  1. EXPIRE <キー> <秒数>

全体のプロセスは次のとおりです。

インタビュアー: ウォッチドッグを実装するにはどうすればいいですか?

: クライアントが正常にロックされると、スケジュールされたタスクが開始され、10 秒ごとに (できれば構成サポートを使用して) ビジネスが処理されたかどうかを確認できます。検出の基礎は、分散ロックのキーがまだ存在するかどうかを判断することです。そうであれば更新されます。

インタビュアー: 現在のスレッドが処理されている場合、このキーは別のクライアントによって書き込まれますか?

: クライアントごとに clientID を指定し、VALUE に clientID プレフィックスを追加できます。このように、ロックを更新するときに、現在の分散ロックの値のプレフィックスを判断して、それが現在のクライアントに属しているかどうかを判断できます。一致する場合はロックを更新し、そうでない場合は何もしません。

インタビュアー:再ロック機能はご自身で実装されたのですか?

:私たちはredissonの分散ロックソリューションを使用しています。 redisson を使用して分散ロックを取得するのは非常に簡単です。コードは次のとおりです。

  1. RLock ロック = redisson.getLock( "クライアントロック" );
  2. ロック。ロック();
  3. 試す {
  4. //加工事業
  5. } キャッチ (例外 e) {
  6. //例外を処理する
  7. ついに
  8. ロックを解除します。
  9. }

具体的な原則は次のとおりです。クライアント 1 が正常にロックした場合、この分散ロックのデフォルトのタイムアウトは 30 秒です (Config.lockWatchdogTimeout を通じて変更できます)。ロックが正常に追加されると、ウォッチドッグが開始されます。ウォッチドッグは、クライアント 1 がまだロック キーを保持しているかどうかを 10 秒ごとにチェックするバックグラウンド スレッドです。そうであれば、ロックキーの寿命が延長されます。拡張操作は、ロック キーのタイムアウトを再度 30 秒に設定することです。

インタビュアー:redisson ではタイマーはどのように実装されていますか?

: redisson タイマーは、netty-common パッケージの HashedWheelTime を使用して実装されています。

インタビュアー: クライアント1がクラッシュした場合、分散ロックは更新できますか?

:分散ロックの更新はクライアント上で実行されるため、クライアント1がダウンすると更新スレッドが動作できなくなり、ロックを更新できなくなります。この時点で、分散ロックは削除され、他のクライアントが取得できるようにする必要があります。

インタビュアー: クライアント 1 がクラッシュした場合、他のクライアントはロックを取得するのに 30 秒待たなければなりません。ロックをすぐに削除する方法はありますか?

: client1 がダウンしているため、タイムアウト期間後にロックが自動的に削除されるまで待つことしかできません。すぐに削除したい場合は、センチネルがすべての Redis クライアントのリストを維持できるようにセンチネル メカニズムを追加するなどの追加作業を行う必要があります。センチネルはクライアントがダウンしているかどうかを定期的に監視します。ダウンタイムが検出されると、クライアントのロックは直ちに削除されます。以下のように表示されます。

ここでのセンチネルは、Redis のセンチネルではなく、クライアントの障害を検出するためにビジネス システム自体によって作成されたセンチネルです。

インタビュアー:redisson を使用しない場合、分散ロック継続をどのように実装しますか?たとえば、springboot2.0 で使用されるデフォルトの Redis クライアントは Lettuce です。

:Lettuce は redisson のようなウォッチドッグ メカニズムを提供していないため、ロックの更新はビジネス システム自体で実装する必要があります。これは次の手順で実現できます。

1. ロック コマンドについては、Spring パッケージ内の分散ロック コードを参照します。ロックが存在し、現在のクライアントによって追加された場合は、ロックを更新します。ロックが存在しない場合は、ロックを追加します。コードは次のとおりです。

  1. プライベート静的最終文字列 OBTAIN_LOCK_SCRIPT =
  2. "ローカル lockClientId = redis.call('GET', KEYS[1])\n" +
  3. "lockClientId == ARGV[1] の場合\n" +
  4. " redis.call('PEXPIRE', KEYS[1], ARGV[2])\n" +
  5. " true を返す\n" +
  6. "そうでなければ lockClientId ではない\n" +
  7. " redis.call('SET', KEYS[1], ARGV[1], 'PX', ARGV[2])\n" +
  8. " true を返す\n" +
  9. "終了\n" +
  10. "falseを返す" ;

2. ロックを HashMap などのデータ構造に保存します。スケジュールされたタスクは定期的にマップをスキャンし、各ロックを更新します。コードは次のとおりです。

  1. プライベート最終 Map<String, RedisLock> locks = new ConcurrentHashMap<>();

3. 再ロックコマンド

  1. プライベート静的最終文字列 RENEW_LOCK_SCRIPT =
  2. "ローカル lockClientId = redis.call('GET', KEYS[1])\n" +
  3. "lockClientId == ARGV[1] の場合\n" +
  4. " redis.call('PEXPIRE', KEYS[1], ARGV[2])\n" +
  5. " true を返す\n" +
  6. "終了\n" +
  7. "falseを返す" ;

4. 現在のクライアントによってロックが追加された場合はロックを更新し、そうでない場合は失敗します。

ロック継続コードを定期的に実行するスケジュールされたタスクを記述します。

  1. redisTemplate.execute ( renewLockScript
  2. Collections.singletonList(lockKey)、クライアントID、
  3. 文字列.valueOf(expireAfter));

インタビュアー:この質問はここまでにしましょう。次の質問に移りましょう...

<<:  Kafka の運用とメンテナンス |データ移行を本当に理解していますか?

>>:  HarmonyOSJS 分散機能 - 学習ノート

推薦する

hostus-第 2 の香港 VPS レビュー/softlayer/1000M ポート

ここ 2 日間は忙しかったので、Hostus の香港 VPS のレビューを書くために戻ってきました。...

マイクロサービスアーキテクチャによる分散トランザクションソリューション

[[426291]]ビジネスの急速な発展とビジネスの複雑性の増大に伴い、従来のモノリシック アプリケ...

2022年のクラウド大手の「エコ革命」第一歩:リベートの削減、転売の抑制、発言権の競争

「アリババ、テンセント、ファーウェイクラウドのエコ政策は今年、いずれも大きな変化を遂げるだろう。」最...

Kubernetes に基づく CICD の実践

みなさんこんにちは。開発が大好きな運用エンジニアであり、寝ているときでも自分の醜さで目が覚めることが...

Pulsar の展開とオンライン構成を 1 つの記事で学ぶ

1. パルサーのインストールと展開1. インストールパッケージをダウンロードするPulsar インス...

ショッピングガイドがなぜ良いビジネスでありながら成功が難しいのかを説明する3つのストーリー

過去2年間、ソーシャル電子商取引はITメディア界で頻繁に登場した。ウェブサイト分野の新興企業であるP...

不正なURLとリンクを偽装する集約ページ

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますSEO 最...

宅配業者は春節期間中に大量の商品を扱っており、通常に戻るまで1週間ほどかかる見込み

「大晦日にネットで服を買ったのですが、今朝になってやっと届きました。配達が本当に遅いです!」昨日の朝...

フラッピーバードの裏に隠されたマーケティングルール

Flappy Bird は今年 2 月 10 日に開発元によって主要ストアから削除されましたが、その...

次世代 JVM である GraalVM とは何でしょうか?

[[404037]]この記事はWeChatの公開アカウント「Coffee Latte」から転載したも...

ショッピングモールから記事サイトSEOへの苦難の道

1年以上前、まだインターンだった頃、私は偶然 SEO の道に足を踏み入れました。本当にその道を進みた...

SaaS を実行するときに不安を回避するにはどうすればよいでしょうか?

1. 一生懸命働けば働くほど、不安は増しますか?海外のSaaS市場は急速に発展しており、企業の時価総...

福州警察はフィッシングサイトのソースコードを作成して販売していたグループを壊滅させた

記者が昨日、市公安局から得た情報によると、警察は6か月以上の綿密な捜査を経て、1日にフィッシングサイ...

実際のマーケティング事例 - WeChatの使い方を教える

タオバオが1年前に最大のライバルであるWeChatに対して排除命令を出したことは誰もが知っている。そ...