分散サービス電流制限の実践、私たちはすでにあなたのためにピットを手配しました

[[273022]]

1. 電流制限の役割

API インターフェースは呼び出し側の動作を制御できないため、リクエスト数が瞬間的に急増すると、インターフェースがサーバーのリソースを過剰に占有し、他のリクエストの応答が遅くなったり、タイムアウトになったり、さらに悪いことにサーバーがクラッシュしたりします。

レート制限とは、アプリケーションサービスの要求を制限することを指します。たとえば、特定のインターフェースのリクエスト制限は 1 秒あたり 100 であり、制限を超えるリクエストはすぐに失敗するか、破棄されます。

電流制限は以下を処理できます:

人気企業からの突然の依頼。
呼び出し側のバグによって発生したバースト要求。
悪意のある攻撃要求。

したがって、パブリックインターフェースには電流制限対策を講じる必要があります。

2. 分散電流制限はなぜ必要なのでしょうか?

アプリケーションが単一ポイントアプリケーションである場合、アプリケーションが調整されている限り、アプリケーションが依存するさまざまなサービスも保護されます。

しかし、さまざまな理由から、オンラインビジネスは主に分散型システムになっています。現在、単一ノードの制限では、そのノード自体しか保護できず、アプリケーションが依存するさまざまなサービスを保護することはできません。また、ノード容量の拡大や縮小時にサービス全体のリクエスト制限を正確に制御することができません。

分散電流制限を実装すると、サービスクラスター全体の要求制限を簡単に制御できます。クラスター全体に対するリクエスト数は制限されているため、サービスが依存するさまざまなリソースも電流制限によって保護されます。

3. 電流制限アルゴリズム

電流制限を実装する方法は多数あります。プログラムでは、インターフェースのトラフィックは通常、1 秒あたりに処理されるトランザクション数 (トランザクション/秒) に基づいて測定されます。

この記事では、一般的に使用される電流制限アルゴリズムをいくつか紹介します。

固定ウィンドウカウンター。
引き戸カウンター;
漏れやすいバケツ;
トークンバケット。

1. ウィンドウカウンタアルゴリズムを修正

固定ウィンドウカウンターアルゴリズムの概念は次のとおりです。

時間を複数のウィンドウに分割します。
各ウィンドウ内のリクエストごとにカウンターを 1 ずつ増加します。
カウンターが制限を超えると、このウィンドウ内のすべてのリクエストが破棄されます。時間が次のウィンドウに達すると、カウンターはリセットされます。

固定ウィンドウカウンターは最も単純なアルゴリズムですが、制限の 2 倍を超えることが許可される場合があります。次の状況を検討してください: 1 秒以内に最大 5 つのリクエストが通過でき、最初のウィンドウの最後の 0.5 秒以内に 5 つのリクエストが許可され、2 番目のウィンドウの最初の 0.5 秒以内に 5 つのリクエストが許可されます。これは、1 秒以内に 10 件のリクエストが行われたことを意味します。

2. スライディングウィンドウカウンタアルゴリズム

スライディングウィンドウカウンターアルゴリズムの概念は次のとおりです。

時間を複数の間隔に分割します。
各間隔でリクエストが行われるたびに、カウンターが 1 ずつ増加し、複数の間隔を占める時間ウィンドウが維持されます。
各間隔の後、最も古い間隔が破棄され、最新の間隔が含まれます。
現在のウィンドウ内のリクエストの合計数が制限を超えると、このウィンドウ内のすべてのリクエストが破棄されます。

スライディングウィンドウカウンターは、ウィンドウを細分化し、時間の経過とともに「スライド」させるアルゴリズムです。このアルゴリズムは、固定ウィンドウカウンターによって発生する二重バースト要求を回避しますが、時間間隔の精度が高くなるほど、アルゴリズムに必要なスペース容量が大きくなります。

3. リーキーバケットアルゴリズム

リーキーバケットアルゴリズムの概念は次のとおりです。

各リクエストを「水滴」として扱い、「漏れやすいバケツ」に入れて保管します。

「リーキーバケット」は、実行するために一定の速度でリクエストを「漏らします」。「漏れやすいバケツ」が空であれば、「漏れ」は止まります。

「バケツ」がいっぱいになった場合、余分な「水滴」はそのまま捨てられます。

リーキーバケットアルゴリズムは、多くの場合、キューを使用して実装されます。サービス要求はキューに保存され、サービスプロバイダーはキューから要求を取り出して一定の速度で実行します。過剰なリクエストはキューに入れられるか、直接拒否されます。

リーキーバケットアルゴリズムの欠陥も明らかです。短期間に大量のバースト要求が発生した場合、その時点でサーバーに負荷がかかっていなくても、各要求は応答されるまでしばらくキュー内で待機する必要があります。

4. トークンバケットアルゴリズム

トークンバケットアルゴリズムの概念は次のとおりです。

トークンは固定レートで生成されます。
生成されたトークンはトークンバケットに配置されます。トークンバケットがいっぱいになると、余分なトークンは破棄されます。リクエストが到着すると、トークンバケットからトークンを取得しようとします。トークンを取得するリクエストを実行できます。
バケットが空の場合、トークンを取得する試みはすべて破棄されます。

トークンバケットアルゴリズムは、すべての要求を時間間隔内に均等に分散し、サーバーが耐えられる範囲内でバースト要求を受け入れることができます。そのため、広く使用されている電流制限アルゴリズムです。

4. コードの実装

このように重要な機能であるため、Java には当然、電流制限を実装するクラスライブラリが多数存在します。たとえば、Google のオープンソースプロジェクト guava は、単一ポイントトークンバケットの電流制限を実装する RateLimiter クラスを提供します。

分散電流制限によく使用されるフレームワークには、Hystrix、resilience4j、Sentinel などがありますが、これらのフレームワークではすべてサードパーティライブラリの導入が必要です。国有企業などの保守的な企業では、外部ライブラリの導入には何段階もの承認が必要となり、さらに面倒なことになります。

分散電流制限は本質的にクラスターの同時実行性の問題です。広く使用されているミドルウェアである Redis は、単一プロセスと単一スレッドという特性を備えており、分散クラスターの同時実行の問題を自然に解決できます。この記事では、Redis を使って単一リクエスト判定と電流制限を実装する機能について簡単に紹介します。

1. スクリプト

上記の比較の結果、最も適切な電流制限アルゴリズムはトークンバケットアルゴリズムです。電流制限アルゴリズムを実装するには、クエリと計算のために Redis を繰り返し呼び出す必要があります。 1 回の電流制限判定には複数のリクエストが必要となり、時間がかかります。そこで、計算処理をRedis側に置いてLuaスクリプトを書いて実行し、Redisへのリクエスト1回で電流制限判定が完了する方法を採用しました。

トークンバケットアルゴリズムでは、バケットサイズと現在のトークン数を Redis に保存し、定期的に新しいトークンを追加する必要があります。もちろん、最も簡単な方法は、時々 Redis をリクエストして、保存されているトークンの数を増やすことです。

しかし実際には、現在の制限リクエスト間の時間とトークン追加の速度を計算することで、最後のリクエストからこのリクエストまでにトークンバケットに追加する必要があるトークンの数を計算できます。したがって、Redis のトークンバケットには、最後のリクエストの時間とトークンの数を保存するだけでよく、バケットサイズとトークンの追加速度は、パラメータを渡すことで動的に変更できます。

スクリプトを初めて実行したとき、トークンバケットはデフォルトでいっぱいになっているため、データの有効期限をトークンバケットがいっぱいになるまでの時間に設定して、時間内にリソースを解放することができます。

完成した Lua スクリプトは次のとおりです。

ローカルratelimit_info = redis.pcall( 'HMGET' 、KEYS[1]、 'last_time' 、 'current_token' )
ローカルlast_time = ratelimit_info[1]
ローカルのcurrent_token = tonumber(ratelimit_info[2])
ローカルmax_token = tonumber(ARGV[1])
ローカルトークンレート = tonumber(ARGV[2])
地元 現在の時刻= tonumber(ARGV[3])
ローカルリバースタイム = 1000/トークンレート
current_token == nilの場合 
  現在のトークン = 最大トークン
  最終時刻 =現在の時刻 
それ以外 
ローカル過去時刻 =現在時刻- 最終時刻
ローカルreverse_token = math.floor(past_time/reverse_time)
  現在のトークン = 現在のトークン + 逆トークン
  last_time = 逆時刻*逆トークン+last_time
  current_token>max_tokenの場合 
    現在のトークン = 最大トークン
終わり 
終わり 
ローカル結果 = 0
現在のトークン>0の場合 
  結果 = 1
  現在のトークン = 現在のトークン-1
終わり  
 redis.call( 'HMSET' 、KEYS[1]、 'last_time' 、last_time、 'current_token' 、current_token)
 redis.call( 'pexpire' 、KEYS[1]、math.ceil(reverse_time*(max_token-current_token)+( current_time -last_time)))
結果を返す

2.電流制限を実行する

ここでは、Redis スクリプトを呼び出すために Spring Data Redis が使用されます。

Redis スクリプトクラスを記述します。

パブリッククラスRedisReteLimitScriptはRedisScript<String>を実装します。
   プライベート静的最終文字列 SCRIPT =
 "local ratelimit_info = redis.pcall('HMGET',KEYS[1],'last_time','current_token') local last_time = ratelimit_info[1] local current_token = tonumber(ratelimit_info[2]) local max_token = tonumber(ARGV[1]) local token_rate = tonumber(ARGV[2]) local current_time = tonumber(ARGV[3]) local reverse_time = 1000/token_rate current_token == nil の場合、current_token = max_token last_time = current_time それ以外の場合、local past_time = current_time-last_time; local reverse_token = math.floor(past_time/reverse_time) current_token = current_token+reverse_token; last_time = river_time*reverse_token+last_time current_token>max_token の場合、current_token = max_token end end local result = '0' if(current_token>0) then result = '1' current_token = current_token-1 end redis.call('HMSET',KEYS[1],'last_time',last_time,'current_token',current_toke redis.call('pexpire',KEYS[1],math.ceil(reverse_time*(max_tokencurrent_token)+(current_time-last_time))) return result" ; 
 
  @Overrideパブリック文字列 getSha1() {
 DigestUtils.sha1Hex(SCRIPT)を返します。
  } 
 
  @Override public Class<String> getResultType() { return String.class;
  } 
 
  @Override public String getScriptAsString() { return SCRIPT;
  }
 }

RedisTemplate オブジェクトを通じてスクリプトを実行します。

パブリックブール値 rateLimit(文字列キー, int  最大、 intレート）{
    リスト<文字列> keyList = 新しいArrayList<>(1);
    keyList.add (キー);
戻る  "1" .equals(文字列RedisTemplate
        。実行(新しい RedisReteLimitScript()、keyList、 Integer .toString( max )、 Integer .toString(rate)、
            Long.toString(System.currentTimeMillis())));
  }

rateLimit メソッドに渡されるキーは、現在の制限インターフェースの ID、max はトークンバケットの最大サイズ、rate は 1 秒あたりに復元されるトークンの数、返されるブール値は、リクエストが現在の制限を超えたかどうかを示します。 Redis スクリプトの電流制限が正しく機能するかどうかをテストするために、それをテストするためのユニットテストを作成します。

オートワイヤード
  プライベート RedisManager redisManager; 
 
  @テスト
パブリックvoid rateLimitTest() は InterruptedException をスローします {
    文字列キー= "test_rateLimit_key" ;
整数 最大= 10; //トークンバケットサイズ
整数レート = 10; // 1秒あたりのトークン回復率
    AtomicInteger 成功数 = 新しい AtomicInteger(0);
    エグゼキュータ executor = Executors.newFixedThreadPool(10);
    カウントダウンラッチ countDownLatch = 新しい CountDownLatch(30);
 ( int i = 0; i < 30; i++) {
      executor.execute (() -> {
        ブール値 isAllow = redisManager.rateLimit(キー、最大値、レート );
        許可する場合
          成功回数。addAndGet(1);
        }
        ログ情報(Boolean.toString(isAllow));
        countDownLatch.countDown();
      });
    }
    countDownLatch.await();
    log.info( "リクエストが{}回成功しました" , successCount.get());
  }

トークンバケットサイズを 10 に設定し、1 秒あたり 10 個のトークンを復元し、10 個のスレッドを開始して短時間で 30 件のリクエストを実行し、現在の制限クエリごとに結果を出力します。ログ出力:

 [19:12:50,283]本当だ  
 [19:12:50,284]本当だ  
 [19:12:50,284]本当だ  
 [19:12:50,291]本当だ  
 [19:12:50,291]本当だ  
 [19:12:50,291]本当だ  
 [19:12:50,297]本当だ  
 [19:12:50,297]本当だ  
 [19:12:50,298]本当だ  
 [19:12:50,305]本当だ  
 [19:12:50,305]間違い  
 [19:12:50,305]本当だ  
 [19:12:50,312]間違い  
 [19:12:50,312]間違い  
 [19:12:50,312]間違い  
 [19:12:50,319]間違い  
 [19:12:50,319]間違い  
 [19:12:50,319]間違い  
 [19:12:50,325]間違い  
 [19:12:50,325]間違い  
 [19:12:50,326]間違い  
 [19:12:50,380]間違いです  
 [19:12:50,380]間違いです  
 [19:12:50,380]間違いです  
 [19:12:50,387]間違いです  
 [19:12:50,387]間違いです  
 [19:12:50,387]間違いです  
 [19:12:50,392]間違いです  
 [19:12:50,392]間違いです  
 [19:12:50,392]間違いです  
 [19:12:50,393] リクエストは11回成功しました

0.1 秒以内に行われた 30 件のリクエストのうち、最初の 10 個のトークンと時間の経過とともに復元された 1 個のトークンを除き、トークンを取得できなかった残りの 19 件のリクエストはすべて false を返したことがわかります。現在の制限スクリプトは、制限を超えたリクエストを正しく識別しました。このとき、ビジネス側は、システムがビジー状態である、またはインターフェース要求が頻繁すぎるなどのプロンプトを直接返すことができます。

3. 開発中に遭遇した問題

1) Lua変数フォーマット

Lua の文字列と数値は、tonumber() と tostring() を介して変換する必要があります。

2) Redis入力

pexpire などの Redis コマンドは小数をサポートしていませんが、Lua の Number 型は小数を格納できます。したがって、Number 型を Redis に渡すときは、小数点によるコマンドの失敗を回避するために、math.ceil() などのメソッドを使用して変換するのが最適です。

3) 時間コマンド

Redis はスクリプトとパラメータをクラスター内のすべてのノードにコピーするため、不確実性のあるコマンドの後に書き込みコマンドを実行することはできません。したがって、リクエスト時に時間を渡すことしかできず、Redis Time コマンドを使用して時間を取得することはできません。

バージョン 3.2 以降の Redis スクリプトは redis.replicate_commands() をサポートしており、代わりに Time コマンドを使用して現在の時刻を取得できます。

4) 潜在的な危険

この Lua スクリプトはリクエスト中に渡された時間に基づいて計算を実行するため、分散ノードで取得された時間が同期されていることを確認することが重要です。時刻が同期されていない場合、電流制限機能が正しく動作しません。

著者について

オレンジファイナンシャルイノベーションセンターの開発エンジニアである Duan Ran 氏は、現在、同社のプラットフォーム構築とメディア機能の集約を担当しています。

<<: 20 年経った今でも、Salesforce は SaaS の王者ですが、私たちはどうでしょうか?

>>: 注目すべき 5 つの重要なマルチクラウドトレンド

分散サービス電流制限の実践、私たちはすでにあなたのためにピットを手配しました

速報：新浪微博が自社メディア広告の利益分配計画を開始

ウェブサイト最適化の剣: オンサイト最適化 - ユーザーエクスペリエンス

分散ストレージが新しいインフラストラクチャのデータブルーオーシャンを拡大

gcore: ブラジル VPS、4.49 ユーロ/KVM/512m メモリ/20g SSD/500g トラフィック

アプリ推奨サイトの春が来るのか？ AppleによるChompの買収から始まる

hkcorex: 香港のローカル ISP。香港 (CN2/BGP/高防御)/米国/マレーシア Xuya クラウドサーバー、香港の物理マシン/香港のクラスター/香港の動的サーバーを提供しています。

Microsoft のインダストリアルクラウド: 単なるサービスパッケージの集まりではない

臨沂人材ネットワークの発展に基づく地元人材募集ウェブサイトの運営分析

100% Mallがオンラインねずみ講事件に関与、Fanli.comの収益モデルが論争を巻き起こす

エッジコンピューティング、フォグコンピューティング、クラウドコンピューティングの違い

推薦する

SAP S/4HANA CloudはIDCによりグローバルSaaSおよびクラウドERPシステムのリーダーとしてランク付けされました。

ウェブマスターが検索エンジンの変更からガイダンスのアイデアを得る方法

ウェブサイトのプロモーションに本当に必要なものがわからない

VMware は企業の変革とデジタル化の推進を支援します

インターネットマーケティングの自己規律の要点はどこにあるのでしょうか?

高品質な外部リンクを構築する方法: 投稿、Q&A、ソフト記事

翔翔クラウド：中国の100G高防御クラウド、月額93元、2Gメモリ/2コア/50gデータディスク/10M帯域幅、UDP/SYN/CCブロックポリシーをサポート

初心者が外部リンクを構築するためのヒントと簡単な方法

Google、写真バックアップ・共有アプリOdyseeを買収

現在のソーシャルツールの分析：実際にはお金にならない

信頼性の高いホスティングサービス - $10/I5/8g メモリ/500g ハードディスク/5T トラフィック

5 つの主要な分散ストレージテクノロジの比較分析、どれを選びますか?

2014 年のインターネットクリーンアップキャンペーンはビデオ番組にとって「壊滅的な災害」となるでしょうか?ビデオ番組の変革への道は困難

JD.comとYitaoが再び混乱。価格比較サイトの公平性を監督しているのは誰か？

2019年のソーシャルメディアフィード広告のトレンド