一貫性ハッシュアルゴリズムと分散ストレージへの応用

一貫性ハッシュアルゴリズムと分散ストレージへの応用

OStorageの責任者であるLi Mingyu氏は、同社のエンタープライズレベルのオブジェクトストレージ製品であるOStorage-EOSの監視インターフェースのスクリーンショットである「友達の輪」を何気なく投稿し、200TBを超えるクラスターがユーザーによって急速に92%以上使用されたことに対する感動を表現した。

「部外者は興奮を観察、部内者は出入り口を観察。」分散ストレージに取り組んでいる同僚がこれを見て、こう言いました。「ストレージ使用率は 93% 近くまで達しており、まだデータが書き込まれています。これは、OStorage-EOS のデータ分散が非常に均一であることを示しています。」そうでない場合、データの分散が十分に均一でない場合、他のノードまたはディスクにはまだ十分なスペースがあるが、特定のディスクまたは特定のノードがいっぱいになっている可能性があります。データがまだ書き込まれている場合は、問題が発生します。

[[222254]]

では、OStorage-EOS 分散オブジェクト ストレージはどのようにしてディスク間でデータを均等に分散するのでしょうか? 「コンシステント・ハッシュ」と呼ばれるアルゴリズムが使用され、コンシステント・ハッシュをベースに、重み、レプリカ、キャビネット認識、地域認識などのメカニズムを追加して改良が行われたことが判明しました。

コンシステント・ハッシュ・アルゴリズムは分散システムの分野でも古典的なアルゴリズムであり、多くの場所で使用されています。一緒に見てみましょう:

ハッシュ関数

一貫性ハッシュについて詳しく説明する前に、まず基本的なハッシュについて説明し、ハッシュ関数を使用してオブジェクトが保存されている場所を決定する方法の例を示します。

まず、データを見つけるための比較的簡単な方法を見てみましょう。 MD5 アルゴリズムを使用してオブジェクトの論理的な場所のハッシュ値を取得し、それを使用可能なディスクの数で割って余りを取得します。 ***残りの値をドライブ ID にマップします。

たとえば、オブジェクトの保存場所は /accountA/container1/objectX で、データの保存には 4 つのディスクが使用され、これをディスク 0 からディスク 3 と呼びます。ここでは、まず MD5 値を計算します。

  1. md5 -s /アカウントA/コンテナ1/オブジェクトX
  2. MD5 ( "/アカウント/コンテナ/オブジェクト" ) =
  3. f9db0f833f1545be2e40f387d6c271de

次に、ハッシュ値 (16 進数値) をディスクの数で割り、余り (モジュロ) を算出します。上記の 16 進数値は次のように 10 進数値に変換されます。

332115198597019796159838990710599741918

モジュロ関数は、ほとんどのプログラミング言語で % 演算子を使用して表されます。

332115198597019796159838990710599741918 % 4 = 2

余りが 2 なので、オブジェクトはディスク 2 に保存されます。

このアルゴリズムの最大の欠点は、計算結果が除数、つまりディスクの数に依存することです。ディスクが追加または削除されるたびに (除数が変化すると)、同じオブジェクトが異なる剰余を取得し、異なるディスクにマップされる可能性があります。これを説明するために、次の表は、ディスクが追加されたときにどのディスクがオブジェクトの新しい保存場所になるかを示しています。

ほとんどの場合、新しいディスクが追加されるたびに、オブジェクトを新しいディスクに移動する必要があることに注意してください。これは 1 つのオブジェクトの場合のみです。この動作が一般化されると、ノードまたはディスクを追加または削除するときに、クラスター内のほぼすべてのデータを移動する必要があります。クラスターはこれらの移行を実行するために多大なリソースを費やす必要があり、これにより大きなネットワーク負荷が発生し、データが読み取り不能になります。

一貫性ハッシュアルゴリズム

一貫性ハッシュを使用すると、クラスターにディスクやノードを追加または削除するときに移動する必要があるオブジェクトの数を減らすことができます。一貫性ハッシュは、各値を直接ディスクにマッピングするのではなく、すべての可能なハッシュ値をリングとしてモデル化することによって機能します。一貫性ハッシュ アルゴリズムは、オブジェクトのハッシュを計算するだけでなく、デバイスのハッシュも計算します。ハッシュ値は、ディスクの IP アドレス、ドライブ文字などに基づいて計算されます。図に示すように、各ディスクはハッシュ リング内のポイントにマップされます。

オブジェクトを保存する必要がある場合、まずオブジェクトのハッシュ値が計算され、次に図の「オブジェクトのハッシュ」の位置に示すようにリング上に配置されます。システムは、リング上の次のディスクのハッシュを時計回りに検索し、そのディスクを見つけて、このディスクを使用してデータを保存します。上の図からわかるように、オブジェクトはディスク 4 に保存されます。このアルゴリズムに従って、ハッシュ リング上の特定の間隔のハッシュ値がディスクにマッピングされます。図に示すように、異なる間隔とそれに対応するディスクを表すために異なる色を使用します。オブジェクトのハッシュ値が青い間隔内に収まる場合、そのオブジェクトはディスク 1 に保存されます。

このようなハッシュ リングでは、ディスク 5 などの新しいディスクを追加すると、図のピンク色の部分はディスク 4 に属しなくなります。これは、この部分のデータがすべて新しいディスク 5 に属するようになるためです。したがって、ディスク 4 上のオブジェクトはディスク 5 に移動されますが、他のデータは影響を受けません。

このソリューションを使用すると、ディスクまたはノードを追加するときに少量のデータの移動のみが必要になります。これは、大量のデータを移動する必要があるデータ保存場所を決定するためにハッシュ値の計算とモジュロ除算に依存する以前の最も基本的なソリューションよりもはるかに優れています。

実際のアプリケーションで使用される一貫性のあるハッシュ アルゴリズムでは、実際の各ディスクまたはノードはリング上の複数のタグに対応します。これらのタグは、一部の文献では「仮想ノード」とも呼ばれます。実際のアプリケーションでは、ディスクは多数のタグ/仮想ノードに対応し、各ディスクも数百のタグに対応します。複数のタグは、各ディスクの対応するリングのハッシュ値の範囲が、大きな領域からいくつかの小さな領域に分割されることを意味します。これには2つの効果があります。 1 つは、新しく追加されたディスクが複数のディスクからオブジェクト データを移行する可能性があるため、データ移行の負担がさらに軽減されることです。もう 1 つの効果は、全体的なデータ分布がより均一になることです。

上記はコンシステントハッシュの基本原則です。 OStorage-EOS は、一貫性のあるハッシュ アルゴリズムに基づいてデータの均一な分散を実現し、レプリカ、重み、キャビネット認識、地域認識などのメカニズムを導入することでこれを改善し、エンタープライズ レベルのユーザーのニーズを満たします。

<<:  AMD スコット・アイラー: EPYC 3000 および Ryzen V1000 シリーズ組み込みプロセッサによるエッジ コンピューティングの高速化

>>:  分散ストレージシステムにおけるDHTアルゴリズムの改善

推薦する

データの心配は無用、一発で学習:CKA 認定に不可欠な etcd のバックアップと復元のヒントをマスターしましょう。

etcd は、すべての Kubernetes クラスター データのバックエンド データベースとして使...

地域不動産ウェブサイトの3つの運用リスクの簡単な分析

地方不動産ネットワークの運営ターゲットは非常に明確で、つまり、住宅を購入して装飾する準備をしている一...

Baidu ニュース: Baidu 検索結果の新たな変更

昨夜、百度がアップデートした後、ウェブサイトの包含とバックリンクが増加し、百度の検索結果にも多くの変...

Canalys:中国のクラウドサービス支出は2021年第1四半期に60億ドルに達した

市場調査会社Canalysが発表した最新データによると、中国のクラウドインフラサービス支出は2021...

鉄道省は、12306ウェブサイトでチケットを予約するのが難しいのは、内部予約の利便性によるものだという主張を否定している。

パソコンのCドライブにレコードを追加するだけで、12306チケット購入サイトに即座にログインできます...

LeEco Holdingsからの投資によりワインB2Cオンラインワインウェブサイトが開設

12月3日午前のニュース、LeTV Holdingsが投資したワインB2CプラットフォームWangj...

Namecheap-ドメイン名の移転は 3.98 ドル、SSD ホスティングは 1 年間 10 ドル

2月2日、Namecheap.comは、.com、.net、.org、.biz、.infoドメイン名...

Silu.com CEOは著作権侵害で懲役5年の判決を受けたが、有罪を認めず、厳しい処罰を受けた。

周志全氏は法廷で判決を聞いている。写真は北京タイムズ記者の浦東風氏による撮影高画質ビデオ愛好家にとっ...

新しい SEO コンセプト - ブランド力で SEO を推進し、双方にメリットのある状況を実現

私の同僚の SEO 担当者は、Baidu がユーザー エクスペリエンスを非常に重視しており、コンテン...

joesdatacenter-Server$41/デュアルチャネル X5650/12g メモリ/1T ハードディスク/20T トラフィック/5IP

joesdatacenterは2008年からサーバー事業を展開しており、独自のカンザスデータセンター...

エッジコンピューティングの大きな可能性: 16 人の技術専門家の意見

エッジコンピューティングはテクノロジーの世界でホットな話題です。この急速に発展しているテクノロジーに...

ユーザーエクスペリエンスがウェブサイトのランキングを決定する

ユーザー エクスペリエンスによって、Web サイトのランキングと人気が決まります。以前は、Web サ...

主流のブラウザが「Do Not Track」をサポート:ターゲット広告は大きな打撃を受ける可能性がある

ブラウザのトラッキングを無効にする主要ブラウザは、ターゲット広告を配信する企業にとって大惨事となる可...

onevps: シンガポール直接接続 VPS レビュー、1Gbps 帯域幅/10T トラフィック

onevpsはどうですか? onevps ping、onevps テスト、onevps の速度はどれ...

物理マシンと仮想マシンでは、K8s 環境でコンテナを実行するのにどちらが適していますか?

[[319956]] K8S 環境でコンテナを物理マシン上で直接実行するか、分離された仮想マシン上で...