分散ストレージの技術動向(I):3つのレプリカの欠点

分散ストレージの技術動向(I):3つのレプリカの欠点

分散ストレージの SDS コンセプトは優れており、水平拡張機能が優れており、ノードの自動追加と削除が利点ですが、従来の集中型ストレージ (ディスク アレイ) と比較すると、安定性とパフォーマンスにはまだ明らかな欠点があります。 Ceph や VSAN に代表されるソフトウェア定義ストレージ (SDS) は、市販の x86 サーバー、ソリッド ステート ドライブ、機械式ハード ドライブなどのハードウェア リソースをシン プロビジョニングされたリソース プールに統合し、ブロック ストレージ、ファイル ストレージ、オブジェクト ストレージ、Restful API などのさまざまなインターフェイスを通じてストレージ サービスを提供する、水平方向に拡張可能で、自動的にバランス調整され、自己修復する分散ストレージ システムです。

Ceph、VSAN、またはその進化版のいずれであっても、ネットワーク RAID を使用して 3 つのコピーまたは消去コードで表されるデータ保護を実現するという共通の技術的特徴があります。 3 つのコピーは、小さなデータ ブロックの読み取りおよび書き込みパフォーマンスに特定の要件があるアプリケーション シナリオで使用されますが、消去コードは、ビデオ データ、バックアップ、アーカイブなどの大きなファイルのシナリオに適しています。 3 つのコピーを例にとると、ビジネス データは固定サイズ (通常 4 MB) のデータ ブロックに分割されます。各データ ブロックは、異なるノード上の 3 つのコピーに保存されます (図 1 を参照)。分散メカニズムは、コンシステント ハッシュ アルゴリズム (Consistent Hashing) または CRUSH アルゴリズムに基づいており、データの各コピーを異なるノードと異なるディスクにランダムに分散して、自動データ バランスと水平拡張を実現します。ディスクまたはノードに障害が発生したり破損したりすると、システムは事前に設定されたルールに基づいてデータの新しいコピーを自動的に再作成します。これをデータ再構築と呼びます。


図1 分散ストレージレプリケーションのメカニズム

分散ストレージの SDS コンセプトは優れており、水平拡張機能が優れており、ノードの自動追加と削除が利点ですが、従来の集中型ストレージ (ディスク アレイ) と比較すると、安定性とパフォーマンスにはまだ明らかな欠点があります。

まず、パフォーマンスの面では、3 つのコピーの分散ストレージは、不均一な IO 分散とバレル効果の影響を受けやすく、大きな遅延と応答の低速化につながります。 Ceph を例にとると、複数の基本ストレージ ユニットである Placement Group (PG) が OSD にカプセル化され、各 OSD は機械的なハード ディスク HDD に直接対応します。主流の 7200 rpm HDD はロボット アームのアドレス指定によって制限されており、単一ディスクの読み取りおよび書き込みパフォーマンスはわずか 120 IOPS 程度です。データは OSD 上でランダムに分散されるため、単一のハードディスク上の IO 負荷は平均値に固定されず、通常は正規分布を示します。正規分布のテール効果により、少数の HDD の IO 負荷が平均値と単一ディスクのパフォーマンスしきい値を大幅に超過し、輻輳が発生します。さらに、データの整合性を確保するために、分散ストレージはデータの整合性チェック、つまりデータ スクラブ/ディープ スクラブ操作を定期的に実行する必要があります。これらの操作により追加の IO 負荷が発生し、ディスクの輻輳が悪化する可能性があります。バケツ効果の原理によれば、システムのパフォーマンスはクラスター内で最もパフォーマンスの低いディスクに依存します。したがって、個々のディスクが遅いと、システム全体のパフォーマンスが大幅に低下します。結果として、大きな遅延、OSD 疑似停止、不要なデータ再構築のトリガーが発生する可能性があります。

第二に、3 つのコピーの分散ストレージも安定性の問題に直面しています。ストレージ拡張、ハードディスクまたはノードの損傷、ネットワーク障害、OSD 疑似停止、ディープスクラブなどの複数の要因が組み合わさると、複数の OSD が同時に再構築され、再構築ストームが発生する可能性があります。データ再構築プロセス中、再構築タスクはシステムのメモリ、CPU、およびネットワーク リソースを消費するだけでなく、ストレージ システムに追加の IO ワークロードをもたらし、ユーザー ワークロード用のストレージ リソースを圧迫します。この場合、ユーザーは、システムの IO 遅延が大きく、応答が遅いことに気付くことが多く、少なくとも業務の中断を引き起こす可能性があります。深刻な場合には、システムが不安定な状態に陥り、OSD が繰り返しフリーズして再起動し、データの損失やシステムクラッシュにつながる可能性もあります。

さらに、3 つのコピーの分散ストレージでは、データ損失のリスクも発生します。 3 つのコピーにより、最大 2 台の HDD が同時に損傷するのを防ぐことができます。システムが拡張モードの場合、またはノードがメンテナンス モードの場合、HDD に障害が発生すると、システムは緊急状態になります。 2 台の HDD が同時に故障すると、データが失われる可能性があります。ある程度の規模のストレージ システムでは、特にシステムの稼働開始から 2 ~ 3 年経過すると、2 つのハードディスクの機械的な障害が同時に発生することは避けられません。ハードウェアが古くなると、二重または三重のディスク障害が発生する可能性が急激に増加します。さらに、システムで大規模な停電やストレージノードの予期せぬダウンタイムが発生すると、複数の機械式ハードディスクが同時に損傷し、3 コピー分散ストレージのデータセキュリティが危険にさらされる可能性があります。

3 つのコピーに潜む危険とリスクに対処する準備はできていますか?詳細については、「分散ストレージの技術動向(II):デュアルRAID」をご覧ください。

<<:  .NET で Kafka を使用する方法

>>:  Kingsoft Cloud City Brainが始動:市長と市民の視点からデジタル経済の発展を促進

推薦する

クラウドベース(物理)サーバーの10%割引:米国cn2 gia 100M-1750元/月、香港cn2高防御(20M帯域幅)-1782元/月、国内100G高防御(20M帯域幅)-649元/月

Yunji を選んでサポートしていただいた膨大な数のお客様への感謝の気持ちを表すため、Yunji は...

ウェブサイトのBaiduの重みは本当ですか?

阿成氏のブログインタラクティブSEOはオープンしてから12日目を迎えました。この間、彼はテーマのいく...

調査と市場:世界のIaaS関連収益は2025年に429億ドルに達する

12月31日、市場調査会社Research and Marketsが発表した最新のレポートによると、...

hosthatch ロサンゼルス VPS はいかがでしょうか?詳細な評価、測定データの共有

ホストハッチはどうですか?ホストハッチロサンゼルスはどうですか?米国のHosthatchロサンゼルス...

UltraVPS: 2 ユーロ/kvm/512m メモリ/15g SSD/500g トラフィック/ドイツ

UltraVPS.eu は、実際には 1999 年に設立された Bradler & Kran...

福州警察はフィッシングサイトのソースコードを作成して販売していたグループを壊滅させた

記者が昨日、市公安局から得た情報によると、警察は6か月以上の綿密な捜査を経て、1日にフィッシングサイ...

主流のウェブマスターツールの分析

ウェブマスターツールは、すべてのウェブマスターが頻繁に使用するものであり、SEOに不可欠なツールであ...

クラウド ネイティブ エコシステムをナビゲートするための CTO ガイド

コンテナとクラウド コンピューティングのテクノロジが成熟する一方で、企業の CTO は、すべてがスム...

friendhosting: 米国南東部マイアミデータセンターのVPSの簡単なレビュー、実際のテストデータの共有

friendhosting VPSには9つのデータセンターがありますが、国内での使用に適しているのは...

Shein が成功したのは SEO のおかげですか?

今年最も人気のある独立系ブランドのウェブサイトは、間違いなく shein.com でしょう。今年上半...

シンガポールサーバー: zenlayer、30% 割引、月額 160 ドルから、最大 10Gbps の帯域幅、リソースは自由にカスタマイズ可能

Zenlayer は、東南アジアの非常に重要なネットワークハブであるシンガポールに独自のデータセンタ...

ブログ執筆のための語学力

言語はパンやミルクではありません。どうすればそれを見たり触れたりできるのでしょうか?言語は食べられな...

検索は新たな三国時代へ:360が百度を攻撃し、Sogouが反撃

8月29日午後4時、奇虎360は公開書簡を発表し、自社の検索機能を強調しながらも「独占禁止法」の旗を...

ローカルウェブサイトを運営する4つの方法

人がいる世界があるなら、世界があるところにはどこにでもローカル Web サイトが存在します。おそらく...

「正確なコミュニケーション」を目的としないWeiboマーケティングは単なるフーリガン行為

みなさんこんにちは。顧旭です。Weiboマーケティングは、近年Weiboの人気とともに登場した新しい...