分散ストレージの技術動向(I):3つのレプリカの欠点

分散ストレージの技術動向(I):3つのレプリカの欠点

分散ストレージの SDS コンセプトは優れており、水平拡張機能が優れており、ノードの自動追加と削除が利点ですが、従来の集中型ストレージ (ディスク アレイ) と比較すると、安定性とパフォーマンスにはまだ明らかな欠点があります。 Ceph や VSAN に代表されるソフトウェア定義ストレージ (SDS) は、市販の x86 サーバー、ソリッド ステート ドライブ、機械式ハード ドライブなどのハードウェア リソースをシン プロビジョニングされたリソース プールに統合し、ブロック ストレージ、ファイル ストレージ、オブジェクト ストレージ、Restful API などのさまざまなインターフェイスを通じてストレージ サービスを提供する、水平方向に拡張可能で、自動的にバランス調整され、自己修復する分散ストレージ システムです。

Ceph、VSAN、またはその進化版のいずれであっても、ネットワーク RAID を使用して 3 つのコピーまたは消去コードで表されるデータ保護を実現するという共通の技術的特徴があります。 3 つのコピーは、小さなデータ ブロックの読み取りおよび書き込みパフォーマンスに特定の要件があるアプリケーション シナリオで使用されますが、消去コードは、ビデオ データ、バックアップ、アーカイブなどの大きなファイルのシナリオに適しています。 3 つのコピーを例にとると、ビジネス データは固定サイズ (通常 4 MB) のデータ ブロックに分割されます。各データ ブロックは、異なるノード上の 3 つのコピーに保存されます (図 1 を参照)。分散メカニズムは、コンシステント ハッシュ アルゴリズム (Consistent Hashing) または CRUSH アルゴリズムに基づいており、データの各コピーを異なるノードと異なるディスクにランダムに分散して、自動データ バランスと水平拡張を実現します。ディスクまたはノードに障害が発生したり破損したりすると、システムは事前に設定されたルールに基づいてデータの新しいコピーを自動的に再作成します。これをデータ再構築と呼びます。


図1 分散ストレージレプリケーションのメカニズム

分散ストレージの SDS コンセプトは優れており、水平拡張機能が優れており、ノードの自動追加と削除が利点ですが、従来の集中型ストレージ (ディスク アレイ) と比較すると、安定性とパフォーマンスにはまだ明らかな欠点があります。

まず、パフォーマンスの面では、3 つのコピーの分散ストレージは、不均一な IO 分散とバレル効果の影響を受けやすく、大きな遅延と応答の低速化につながります。 Ceph を例にとると、複数の基本ストレージ ユニットである Placement Group (PG) が OSD にカプセル化され、各 OSD は機械的なハード ディスク HDD に直接対応します。主流の 7200 rpm HDD はロボット アームのアドレス指定によって制限されており、単一ディスクの読み取りおよび書き込みパフォーマンスはわずか 120 IOPS 程度です。データは OSD 上でランダムに分散されるため、単一のハードディスク上の IO 負荷は平均値に固定されず、通常は正規分布を示します。正規分布のテール効果により、少数の HDD の IO 負荷が平均値と単一ディスクのパフォーマンスしきい値を大幅に超過し、輻輳が発生します。さらに、データの整合性を確保するために、分散ストレージはデータの整合性チェック、つまりデータ スクラブ/ディープ スクラブ操作を定期的に実行する必要があります。これらの操作により追加の IO 負荷が発生し、ディスクの輻輳が悪化する可能性があります。バケツ効果の原理によれば、システムのパフォーマンスはクラスター内で最もパフォーマンスの低いディスクに依存します。したがって、個々のディスクが遅いと、システム全体のパフォーマンスが大幅に低下します。結果として、大きな遅延、OSD 疑似停止、不要なデータ再構築のトリガーが発生する可能性があります。

第二に、3 つのコピーの分散ストレージも安定性の問題に直面しています。ストレージ拡張、ハードディスクまたはノードの損傷、ネットワーク障害、OSD 疑似停止、ディープスクラブなどの複数の要因が組み合わさると、複数の OSD が同時に再構築され、再構築ストームが発生する可能性があります。データ再構築プロセス中、再構築タスクはシステムのメモリ、CPU、およびネットワーク リソースを消費するだけでなく、ストレージ システムに追加の IO ワークロードをもたらし、ユーザー ワークロード用のストレージ リソースを圧迫します。この場合、ユーザーは、システムの IO 遅延が大きく、応答が遅いことに気付くことが多く、少なくとも業務の中断を引き起こす可能性があります。深刻な場合には、システムが不安定な状態に陥り、OSD が繰り返しフリーズして再起動し、データの損失やシステムクラッシュにつながる可能性もあります。

さらに、3 つのコピーの分散ストレージでは、データ損失のリスクも発生します。 3 つのコピーにより、最大 2 台の HDD が同時に損傷するのを防ぐことができます。システムが拡張モードの場合、またはノードがメンテナンス モードの場合、HDD に障害が発生すると、システムは緊急状態になります。 2 台の HDD が同時に故障すると、データが失われる可能性があります。ある程度の規模のストレージ システムでは、特にシステムの稼働開始から 2 ~ 3 年経過すると、2 つのハードディスクの機械的な障害が同時に発生することは避けられません。ハードウェアが古くなると、二重または三重のディスク障害が発生する可能性が急激に増加します。さらに、システムで大規模な停電やストレージノードの予期せぬダウンタイムが発生すると、複数の機械式ハードディスクが同時に損傷し、3 コピー分散ストレージのデータセキュリティが危険にさらされる可能性があります。

3 つのコピーに潜む危険とリスクに対処する準備はできていますか?詳細については、「分散ストレージの技術動向(II):デュアルRAID」をご覧ください。

<<:  .NET で Kafka を使用する方法

>>:  Kingsoft Cloud City Brainが始動:市長と市民の視点からデジタル経済の発展を促進

推薦する

インターネットの伝説:ジャック・マーへの投資を逃した人々

【要点】今日のインターネット業界の競争者であり、資金ハンターである馬化騰は、かつてアリババに投資する...

割れた口紅と青ショウマの事件からブランドのマーケティングを分析

誤って彼女の口紅を40本以上壊してしまったら、間違いなく死刑宣告です(絶望の笑み)。敬虔な気持ちで三...

ウェブサイトは完全には含まれていません。SEOファッションの専門家がその裏話を明らかにします

最近では、インターネット上にウェブサイトを作成するためのソフトウェアがますます増えています。ウェブサ...

独自のバイラルマーケティングシステムを素早く構築する方法

1. バイラルマーケティングシステムの定義:いわゆるバイラル マーケティング システムとは、簡単に言...

ソーシャルメディアのマーケティング目標についての簡単な説明

ソーシャル メディア マーケティング キャンペーンを開始する前に、目標を明確に定義し、何を達成したい...

IaaS、PaaS、SaaS の違いは何ですか?

[51CTO.com クイック翻訳] 時間が経つにつれて、クラウド コンピューティング テクノロジー...

旧車ウェブサイトの戦略的思考を覆し、現在の車ウェブサイトを破壊する方法

「Autohomeがすごいのではなく、他のウェブサイトが怠惰すぎる」と「自動車ウェブサイトの致命的な...

無料のオープンソースウェブサイト構築システム選択ガイド モバイルファーストのウェブサイト構築はWordPressの第一選択です

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますモバイルフ...

Kubernetes で Minecraft を実行する

休暇中に、ずっと前から話題になっていたMinecraftを子供たちにインストールしてみました。それを...

クラウド vs. ローカル: 複雑な ERP 環境

——24KピュアクラウドERPがここにあります。一見すると、伝統的な地元のものの影がいたるところに見...

検察はQQアカウント盗難と詐欺の背後にある闇産業チェーンを暴露

まずQQアカウントを盗み、次にアカウント所有者になりすましてQQの友人からお金を借り、さらには「身元...

これらのクラウドコンピューティング市場セグメントは2018年にさらなる成長の余地がある

2017 年、世界のクラウド コンピューティング市場は成長を続け、大手企業は市場シェアと市場領域を獲...

618、李嘉奇の「包囲と鎮圧」

5月31日午後8時、618イベントは最終支払いと現物商品の受け取りとともに正式にスタートしました。こ...

分散クラウドコンピューティングとデータガバナンスの詳細な説明

さまざまな種類のデータが複数のデータ チャネルを通じてリアルタイムで大量に流入し始めると、データ管理...