分散ストレージの技術動向(II):デュアルRAIDメカニズム

分散ストレージの技術動向(II):デュアルRAIDメカニズム

[[386284]]

3 つのコピーを持つ分散ストレージが直面するパフォーマンスの問題、安定性、信頼性の欠陥を解決するために、Daoentropy の Tierlis 分散ストレージはデュアル RAID 保護メカニズムを採用しています。前回の記事では、分散ストレージの基本原則について説明し、3 つのコピーを持つ分散ストレージの潜在的なリスクを分析しました。

  • パフォーマンスの問題: 3 つのコピーの分散ストレージは、不均一な IO 分散とバレル効果の影響を受け、大きな遅延と応答の低速化を引き起こします。
  • 安定性の問題: 頻繁なデータ再構築はユーザー サービスに影響を与えたり、業務の中断を引き起こしたりする可能性があります。
  • データ損失のリスク: 特に、ハードウェアが老朽化したり、大規模な停電や予期しないノードのダウンタイムが発生すると、複数の機械式ハードドライブが同時に損傷し、3 つのコピーを持つ分散ストレージのデータ セキュリティが危険にさらされる可能性があります。

3 コピー分散ストレージが直面するパフォーマンスの問題、安定性、信頼性の欠陥を解決するために、Daoentropy の Tielishi 分散ストレージはデュアル RAID 保護メカニズムを採用しています。 Tielishi は、ネットワーク RAID (ノード間レプリカ、ノード間消去コード) とデータの一貫したハッシュランダム分散の特性を継承するだけでなく、図 2 に示すように、ディスクアレイ独自のノード内 RAID テクノロジとストレージ仮想化 (プーリング) 管理テクノロジである Storage Virtualization Manager (SVM) を分散テクノロジと組み合わせています。


図2 OneStack分散ストレージデュアルRAIDメカニズム

ネットワークレイドテクノロジー

Titlis 分散ストレージでは、各データ ブロックは、一貫性のあるハッシュ アルゴリズムに従って 2 つの異なるストレージ ノードをランダムに選択し、データのコピーを 2 つ保存します。これにより、いずれかのノードがダウンした場合でも、読み取りおよび書き込み操作を保証するデータ コピーが残り、高いビジネス可用性とデータ セキュリティが確保されます。

ノード内RAIDテクノロジー

Titlis 分散ストレージの各ノードでは、SVM ストレージ仮想化テクノロジーを通じてノード内に RAID データ保護が実装されています。 RAID レベルは、ミラーリング、またはストレージ効率の高い RAID5 または 6 にすることができます。ノード内 RAID 保護は、単一または複数のハードディスクの損傷に耐えることができ、障害修復はノードに限定され、ネットワーク データの再構築をトリガーすることなく、ネットワーク再構築ストームを効果的に回避します。

ノード内 RAID とネットワーク RAID (ノード間レプリカ/EC コード) テクノロジーを組み合わせることで、Titlis はデュアル RAID データ保護を実現します。 3 つのコピー アーキテクチャでは、3 つのディスクが同時に故障または破損すると、データが失われる可能性があります。デュアル RAID アーキテクチャでは、各ノードで同時に 1 つのディスクに障害が発生しても、データは安全に保たれ、ビジネスは継続されます。分散ストレージには数十または数百のストレージ ノードが含まれる可能性があることを考慮すると、ダブル RAID のデータ信頼性は 3 つのコピー アーキテクチャよりも大幅に高くなります。

ストレージ仮想化テクノロジー

Tilis は各ストレージ ノード上のストレージ仮想化管理ソフトウェア (SVM) 上で実行され、ノードのストレージ リソースを均一に管理されたストレージ プールに統合し、分散システムに vOSD リソースを提供します。 SVM はワイド ストライプ メカニズム (図 3 を参照) を使用して、ノードの各ディスク上の各 vOSD のワークロードを均等に分散し、単一の vOSD の IOPS 機能を大幅に向上させ、3 つのコピーの分散ストレージにおける不均一な IO 分散に効果的に抵抗します。

図3 ノード内のRAIDストライピングメカニズム

SVM ストレージ プールは、ノード内の複数の RAID グループで構成され、仮想ボリュームを通じて上位層分散システムに vOSD ストレージ サービスを提供します。各 vOSD は、3 つのレプリカ内の物理 HDD によってホストされる OSD に対応します。分散一貫性ハッシュ アルゴリズムによって割り当てられたデータ ブロックは、物理ハード ディスクに直接書き込まれるのではなく、SVM ストレージ プール内の仮想ボリュームによってバックアップされた vOSD に書き込まれます。 SVM は、ワイド ストライピング テクノロジを使用して、各物理ディスク上の vOSD のワークロードを均等に分散します。4 MB の各 vOSD オブジェクト データ ブロックは 32 KB のデータ ブロックに分割され、RAID グループの論理アドレス空間に順番に配置されます。 SVM は、各 RAID グループの論理アドレス空間に対して順次書き込み最適化戦略を採用しています。最初の書き込みでは、各グループの論理アドレスに従ってアドレス空間が割り当てられ、データが順番に書き込まれます。後続の書き換えでは、まず空きアドレス空間が埋められ、ハードディスクのシーケンシャル アドレス指定が可能な限り実現されます。これにより、機械式ハードディスクの低速なアドレス指定操作の回数が最小限に抑えられ、機械式ハードディスクの高速なシーケンシャル書き込み速度を利用して IO パフォーマンスが向上します。

セカンダリDRAM+フラッシュキャッシュアクセラレーション

ディスク アレイにおける一般的なパフォーマンス高速化方法は、共有キャッシュ高速化です。中~ハイエンドのディスク アレイとローエンドのディスク アレイのパフォーマンスの主な違いは、コントローラの数に加えて、キャッシュ アクセラレーション機能です。一般的なミッドエンドからハイエンドのディスク アレイは、512 GB から 1 TB の範囲の共有キャッシュ アクセラレーションをサポートできます。 Titlis はディスク アレイの設計を活用し、SVM 仮想化を通じて DRAM とフラッシュを組み合わせたセカンダリ キャッシュ アクセラレーションを実装します。適応型アルゴリズムにより、動的または静的なホット データ (高頻度の読み取りおよび書き込みまたは最近の読み取りおよび書き込みデータ) を自動的に識別し、最もホットなデータを最も低いレイテンシで DRAM に保存し、2 番目にホットなデータを大容量のフラッシュベースのソリッド ステート ドライブに保存します。分散技術のサポートにより、大容量の分散型二次キャッシュシステムが形成されます。ミッドエンドからハイエンドのディスクアレイと比較すると、Titlis 分散ストレージ システムは数十 TB、さらには 100 TB を超える分散キャッシュをサポートします。これは、キャッシュ容量の 10 倍、さらには 100 倍に相当します。

データ整合性検証とデータ自己修復

SVM ストレージ仮想化管理は、WAFL (NetApp)、Btrfs (SuSE)、ZFS (Oracle)、Storage Spaces (Microsoft) などのファイル システムの高度な経験を活用します。基盤となるストレージ内の各データ ブロックに 256 ビットのチェックサムを追加し、それをソリッド ステート ドライブ イメージのペアに個別に保存して、オンラインでのデータ整合性の検証を高速化します。チェックサムによってデータが破損していることが検出されると、ノード内の RAID 機能によってデータを自己修復できます。この機能を使用すると、ハードウェア障害をすばやく特定し、自動的に分離することができます。

デュアル RAID の詳細については、「分散ストレージの技術動向 (パート 3): デュアル RAID とトリプル レプリカ」をご覧ください。

<<:  Kingsoft Cloud City Brainが始動:市長と市民の視点からデジタル経済の発展を促進

>>:  分散ストレージの技術動向(第3部): デュアルRAIDメカニズムとトリプルレプリカ

推薦する

おすすめ: uk2 ホスティング 50% オフ/3 つの無料ドメイン名/独立 IP/トップ ブランド

英国最大手のインターネット企業UK2グループの公式フラッグシップブランドUK2では、仮想ホスティング...

SEO検索エンジン最適化の限界についても

SEO 業界で働く友人は、必ず次の 2 つの似たような質問をされるでしょう: 1. 私の Web ペ...

コラボレーションオフィスSKYCC複合マーケティングソフトウェアと通常のマーケティングソフトウェアのどちらが優れていますか?

インターネットの急速な発展に伴い、ますます多くの企業がオンライン マーケティング業界に参入し、さまざ...

ユーザーエクスペリエンスにおけるいくつかの誤解と、それを効果的に回避してコンバージョン率を向上させる方法について簡単に説明します。

今日、インターネットはユーザーエクスペリエンスにますます注目しています。一部の大規模なウェブサイトは...

spinservers: 50% オフ、2*40Gbps 超大容量帯域幅の米国専用サーバー、2*e5-2690v4/256gDDR4/3.84TNVMe

spinservers は現在、米国ダラスのコア データ センターにある高帯域幅サーバーを 50% ...

電子商取引サイトのプロモーションモデルを共有する

電子商取引サイトは、その運営形態によって、大きく分けて、上場準備を進めており、多額の資本注入を受ける...

不倫サイト「アシュレイ・マディソン」が香港に上陸、大きな需要が見込まれる

2日前、「3つの不健全な価値観」を持ち、不倫のための出会い系プラットフォームとして世界的に有名なウェ...

Avia Solutions Groupは航空部品のオンライン流通の先駆者です

世界的な航空サービス持株会社であるAvia Solutions Groupは、子会社のLocator...

モモのトラフィック戦略:ゲートキーパーの構築とロングテールの創出

昨年末、360創始者の周紅一氏は「インターネット階級の強化」という概念を何度も提唱した。インターネッ...

ファイリングとコンピュータルームの切断とウェブサイトの運用とSEOの分析

最近のネットワーク障害は、ウェブマスターにとって厳しい時期だと言えます。私も例外ではありません。私の...

Expedia が AWS に全面的に参入

[51CTO.com からのオリジナル記事] AWS は本日、世界的なオンライン旅行会社 Exped...

SAPと提携し、Houhou Technologyがインテリジェント製造の夢を実現

2016年に設立されたHouhou Technologyは非常に興味深い会社です。当社の中国語正式名...

racknerd: すべての VPS が 30% オフ (最低 $16/年)。さらに「赤い封筒」イベントを利用して、超お得な VPS を安く購入することもできます。

旧正月期間中、Racknerd は 30% オフのプロモーションを実施しています。これは、公式の通常...

企業がSEOを選択する将来展望は?

この記事は、この地域の企業に基づいて書かれています。多くの企業は、SEO を選択することで会社にどの...

oplink: 月額 3.48 ドル、ヒューストン VPS、2G メモリ/1 コア (Ryzen 3900x)/50g NVMe/10T トラフィック/10Gbps 帯域幅/100G 高防御

米国ヒューストンの老舗サーバーベンダー「Oplink」は現在、VPS事業において最初の6ヶ月間は50...