従来のストレージと分散ストレージの対立

従来のストレージと分散ストレージの対立

1. 従来のストレージシステムの過去と現在

1. 途中のストレージハードウェア

従来のストレージ システムの過去と現在を理解したい場合は、ストレージ デバイスから始めるのが良い選択です。ストレージ ハードウェアに関して最も一般的なものは、ハード ドライブ、メモリ、ソリッド ステート ドライブ、フラッシュ メモリなどです。ハード ドライブとメモリは、比較的初期のストレージ メディアです。

[[249876]]

初期のハードドライブは非常に大きく、単位面積あたりに保存できるデータの量は非常に限られていました。しかし、技術の発展に伴い、ストレージ密度は徐々に増加し、ストレージコストは年々減少しています。初期のストレージ システムの主な焦点は、ストレージ デバイスのコスト削減と単位面積あたりのストレージ容量の増加にありました。ストレージ技術の進歩により、ストレージ ハードウェアの開発速度は通信や CPU の開発速度に追いつきました。主要なストレージ技術は変化しました。上位レベルのストレージ管理システムが、ストレージ システム全体のコストに占める割合はますます大きくなっています。ストレージメディア自体については、長年の発展を経て、従来の HDD に加え、新興のストレージメディアのストレージ密度は年々増加し、一方でストレージ単価は年々低下しています。読み取りおよび書き込み効率に関して言えば、SSD のランダム読み取りおよび書き込み効率は HDD よりもはるかに高くなります。 RAM は、これらのストレージ メディアの中で最も高い読み取りおよび書き込み効率を備えています。ただし、RAM は停電によりデータが失われるリスクがあります。高い信頼性が求められるシステムでは、永続的なストレージ デバイスが依然として必要です。そこで、RAMの欠点を補うためにNVMが登場しました。新しいストレージ デバイスの出現は、必然的に上位レベルのストレージ システムの設計と実装に影響を与えます。

2. 従来のストレージシステムの普及

2.1 単一マシンストレージへのステップバイステップのアプローチ

初期のストレージ デバイスは CPU によって直接制御されていましたが、これには多くの問題がありました。その後、追加のストレージ制御ユニットが導入されました。 CPU は I/O 命令を通じてハードディスクを制御しました。同時に、制御ユニットは、CPU、メモリ、およびディスクの速度の不一致を軽減するためのキャッシュ メカニズムも提供しました。データのサイズが大きくなるにつれて、ストレージに対する需要が高まり、単一のディスクのストレージでは、一部のビッグデータ シナリオのニーズを満たすことができなくなります。その後、RAIDが登場しました。多数の安価なディスクから構成され、巨大なディスク グループを形成し、個々のディスクによって提供されるデータの付加効果を利用して、ディスク システム全体のパフォーマンスを向上させます。この方法では、データは検証されず、データの冗長バックアップも実行されません。後々、ほぼすべての IT システムで災害復旧を実行する必要があるため、データのバックアップは特に重要です。ここで、RAID は基本的なミラー バックアップに RAID1 レベルを提供し、パフォーマンスに影響を与えることなくシステムの信頼性と修復可能性を最大限に高めることができます。

2.2 ネットワークストレージは飛躍の準備が整っている

ネットワーク技術の発展に伴い、LAN 技術によってデータ転送コストが低下したため、ネットワーク ストレージが誰にとっても第一の選択肢になりました。その後、NFS は単一マシン ファイルから派生し、異なるファイルでファイル システムを共有できるようになりました。その後、NFS や CIFS などの古典的なプロトコルが誕生しました。

3. 従来のストレージの利点と欠点

すべての企業、会社、政府、公共機関は、情報構築に従来のストレージを使用しています。従来のストレージは長い歴史と成熟した技術を誇り、幅広い使用シナリオと豊富な実践経験を備えています。また、専用のストレージ機器を製造するメーカーも多数存在します。メンテナンスの観点からは、信頼性と安定性を最大限に確保するための専門的な人材がいます。さらに、従来のストレージにはより多くのデータ保護機能があり、幅広く適用できます。また、導入も比較的簡単で、ネットワーク ロジックもシンプルです。

同様に、従来のストレージは高価であり、特殊なハードウェア、特殊なライセンス、特殊なケーブル、特殊なスイッチ、特殊なボード、特殊なマルチパス ソフトウェアを購入する必要があります。メンテナンスの面では、専門の人員がいてデータ保護機能が充実しているものの、ベンダーの数が多いため(メリットとデメリットの両方)、複数のベンダーが異種ネットワークで動作している場合、メンテナンスが困難になります。

2. 分散ストレージシステムの出現

インターネットの規模が拡大し、同時リクエスト数が増加するにつれて、従来のデータベースではさまざまなシナリオのニーズを満たすことができなくなり、分散ストレージシステムが誕生しました。

1. 従来のストレージシステムと比較した分散ストレージシステムの利点

①高性能

通常、読み取りキャッシュと書き込みキャッシュを効率的に管理し、ホットスポット 2 をキャッシュにマッピングすることで自動分散ストレージをサポートし、応答速度を向上させることができます。ホットスポットではなくなると、ストレージ システムによって削除されます。書き込みキャッシュ テクノロジーは、高速ストレージと組み合わせることで、全体的なストレージ パフォーマンスを大幅に変えることができます。データはまず特定の戦略に従って高速ストレージに書き込まれ、その後適切なタイミングでディスクに同期されます。

②分散ストレージをサポート

ネットワークを介した疎結合リンクにより、高速サーバーおよび低速ストレージを個別に展開できます。特定の条件下では、階層型ストレージの利点を最大限に活用できます。解決された最大の問題は、パフォーマンス プールを読み取ることができない場合、コールド プールから抽出されたデータの粒度が大きすぎるためにレイテンシが高くなり、全体的なパフォーマンスのジッターが発生することです。

③マルチコピー一貫性

従来のストレージ フレームワークとは異なる RAID を使用します。マルチコピー バックアップ メカニズムを使用します。このメカニズムでは、保存前にシャーディングが行われ、その後、特定のルールに従ってクラスターのノードにデータが保存されます。データの一貫性を確保するために、分散ストレージでは通常、1 つのコピーを書き込み、複数のコピーを読み取る強力な一貫性テクノロジが使用されます。データの読み取りに失敗した場合は、他のコピーからデータを取得し、コピーに書き戻して回復します。

④災害復旧とバックアップ

災害復旧の最も重要な手段は、一定期間データを保存できるスナップショットです。障害を再現し、分析・研究し、災害を回避するのに役立ちます。バックアップはデータのセキュリティのためです。

⑤ 弾性膨張

分散ストレージは、コンピューティング、ストレージ容量、パフォーマンスを予測どおりに、かつ弾力的に拡張できます。ノードが拡張されると、古いデータは新しいノードに自動的に移行され、負荷分散が実現され、単一ポイントの問題が回避されます。水平拡張では、ノードと元のクラスターを同じネットワークに接続するだけです。プロセス全体がビジネスに影響を与えることはありません。ノードを追加すると、クラスター システムの容量とパフォーマンスが直線的に拡張されます。新しいノード リソースはプラットフォームによって引き継がれ、割り当てられるか吸収されます。

⑥ ストレージシステムの標準化

分散ストレージの発展に伴い、ストレージ業界の標準化プロセスも絶えず進歩しています。分散ストレージでは、ストレージ アクセスに業界標準のインターフェイス (SMI-S または OpenStack Cinder) の使用が優先されます。プラットフォーム レベルでは、異種ストレージ リソースを抽象化することで、従来のストレージ デバイス レベルの操作がストレージ リソース指向の操作にカプセル化され、異種ストレージ インフラストラクチャの操作が簡素化され、ストレージ リソースの集中管理が実現され、作成、変更、リサイクルなどのストレージ ライフサイクル プロセス全体が自動的に実行されます。異機種ストレージ統合機能に基づいて、ユーザーは、ハイエンド アレイの災害復旧にミッドエンド アレイとローエンド アレイを使用したり、フラッシュ アレイの災害復旧に異なるディスク アレイを使用したりといった、異なるブランドやメディアにまたがる災害復旧を実現できるため、間接的にストレージの調達および管理コストを削減できます。

2. 従来のストレージシステムと比較した分散ストレージシステムの欠点

まず、導入と保守の観点から見ると、分散ストレージの導入プロセスは比較的複雑であり、導入、保守、管理には専門の人員が必要であり、専門の人員を育成するには一定の時間がかかります。第二に、ハードウェア機器の観点から見ると、分散ストレージは X86 アーキテクチャ サーバーを使用するため、従来のハードウェア ストレージほど安定していない可能性があります。特に銀行、金融、政府などの重要な産業にとって、安定性は常に何よりも重要です。彼らは新しいテクノロジーの実践者ですが、ビジネスを円滑に運営するために最も安定した環境も必要としています。 ***、データ保護技術については、そのほとんどはコピー技術を通じてデータ保護メカニズムを実装しており、最も一般的なものは 2 つのコピー、3 つのコピーなどであり、これも利用可能なストレージ容量の減少を引き起こします。

結論

これで、この記事の冒頭で提起した「分散ストレージ システムがそれほど強力であるなら、従来のストレージ システムは役に立たないということでしょうか?」という疑問に答えることができます。分散ストレージ システムの誕生は、従来のストレージと同じ究極の目標、つまりストレージを効果的に活用し、メンテナンス コストを削減するという目標を掲げています。分散ストレージ システムの出現は、従来のストレージ システムの欠点を補うものでもあります。これは従来のストレージ システムをベースにした改良です。また、メンテナンスの人的・物的コストをより削減し、ストレージリソースの有効活用とデータの効果的な保護を実現できる分散ストレージシステムの開発にも期待しています。

<<:  クラウドネイティブ時代のリーダー、ファーウェイのクラウドコンテナとマイクロサービス

>>:  分散ストレージシステムの雪崩効果

推薦する

垂直型電子商取引は苦境に陥っており、誰も引き継ぐ意思がない。その発展は資本によって人質にされている。

ヴァンクルが年間売上高数百億元という神話を作り上げてから、国内の垂直型電子商取引は衰退し始めた。一部...

専門職の昇進と最適化担当者によくある3つの問題

はじめに:インターネットの急速な発展に伴い、ますます多くのネットワーク愛好家が「プロモーション最適化...

UAEK における Istio の実践的変革

ServiceMesh が必要な理由は何ですか? UCloud App Engine on Kube...

リバースホスト - 256MB RAM/512MB バースト/$11.99/年/カリフォルニア州サンディエゴ

半年以上営業している VPS 事業者、reversehosts。サーバーは以前は datashack...

インターネット上でブランドアーキテクチャを定義する方法

ブランドは、私たち一人ひとりにとって、大なり小なり意味を持つ定義です。なぜなら、Web サイトを作成...

地域ポータルサイトの過去、現在、そして未来

ローカルポータルのトラフィックはどのくらいの割合を占めているのでしょうか? インターネット業界の分析...

ビッグデータに関する誤解: 統計 ≠ ビッグデータ

ビッグデータに関する誤解: データ統計はすでに起こったことに関するものですが、ビッグデータは多くの場...

3日以内にホームページのトップ3キーワードを獲得する秘密

現在、インターネット業界の発展に伴い、SEO 手法が次々と登場し、さまざまなブラックハット SEO ...

Namecheap - ドメイン名 5 年 $5.58、ホスティング初年度 $9.98、サーバー $58.98

今後、Namecheapではさまざまな商品を販売しており、その中には[1]ドメイン名、16種類のドメ...

Ceph の運用と保守では、オープンソースの分散ストレージを制御する方法について説明します。

過去 2 年間、私の主な仕事は Hadoop テクノロジー スタックでしたが、最近 Ceph に触れ...

企業はどのようにしてクラウド移行を段階的に進めることができるのでしょうか?

クラウド コンピューティングが未来であり、企業のビジネスのやり方を変えることは間違いありません。それ...

Pinduoduoの100億元補助金の最大の弱点!

Pinduoduoは、ブランド所有者の「軽蔑」により、再び論争の中心に立っている。最近、拼多多プラッ...

QVODサーバーの閉鎖と警察によるQvodの捜査に耐えられるでしょうか?

4月17日にQVODサーバーを閉鎖するというニュース(QVOD技術を使用した海賊版や下品なコンテンツ...

Baidu の入札統計の違い、トラフィック損失はどこにありますか?

トラフィック統計の差異の問題は、常に多くの入札ユーザーを悩ませてきました。 Google であれ B...