分散ストレージについて知っておくべきこと(写真とテキスト付き)

分散ストレージについて知っておくべきこと(写真とテキスト付き)

序文

分散ストレージのリスクは、実際には、「共有」、「大容量データ」、「高性能」と、キャリアとしての X86 サーバー + 安価なディスクとの間の矛盾によって発生します。これは、一部の読者が言うような「データ アーキテクチャ」の問題ではありません。実際、この問題はどのストレージにも存在しますが、分散ストレージではさらに深刻です。

この記事は実際にはホストのネットワークとディスクのスループットの観点からリスクを分析しているので、どのメーカーのストレージが使用されているかとは関係ありません。

あなたは誇張していると言う人もいます。もしあなたのおっしゃることが本当なら、分散ストレージを使用すると、多くの人がそのような地雷に吹き飛ばされるのではないでしょうか?ソフトウェア定義のものには、実際には多くのバグがあります。重要なのは、問題点を発見し、それを補ったり、事前に計画を立てたりできることです。

分散ストレージは使用されてまだ 2 年も経っていないため、おっしゃったような問題が発生するには時期尚早だという意見もあります。しかし、私たちはすでに問題を発見しており、そのまま放置することはできません。釣魚島問題は棚上げされているが、今問題になっているのではないだろうか?

[[208988]]

アイデアを出す

最も重要なストレージメトリックは何ですか?

ストレージの専門家を含む多くの人は、IOPS やスループットなどのストレージ パフォーマンス指標を思い浮かべます。しかし、ストレージに関して最も重要なのはデータのセキュリティだと思います。

非常に高速なストレージ システムで突然データが失われた場合はどうなるでしょうか?データの損失はどのシステムにとっても大惨事です。

したがって、どのような種類のストレージを使用する場合でも、データのセキュリティと信頼性が最優先されます。

従来のストレージでは、比較的高い信頼性が保証されている専用のハードウェアが使用されるため、誰もがまずパフォーマンス指標に注目します。ただし、X86 ベースの SRVSAN の信頼性は楽観的ではありません。

従来のストレージのこの問題がそれほど目立たないのはなぜでしょうか?

専用機器以外にも、アプリケーションシナリオやデータ量が異なるなどの理由もあります。通信や銀行などの伝統的な業界では、元々のシステム構築は煙突モデルでした。ネットワークは独立したセットであるだけでなく、ストレージも独立したセットです。

データベース サービスとログ レコードは、2 台のサーバーと 8 ポートの小型光スイッチで接続されることが多く、小型光スイッチの下には 1 つのストレージのみが吊り下げられています。データ量はそれほど多くなく、保存容量は5T未満です。このように保存されたデータの移行は簡単かつ迅速で、移行する方法も多数あります。

専用ストレージなので、「オフライン」手段を採用することも完全に可能です。データ量は多くなく、深夜にパソコンをシャットダウンするだけで完了します。

クラウド コンピューティングの時代では、ストレージは共有され、データは信頼でき、プロバイダーは制御不能になり、データ量は膨大に増加しています...従来の方法は失敗しました。 (Cloud World の Gu Jiong 氏の記事「リソース プールのストレージ特性」を参照)

2014 年後半には、X86 ベースの分散ブロック ストレージの構築を開始しました。厳しいテストを経て、同年末に商用化されました。これは業界初の商用ソフトウェア定義分散ストレージであり、当時はさまざまなメディアで報道されました。

ほぼ 2 年間商用利用されており、安定したストレージ操作と優れたパフォーマンスを実現しています。そして、容量は当初の2P生容量から4.5Pに拡張されました。

しかし最近、SRVSAN に内在するデータ セキュリティ リスクが無視され、主流のメーカーがこの問題を認識していないため、私はますます心配になっています。この隠れた危険が数年後に顕在化すれば、大規模なシステム障害が発生することになる。

実際、この記事を書く 2 か月前に、私はすでにこの懸念とアイデアについて既存の分散ブロック ストレージ製品ラインのゼネラル マネージャーに伝えており、彼はそれを真剣に受け止め、すでにそれを補っています。ソフトウェア定義のものの多くは想像しにくいものですが、突然起こったとしても、考えてみると対応する解決策が見つかります。

読者のほとんどはストレージについてあまり知らないので、まずは基本から始め、質問をして、皆さんと解決策について話し合いたいと思います。計算してみると、大まかに7つの部分に分けることができます。スペースの制限により、この記事では最初の 3 つの部分を紹介します。

  • 1. ストレージタイプ
  • 2. ファイルシステム
  • 3. ストレージメディア
  • 4. レイドとインスタンス
  • 5. SRVSANアーキテクチャ
  • 6. SRVSANのセキュリティリスク
  • 七。解決

1. ストレージタイプ

一般的に、ストレージは、ローカル DAS およびネットワークベースの NAS ストレージ、SAN ストレージ、オブジェクト ストレージの 4 つのタイプに分類されます。オブジェクト ストレージは、SAN ストレージと NAS ストレージを組み合わせたもので、SAN ストレージと NAS ストレージの両方の利点を活用します。

図1

アプリケーションがストレージ内で必要なファイル情報を取得する方法を理解しましょう。図 1 に示すように、使い慣れた Windows を例として使用します。

1. アプリケーションは、「このディレクトリの readme.txt ファイルから最初の 1K のデータを読み取る」というコマンドを発行します。

2. メモリを介してディレクトリ層と通信し、相対ディレクトリを実際のディレクトリに変換し、「C:\test\readme.txt ファイルの最初の 1K のデータを読み取る」

3. FAT32 などのファイル システムを通じて、ファイル アロケーション テーブルとディレクトリ エントリを照会し、ファイル ストレージの LBA アドレスの場所、アクセス許可、およびその他の情報を取得します。

ファイルシステムはまず、キャッシュ内にデータがあるかどうかを確認します。データがある場合は、そのデータを直接返します。そうでない場合、ファイル システムは、メモリ通信を通じて「LBA1000 から始まり、長さ 1024 の情報を読み取る」コマンドを次のリンクに渡します。

4. ボリューム (LUN) 管理層は、LBA アドレスをストレージの物理アドレスに変換し、SCSI プロトコルなどのプロトコルをカプセル化して、次のリンクに渡します。

5. ディスク コントローラは、コマンドに従ってディスクから対応する情報を取得します。

ディスク セクター サイズが 4K の場合、1 回の I/O で読み取られる実際のデータは 4K です。ヘッドによって読み取られた 4K のデータがサーバーに到達すると、ファイル システムは最初の 1K のデータをインターセプトし、アプリケーションに渡します。アプリケーションが次回同じ要求を開始すると、ファイル システムはそれをサーバーのメモリから直接読み取ることができます。

DAS、NAS、SAN のいずれの場合でも、データ アクセス プロセスは同様です。 DAS はコンピューティング機能とストレージ機能を 1 つのサーバーに統合します。誰もが日常的に使用するコンピュータは、図 1 に示すように DAS システムです。

図2

コンピューティングとストレージを分離すると、ストレージは独自のファイルシステムを持ち、独自にデータを管理できる独立したデバイスになります。これが NAS です (図 2 を参照)。

コンピューティングとストレージは通常、CIFS または NFS プロトコルを使用してイーサネットで接続されます。サーバーはファイル システムを共有できます。つまり、サーバーが上海語を話すか杭州語を話すかに関係なく、ネットワークを介して NAS に到達するファイル システムは北京語に翻訳されます。

したがって、NAS ストレージは異なるホスト間で共有できます。サーバーはリクエストを行うだけでよく、多くの計算を実行する必要はありません。多くの作業がストレージに引き継がれます。節約された CPU リソースは、サーバーが実行したい他の作業に使用できます。つまり、NAS はコンピューティング集約型のタスクに適しています。

図3

コンピューティングとストレージは分離されています。ストレージは独立したデバイスになります。ストレージはコマンドのみを受け入れ、複雑な計算は実行しなくなりました。ファイルの読み取りと書き込みの 2 つの処理のみを実行します。これは、図 3 に示すように SAN と呼ばれます。

ファイルシステムがないため、「ベアストレージ」とも呼ばれます。一部のアプリケーションでは、データベースなどのベアデバイスが必要です。ストレージは単純で明確なコマンドのみを受け入れ、その他の複雑な処理はサーバーによって実行されます。 FC ネットワークと組み合わせると、このタイプのストレージ データを非常に高速に読み書きできます。

ただし、各サーバーには管理用の独自のファイルシステムがあります。収納にこだわりはありません。データが来る限り、保存します。それが何なのか知る必要はありません。英語でもフランス語でも忠実に記録します。

しかし、英語を理解できる人だけが英語のデータを理解でき、フランス語を理解できる人だけがフランス語のデータを理解できます。そのため、一般的にサーバーと SAN ストレージ領域は単一であり、SAN の共有は不十分です。もちろん、クラスター ファイル システムがインストールされている一部のホストは同じストレージ領域を共有できます。

上記の分析から、ストレージの速度はネットワークとコマンドの複雑さによって決まることがわかります。

メモリ通信速度 > バス通信 > ネットワーク通信

ネットワーク通信にはFCネットワークやイーサネットネットワークもあります。 FC ネットワークは現在 8Gb/s を実現できますが、光ファイバー メディアを介したイーサネット ネットワークではすでに 10Gb/s が普及しており、40Gb/s のネットワーク カードも使用されています。つまり、従来のイーサネット ネットワークはもはやストレージのボトルネックではなくなりました。 FCSAN に加えて、IPSAN も SAN ストレージの重要なメンバーです。

ストレージ操作には、一般的な読み取り/書き込み操作に加えて、作成、オープン、プロパティの取得、プロパティの設定、検索なども含まれます。

頭脳を持つ SAN ストレージでは、読み取り/書き込み以外のすべてのコマンドをローカル メモリ内で非常に高速に完了できます。

しかし、NAS ストレージには頭脳がありません。コマンドがストレージに渡されるたびに、IP でカプセル化され、イーサネット ネットワーク経由で NAS サーバーに送信する必要があります。速度はメモリ通信に比べてかなり遅くなります。

  • DAS は最も高速なのが特徴ですが、自分だけが使用できます。
  • NAS の特徴は、速度は遅いが共有が優れていることです。
  • SAN の特徴は、速度は速いが共有が苦手なことです。

一般的に、オブジェクト ストレージは、SAN のディスクへの高速直接アクセスと NAS の分散共有機能を組み合わせたものです。

NAS ストレージの基本単位はファイル、SAN ストレージの基本単位はデータ ブロック、オブジェクト ストレージの基本単位はオブジェクトです。オブジェクトは、ファイル データと属性情報のセットの組み合わせと考えることができます。この属性情報により、ファイルベースの RAID パラメータ、データ分散、およびサービス品質を定義できます。

採用されているモードは、「制御情報」と「データ保存」を分離することです。クライアントは、読み取りと書き込みの基準としてオブジェクト ID + オフセットを使用します。クライアントはまず「制御情報」からデータストレージの実アドレスを取得し、次に「データストレージ」から直接アクセスします。

オブジェクトストレージはインターネット上で広く利用されており、誰もが使っているネットワークディスクは典型的なオブジェクトストレージです。オブジェクト ストレージはスケーラビリティに優れており、線形に拡張できます。また、インターフェースのカプセル化を通じて NAS ストレージ サービスと SAN ストレージ サービスも提供できます。

VMware の vSAN は本質的にはオブジェクト ストレージです。分散オブジェクト ストレージは SRVSAN の一種であり、セキュリティ上のリスクもあります。この隠れた危険は X86 サーバーによって引き起こされるからです。

2. ファイルシステム

コンピュータのファイルシステムは、ファイルを管理する「会計士」です。

  • まず、倉庫を管理し、さまざまな商品がどこに置かれているかを把握する必要があります。
  • 次に、商品の出入りを管理し、商品の安全を確保する必要があります。

「会計係」がおらず、各「ヘルパー」が倉庫に自由に出入りできる場合、倉庫は乱雑になり、商品が紛失することになります。

青年繊維城の機械室が初めて使われ始めたときと同じように、機械室にはみんなの商品が山積みになっていて、それを統一的に管理する人がいませんでした。棚に機器を置く必要がある場合、人々は商品の山の中から自分でそれを探さなければなりませんでした。設置後のゴミを片付ける人もおらず、結局、商品が積み上げられていた場所すら誰も見つけられなかった。自分の商品が見つからなかったので、他の人の商品を見つけてそれを使うこともありました...

皆が不満を言い、後に倉庫が建設され、倉庫管理者が雇われました。荷物の行き先や保管場所をノートに記録し、荷物の入出庫システムを構築した。すべての問題は解決しました。これがファイリングシステムが行うべきことです。

ファイル システムは、ファイルにアクセスするためのインターフェイス、ファイルのストレージ構成と割り当て、およびファイル属性 (ファイルの所有権、アクセス許可、作成イベントなど) の管理を管理します。

各オペレーティング システムには独自のファイル システムがあります。たとえば、Windows では一般的に使用されている FAT、FAT32、NTFS などがあり、Linux では ext1-4 などが使用されます。

ファイルを保存するための倉庫にはさまざまな形式がありますが、現在主に使用されているのは(機械的な)ディスク、SSD、CD、テープなどです。

これらのメディアを入手したら、まず「フォーマット」する必要があります。フォーマットとは、ファイルストレージの組織構造と「台帳」を確立するプロセスです。たとえば、USB ドライブを FAT32 でフォーマットすると、次の構造と元帳が表示されます (図 4)。

図4

マスター ブート領域: このストレージ デバイスの全体的および基本的な情報を記録します。たとえば、セクターのサイズ、各クラスターのサイズ、ヘッドの数、ディスクセクターの合計数、FAT テーブルの数、パーティションのブート コードなどの情報です。

パーティション テーブル: これはストレージ台帳です。パーティション テーブルが失われるとデータが失われることを意味するため、通常は FAT1 と FAT2 の 2 つのコピーが保持されます。パーティション テーブルには主に各クラスターの使用状況が記録されます。この位置のクラスターが空の場合、使用されていないことを意味します。特別なマークは不良なクラスターを表します。その位置にデータがある場合は、ファイル ブロックの次の位置を示します。

ディレクトリ領域: ディレクトリとファイルの場所の情報を記録します。

データ領域: ファイルの特定の情報を記録する領域。

次の例は、FAT ファイル システムとは何かを理解するのに役立ちます。

各クラスターが 8 つのセクターで構成されていると仮定すると、サイズは 512 * 8 = 4K になります。図 5 に示すように、ルート ディレクトリ内の readme.txt ファイルのサイズは 10K です。

図5

  • 1. ディレクトリ領域のルート ディレクトリにある readme.txt ファイルを見つけます。 FAT テーブル内の場所は 0004 です。
  • 2.位置0004に対応するクラスターの8セクター内の対応するファイルブロックreadme(1)を読み取ってメモリに保存し、次のデータブロック0005の位置を取得します。
  • 3. 位置0005に対応するクラスターの8セクター内の対応するファイルブロックreadme(2)を読み取ってメモリに保存し、次のデータブロック0008の位置を取得します。
  • 4.位置0005に対応するクラスタの4つのセクターから対応するファイルブロックreadme(3)を読み取り、メモリに保存し、終了マークを取得します。
  • 5. readme(1)、readme(2)、readme(3)を1つのreadmeファイルに結合します。

この例では、FAT ファイル システムでは、FAT テーブルとディレクトリ エントリを照会することによってファイルの保存場所が決定されることがわかります。ファイルの配布はクラスター内のデータ ブロックに基づいており、ファイル データが保存されているテキストは「チェーン」によって示されます。

ファイルを読み取るときは、ファイル ヘッダーから読み取りを開始する必要があります。この方法では、読書効率は高くありません。

さまざまな Linux ファイル システムは類似しており、図 6 に示すように、通常は ext ファイル システムを使用します。

図6

ブート ブロックはサーバーの起動に使用されます。このパーティションがブート パーティションでない場合でも、保持されます。

スーパーブロックには、ファイル システムの種類、i ノードの数、データ ブロックの数など、ファイル システムに関する情報が格納されます。

Inodes ブロックにはファイルの inode 情報が格納され、各ファイルは inode に対応します。ファイルのメタ情報、具体的には次のものが含まれます。

ファイル内のバイト数

ファイル所有者のユーザーID

ファイルのグループID

ファイルの読み取り、書き込み、実行権限

ファイルには 3 つのタイムスタンプがあります。ctime は inode が最後に変更された時刻、mtime はファイルの内容が最後に変更された時刻、atime はファイルが最後に開かれた時刻を示します。

リンクの数、つまりこのinodeを指すファイル名の数

ファイルデータブロックの場所

ディレクトリまたはファイルを表示する場合、まず inode テーブルからファイル属性とデータ保存ポイントが検出され、次にデータ ブロックからデータが読み取られます。

データ ブロック: ディレクトリとファイルのデータを格納します。

\var\readme.txt ファイル プロセスを読むと、図 7 に示すように、ext ファイル システムを理解することができます。

図7

  • 1. ルートディレクトリ A に対応する inode ノードは 2 であり、inode1 に対応するデータブロックは d1 です。
  • 2. d1 の内容を検索すると、ディレクトリ var に対応する inode は 28 であり、対応するデータ ブロックは d5 であることがわかります。
  • 3. d5 の内容を検索し、readme.txt が inode=70 に対応していることを確認します。
  • 4. Inode70 はデータ領域 d2、d3、および d6 ブロックを指します。これらのデータ ブロックを読み取り、メモリ内の d2、d3、および d6 データ ブロックを結合します。

ハードディスクをフォーマットすると、オペレーティング システムによってハードディスクが自動的に 2 つの領域に分割されます。

  • 1 つはファイル データを格納するデータ領域です。
  • もう 1 つは、inode に含まれる情報を格納する inode 領域です。

inode リソースが消費されると、データ領域に空き領域があっても新しいファイルを書き込むことができなくなります。

概要: Windows ファイル システムは多くの場合「シリアル」ですが、Linux ファイル システムは「パラレル」です。

分散ファイルシステムを見てみましょう。

永続層を提供するストレージ空間が単一のデバイスではなく、それぞれがネットワークを介して接続された複数のデバイスである場合、データは複数のストレージデバイスに分散して保存されます。つまり、メタデータにはデータ ブロックの数だけでなく、データ ノードも記録されます。

このように、メタデータは各データ ノードに保存され、リアルタイムで同期される必要があります。実際、これを実行するのは非常に困難です。メタデータ サーバーを分離して「マスター スレーブ」アーキテクチャにすると、各データ ノードでメタデータ テーブルを維持する必要がなくなり、データ保守の難しさが軽減され、効率が向上します。

Hadoop のファイルシステム HDFS は、典型的な分散ファイルシステムです。

図8

  • 1. クライアントはFileAを64Mのブロックに分割します。ブロック1とブロック2の2つのブロックに分割します。
  • 2. クライアントは、図の紫色の点線 1 で示されているように、nameNode に書き込みデータ要求を送信します。
  • 3. NameNode ノードはブロック情報を記録します。そして、図の赤い点線 2 で示すように、利用可能な DataNode をクライアントに返します。

ブロック1: ホスト11、ホスト22、ホスト31

ブロック2: ホスト11、ホスト21、ホスト32

  • 4. クライアントはブロック 1 を DataNode に送信します。送信プロセスはストリーミング書き込みです。

ストリーミング書き込みプロセス:

1) 64M ブロック 1 を 64K パッケージに分割します。

2) 次に最初のパッケージをホスト11に送信します。

3) パッケージを受信した後、host11 は最初のパッケージを host22 に送信し、クライアントは 2 番目のパッケージを host11 に送信します。

4) ホスト22は最初のパッケージを受信した後、それをホスト31に送信し、同時にホスト11から2番目のパッケージを受信します。

5) 図の黒い点線 3 で示すように、ブロック 1 が送信されるまでこれを繰り返します。

6) Host11、host22、host31 は、NameNode とクライアントに「メッセージが送信されました」という通知を送信します。

7) メッセージを受信したクライアントは、書き込みが完了したことを通知するメッセージをネームノードに送信します。これで本当に完了です。

8) ブロック 1 を送信した後、図の青い点線 4 に示すように、ブロック 2 がホスト 11、ホスト 21、ホスト 32 に送信されます。

……。

HDFS は分散ストレージのプロトタイプであり、後ほど詳しく説明します。

3. ストレージメディア

倉庫にはさまざまな種類の保管媒体があります。最も一般的に使用されているのは、ディスクと SSD ディスク、CD、テープなどです。ディスクはコスト効率の良さから常に主要な地位を占めてきました。

丸い磁気ディスクが四角い密閉された箱の中に入っており、動くとききしむ音がします。これは私たちがよく目にする磁気ディスクです。磁気ディスクは実際にデータを保存する媒体であり、各磁気ディスクの前面と背面には磁気ヘッドが「浮いている」状態になっています。

ディスクは多数の同心円に分割されており、各同心円はトラックと呼ばれます。各トラックは小さなセクターに分割されており、各セクターには 512B のデータが保存できます。磁気ヘッドは磁気ディスク上で高速回転し、トラックを連続的に変更してデータを読み書きします。

実際、磁気ディスクは高速回転を担い、磁気ヘッドは磁気ディスク上の水平方向の移動のみを担っています。ディスクのパフォーマンスを決定する主な要因は、ディスクの回転速度、ヘッドの切り替え、ディスク、各ディスクの容量、およびインターフェース速度です。回転速度が速いほど、トラック変更時間が短くなり、単一チップの容量が大きくなるため、ディスクのパフォーマンスが向上します。

図9

図10

図11

ディスクのパフォーマンスは、主に IOPS とスループットの 2 つのパラメータに基づいて測定されます。

IOPS は、ディスクが 1 秒間に読み書きする回数です。

スループットとは、読み取られるデータの量です。

実際、これらの指標には、大きなパケット (ブロック) か小さなパケット (ブロック) か、読み取りか書き込みか、ランダムか連続かといった前提条件が必要です。一般的に、メーカーが提供するディスク IOPS パフォーマンスは、小さなパケットと順次読み取りのテスト指標を指します。この指標は通常、最大値です。

X86 サーバーでよく使用される SATA ディスクと SAS ディスクのパフォーマンスは次のとおりです。

図12

実際の生産見積もりによると、SATA 7200 rpm ディスクは約 60 IOPS と 70 MB/秒のスループットを提供します。

2014 年に初めて使用した生容量 2P SRVSAN ストレージのデータ永続性レイヤーでは、12 台の内蔵 SATA7200 3TB ハード ドライブを搭載した 57 台の X86 サーバーが使用されています。合計で 684 個のディスクがあり、提供される IOPS は 41,040 個、速度は 47.88 GB/秒のみです。

これらの指標は明らかにストレージのニーズを満たすことができないため、これを「加速」する方法を見つける必要があります。

実際、機械式ハードディスクには多くの最適化が施されています。たとえば、セクター アドレスは連続して番号付けされていません。

ディスクの回転速度が十分速いため (7200 rpm、つまり 1 秒間に 120 回転、1 回転は 8.3 ミリ秒、つまり同じトラックの読み取りと書き込みの最大遅延は 8.3 秒)、ヘッドが読み取りまたは書き込みを逃さないように、セクター アドレスは連続的ではなく、2:1 クロス ファクター (1、10、2、11、3、12...) などのジャンプ番号が付けられます。

同時に、ディスクにはキャッシュとキューもあります。一度に 1 つの I/O を読み取ったり書き込んだりするわけではありません。代わりに、一定量の I/O を蓄積し、ヘッドの位置とアルゴリズムに基づいて完了します。 I/O は必ずしも「先着順」ではありませんが、効率性には準拠しています。

速度を上げる最善の方法は、SSD ディスクを使用することです。ディスクの制御部は、機械部+制御回路で構成されています。機械部分の速度制限により、ディスクのパフォーマンスを大幅に向上させることは不可能です。 SSD は完全な電子制御を使用して優れたパフォーマンスを実現します。

SSD は、フラッシュメモリを記憶媒体として使用し、適切な制御チップと組み合わせたストレージデバイスです。現在、ソリッド ステート ドライブの製造に使用されている NAND フラッシュには 3 種類あります。

  • 単層ストレージ(SLC、1ビットのデータを格納)
  • 2層ストレージ(MLC、4ビットデータを保存)
  • 3層ストレージ(TLC、8ビットデータを保存)

SLC はコストが最も高く、寿命が最も長いですが、アクセス速度が最も速く、TLC はコストが最も低く、寿命が最も短いですが、アクセス速度が最も遅くなります。コスト削減のため、サーバーで使用されるエンタープライズレベルの SSD はすべて MLC を使用し、TLC は USB フラッシュ ドライブとして使用できます。

図13

SSD の普及には、コストの高さ、書き込み回数の制限、修復不可能な損傷、書き込み回数の増加やドライブの空き容量不足による速度低下など、依然としていくつかの障害があります。

ページは、ディスクの最小の IO 単位セクターに対応し、SSD の最小単位です。

たとえば、各ページには 512B のデータと 218b のエラー訂正コードが格納され、128 ページが 1 ブロック (64KB) を形成し、2048 ブロックが 1 つの領域を形成し、フラッシュ メモリ チップは 2 つの領域で構成されます。ページ サイズが大きいほど、フラッシュ チップの容量が大きくなります。

しかし、SSD には、特定のページのデータを変更するとブロック全体に影響するという悪い癖があります。このページが配置されているデータのブロック全体をキャッシュに読み込む必要があり、その後ブロックが 1 に初期化され、その後データがキャッシュから読み込まれて書き込まれます。

SSD の場合、速度は問題にならないかもしれませんが、書き込み回数は制限されているため、ブロックが大きいほど良いです。もちろん、機械式ディスクにも同様の問題が存在します。ブロックが大きいほど、読み取りと書き込みの速度は速くなりますが、ブロックが完全に書き込まれていなくても、ブロックのスペースを占有するため、無駄も深刻になります。

SSD のパフォーマンスは、モデルやメーカーによって大きく異なります。以下は、分散ブロック ストレージがキャッシュとして使用する SSD パラメータです。

PCIe 2.0 インターフェースを採用し、容量は 1.2T、総合読み取りおよび書き込み IOPS (4k スモール パケット) は 260,000 回、読み取りスループットは 1.55GB/秒、書き込みスループットは 1GB/秒です。

SRVSAN サーバーは、キャッシュとして SSD と 12 個の 7200 rpm 3T SATA ディスクで構成されています。ディスクは 1200 倍および 1200M のスループットのみを提供します。

これはキャッシュ SSD によって提供される容量よりもはるかに少ないため、キャッシュに直接アクセスすると非常に高いストレージ パフォーマンスを実現できます。 SRVSAN の鍵は、ホット データのアルゴリズムを計算し、ホット データのヒット率を向上させることです。

高価な SSD をキャッシュとして使用し、安価な SATA ディスクを容量層として使用します。

<<:  クラウド自動化とオーケストレーションの間の障壁: それをどうやって打破するか?

>>:  ソフトウェア定義アーキテクチャによりクラウドアクセスのネットワーク最適化が可能

推薦する

hostseba: バングラデシュのサーバー、バングラデシュの VPS、バングラデシュのホスト、月額 15 ドルから、PayPal 対応

2009 年に設立されたバングラデシュのホスティング会社である Hosteseba は、いわゆる「O...

Google検索は大幅な調整を受ける:著作権を侵害するウェブサイトのランキングを下げる

北京時間8月11日朝のニュース、アメリカのテクノロジーブログTheVergeによると、Google(...

購入者を引き付けるキーワードを選択する

キーワードの調査と選択は、検索エンジン マーケティングの重要なステップです。ご存知のように、ほとんど...

李佳琦は1日で10億を売り上げた?その背後にある論理!

李佳琦のライブ放送を待っていましたか?もしそうなら、何かを買いたいという衝動を抑えられなかったと思い...

倒産の波の後、共同購入業界は2度目の再編に直面している。地域密着型サービスが競争力の核心

電子商取引企業間の価格競争は熾烈を極めているが、同じく電子商取引モデルである共同購入業界は意外にも地...

ウェブサイトのナビゲーションを最適化する方法

誰もがウェブサイト ナビゲーションとは何かをご存知だと思います。ウェブサイト ナビゲーションの目的は...

ソフトコピーを書くための4つの簡単なステップ

検索エンジンの成熟度が高まるにつれて、ウェブサイトの外部リンクの品質に対する要求も高まっています。従...

簡単な説明: Baidu ウェブマスター ツールを使用してウェブサイトのランキングを向上させる方法

SEO 実践者は幸運です! 現在、SEO を行う際には、Baidu Webmaster プラットフォ...

相違点を残しつつ共通点を探る:企業ウェブサイトのホームページデザインについての議論

みなさんこんにちは、梁磊です。ユーザーエクスペリエンスはページデザインと密接な関係があります。ページ...

pumpcloud: 香港ダイナミック VPS 補充、HGC ダイナミック VPS + HKT ダイナミック VPS

pumcloud は、長い間在庫切れだった動的 VPS をちょうど再入荷しました。動的 IP を持つ...

5G、エッジコンピューティング、IoTがネットワークを再構築すると期待される

5G は、前世代のセルラー サービス (4G) よりも高い帯域幅、低い遅延、高いデバイス密度を備えた...

推奨: Virpus-$15/Xen/6 コア/2g メモリ/60g SSD/4T トラフィック/シアトル

Virpus のウェブサイトは完全に刷新され、元のウェブサイトは廃止され、Wow Technolog...

ブランドイベントマーケティングの7つの戦略!

広告はカンフーの練習のようなものです。素晴らしい成果を上げたいなら、動きをしっかり学ばなければなりま...

shardhost-256m メモリ KVM/3.75g SSD/年間 20 ドルの支払い

Shardhost は、2011 年 6 月に英国で登録された小規模な VPS プロバイダーです (...