分散ストレージについて知っておくべきこと（写真とテキスト付き）

序文

分散ストレージのリスクは、実際には、「共有」、「大容量データ」、「高性能」と、キャリアとしての X86 サーバー + 安価なディスクとの間の矛盾によって発生します。これは、一部の読者が言うような「データアーキテクチャ」の問題ではありません。実際、この問題はどのストレージにも存在しますが、分散ストレージではさらに深刻です。

この記事は実際にはホストのネットワークとディスクのスループットの観点からリスクを分析しているので、どのメーカーのストレージが使用されているかとは関係ありません。

あなたは誇張していると言う人もいます。もしあなたのおっしゃることが本当なら、分散ストレージを使用すると、多くの人がそのような地雷に吹き飛ばされるのではないでしょうか？ソフトウェア定義のものには、実際には多くのバグがあります。重要なのは、問題点を発見し、それを補ったり、事前に計画を立てたりできることです。

分散ストレージは使用されてまだ 2 年も経っていないため、おっしゃったような問題が発生するには時期尚早だという意見もあります。しかし、私たちはすでに問題を発見しており、そのまま放置することはできません。釣魚島問題は棚上げされているが、今問題になっているのではないだろうか？

[[208988]]

アイデアを出す

最も重要なストレージメトリックは何ですか?

ストレージの専門家を含む多くの人は、IOPS やスループットなどのストレージパフォーマンス指標を思い浮かべます。しかし、ストレージに関して最も重要なのはデータのセキュリティだと思います。

非常に高速なストレージシステムで突然データが失われた場合はどうなるでしょうか?データの損失はどのシステムにとっても大惨事です。

したがって、どのような種類のストレージを使用する場合でも、データのセキュリティと信頼性が最優先されます。

従来のストレージでは、比較的高い信頼性が保証されている専用のハードウェアが使用されるため、誰もがまずパフォーマンス指標に注目します。ただし、X86 ベースの SRVSAN の信頼性は楽観的ではありません。

従来のストレージのこの問題がそれほど目立たないのはなぜでしょうか?

専用機器以外にも、アプリケーションシナリオやデータ量が異なるなどの理由もあります。通信や銀行などの伝統的な業界では、元々のシステム構築は煙突モデルでした。ネットワークは独立したセットであるだけでなく、ストレージも独立したセットです。

データベースサービスとログレコードは、2 台のサーバーと 8 ポートの小型光スイッチで接続されることが多く、小型光スイッチの下には 1 つのストレージのみが吊り下げられています。データ量はそれほど多くなく、保存容量は5T未満です。このように保存されたデータの移行は簡単かつ迅速で、移行する方法も多数あります。

専用ストレージなので、「オフライン」手段を採用することも完全に可能です。データ量は多くなく、深夜にパソコンをシャットダウンするだけで完了します。

クラウドコンピューティングの時代では、ストレージは共有され、データは信頼でき、プロバイダーは制御不能になり、データ量は膨大に増加しています...従来の方法は失敗しました。 (Cloud World の Gu Jiong 氏の記事「リソースプールのストレージ特性」を参照)

2014 年後半には、X86 ベースの分散ブロックストレージの構築を開始しました。厳しいテストを経て、同年末に商用化されました。これは業界初の商用ソフトウェア定義分散ストレージであり、当時はさまざまなメディアで報道されました。

ほぼ 2 年間商用利用されており、安定したストレージ操作と優れたパフォーマンスを実現しています。そして、容量は当初の2P生容量から4.5Pに拡張されました。

しかし最近、SRVSAN に内在するデータセキュリティリスクが無視され、主流のメーカーがこの問題を認識していないため、私はますます心配になっています。この隠れた危険が数年後に顕在化すれば、大規模なシステム障害が発生することになる。

実際、この記事を書く 2 か月前に、私はすでにこの懸念とアイデアについて既存の分散ブロックストレージ製品ラインのゼネラルマネージャーに伝えており、彼はそれを真剣に受け止め、すでにそれを補っています。ソフトウェア定義のものの多くは想像しにくいものですが、突然起こったとしても、考えてみると対応する解決策が見つかります。

読者のほとんどはストレージについてあまり知らないので、まずは基本から始め、質問をして、皆さんと解決策について話し合いたいと思います。計算してみると、大まかに7つの部分に分けることができます。スペースの制限により、この記事では最初の 3 つの部分を紹介します。

1. ストレージタイプ
2. ファイルシステム
3. ストレージメディア
4. レイドとインスタンス
5. SRVSANアーキテクチャ
6. SRVSANのセキュリティリスク
七。解決

1. ストレージタイプ

一般的に、ストレージは、ローカル DAS およびネットワークベースの NAS ストレージ、SAN ストレージ、オブジェクトストレージの 4 つのタイプに分類されます。オブジェクトストレージは、SAN ストレージと NAS ストレージを組み合わせたもので、SAN ストレージと NAS ストレージの両方の利点を活用します。

図1

アプリケーションがストレージ内で必要なファイル情報を取得する方法を理解しましょう。図 1 に示すように、使い慣れた Windows を例として使用します。

1. アプリケーションは、「このディレクトリの readme.txt ファイルから最初の 1K のデータを読み取る」というコマンドを発行します。

2. メモリを介してディレクトリ層と通信し、相対ディレクトリを実際のディレクトリに変換し、「C:\test\readme.txt ファイルの最初の 1K のデータを読み取る」

3. FAT32 などのファイルシステムを通じて、ファイルアロケーションテーブルとディレクトリエントリを照会し、ファイルストレージの LBA アドレスの場所、アクセス許可、およびその他の情報を取得します。

ファイルシステムはまず、キャッシュ内にデータがあるかどうかを確認します。データがある場合は、そのデータを直接返します。そうでない場合、ファイルシステムは、メモリ通信を通じて「LBA1000 から始まり、長さ 1024 の情報を読み取る」コマンドを次のリンクに渡します。

4. ボリューム (LUN) 管理層は、LBA アドレスをストレージの物理アドレスに変換し、SCSI プロトコルなどのプロトコルをカプセル化して、次のリンクに渡します。

5. ディスクコントローラは、コマンドに従ってディスクから対応する情報を取得します。

ディスクセクターサイズが 4K の場合、1 回の I/O で読み取られる実際のデータは 4K です。ヘッドによって読み取られた 4K のデータがサーバーに到達すると、ファイルシステムは最初の 1K のデータをインターセプトし、アプリケーションに渡します。アプリケーションが次回同じ要求を開始すると、ファイルシステムはそれをサーバーのメモリから直接読み取ることができます。

DAS、NAS、SAN のいずれの場合でも、データアクセスプロセスは同様です。 DAS はコンピューティング機能とストレージ機能を 1 つのサーバーに統合します。誰もが日常的に使用するコンピュータは、図 1 に示すように DAS システムです。

図2

コンピューティングとストレージを分離すると、ストレージは独自のファイルシステムを持ち、独自にデータを管理できる独立したデバイスになります。これが NAS です (図 2 を参照)。

コンピューティングとストレージは通常、CIFS または NFS プロトコルを使用してイーサネットで接続されます。サーバーはファイルシステムを共有できます。つまり、サーバーが上海語を話すか杭州語を話すかに関係なく、ネットワークを介して NAS に到達するファイルシステムは北京語に翻訳されます。

したがって、NAS ストレージは異なるホスト間で共有できます。サーバーはリクエストを行うだけでよく、多くの計算を実行する必要はありません。多くの作業がストレージに引き継がれます。節約された CPU リソースは、サーバーが実行したい他の作業に使用できます。つまり、NAS はコンピューティング集約型のタスクに適しています。

図3

コンピューティングとストレージは分離されています。ストレージは独立したデバイスになります。ストレージはコマンドのみを受け入れ、複雑な計算は実行しなくなりました。ファイルの読み取りと書き込みの 2 つの処理のみを実行します。これは、図 3 に示すように SAN と呼ばれます。

ファイルシステムがないため、「ベアストレージ」とも呼ばれます。一部のアプリケーションでは、データベースなどのベアデバイスが必要です。ストレージは単純で明確なコマンドのみを受け入れ、その他の複雑な処理はサーバーによって実行されます。 FC ネットワークと組み合わせると、このタイプのストレージデータを非常に高速に読み書きできます。

ただし、各サーバーには管理用の独自のファイルシステムがあります。収納にこだわりはありません。データが来る限り、保存します。それが何なのか知る必要はありません。英語でもフランス語でも忠実に記録します。

しかし、英語を理解できる人だけが英語のデータを理解でき、フランス語を理解できる人だけがフランス語のデータを理解できます。そのため、一般的にサーバーと SAN ストレージ領域は単一であり、SAN の共有は不十分です。もちろん、クラスターファイルシステムがインストールされている一部のホストは同じストレージ領域を共有できます。

上記の分析から、ストレージの速度はネットワークとコマンドの複雑さによって決まることがわかります。

メモリ通信速度 > バス通信 > ネットワーク通信

ネットワーク通信にはFCネットワークやイーサネットネットワークもあります。 FC ネットワークは現在 8Gb/s を実現できますが、光ファイバーメディアを介したイーサネットネットワークではすでに 10Gb/s が普及しており、40Gb/s のネットワークカードも使用されています。つまり、従来のイーサネットネットワークはもはやストレージのボトルネックではなくなりました。 FCSAN に加えて、IPSAN も SAN ストレージの重要なメンバーです。

ストレージ操作には、一般的な読み取り/書き込み操作に加えて、作成、オープン、プロパティの取得、プロパティの設定、検索なども含まれます。

頭脳を持つ SAN ストレージでは、読み取り/書き込み以外のすべてのコマンドをローカルメモリ内で非常に高速に完了できます。

しかし、NAS ストレージには頭脳がありません。コマンドがストレージに渡されるたびに、IP でカプセル化され、イーサネットネットワーク経由で NAS サーバーに送信する必要があります。速度はメモリ通信に比べてかなり遅くなります。

DAS は最も高速なのが特徴ですが、自分だけが使用できます。
NAS の特徴は、速度は遅いが共有が優れていることです。
SAN の特徴は、速度は速いが共有が苦手なことです。

一般的に、オブジェクトストレージは、SAN のディスクへの高速直接アクセスと NAS の分散共有機能を組み合わせたものです。

NAS ストレージの基本単位はファイル、SAN ストレージの基本単位はデータブロック、オブジェクトストレージの基本単位はオブジェクトです。オブジェクトは、ファイルデータと属性情報のセットの組み合わせと考えることができます。この属性情報により、ファイルベースの RAID パラメータ、データ分散、およびサービス品質を定義できます。

採用されているモードは、「制御情報」と「データ保存」を分離することです。クライアントは、読み取りと書き込みの基準としてオブジェクト ID + オフセットを使用します。クライアントはまず「制御情報」からデータストレージの実アドレスを取得し、次に「データストレージ」から直接アクセスします。

オブジェクトストレージはインターネット上で広く利用されており、誰もが使っているネットワークディスクは典型的なオブジェクトストレージです。オブジェクトストレージはスケーラビリティに優れており、線形に拡張できます。また、インターフェースのカプセル化を通じて NAS ストレージサービスと SAN ストレージサービスも提供できます。

VMware の vSAN は本質的にはオブジェクトストレージです。分散オブジェクトストレージは SRVSAN の一種であり、セキュリティ上のリスクもあります。この隠れた危険は X86 サーバーによって引き起こされるからです。

2. ファイルシステム

コンピュータのファイルシステムは、ファイルを管理する「会計士」です。

まず、倉庫を管理し、さまざまな商品がどこに置かれているかを把握する必要があります。
次に、商品の出入りを管理し、商品の安全を確保する必要があります。

「会計係」がおらず、各「ヘルパー」が倉庫に自由に出入りできる場合、倉庫は乱雑になり、商品が紛失することになります。

青年繊維城の機械室が初めて使われ始めたときと同じように、機械室にはみんなの商品が山積みになっていて、それを統一的に管理する人がいませんでした。棚に機器を置く必要がある場合、人々は商品の山の中から自分でそれを探さなければなりませんでした。設置後のゴミを片付ける人もおらず、結局、商品が積み上げられていた場所すら誰も見つけられなかった。自分の商品が見つからなかったので、他の人の商品を見つけてそれを使うこともありました...

皆が不満を言い、後に倉庫が建設され、倉庫管理者が雇われました。荷物の行き先や保管場所をノートに記録し、荷物の入出庫システムを構築した。すべての問題は解決しました。これがファイリングシステムが行うべきことです。

ファイルシステムは、ファイルにアクセスするためのインターフェイス、ファイルのストレージ構成と割り当て、およびファイル属性 (ファイルの所有権、アクセス許可、作成イベントなど) の管理を管理します。

各オペレーティングシステムには独自のファイルシステムがあります。たとえば、Windows では一般的に使用されている FAT、FAT32、NTFS などがあり、Linux では ext1-4 などが使用されます。

ファイルを保存するための倉庫にはさまざまな形式がありますが、現在主に使用されているのは（機械的な）ディスク、SSD、CD、テープなどです。

これらのメディアを入手したら、まず「フォーマット」する必要があります。フォーマットとは、ファイルストレージの組織構造と「台帳」を確立するプロセスです。たとえば、USB ドライブを FAT32 でフォーマットすると、次の構造と元帳が表示されます (図 4)。

図4

マスターブート領域: このストレージデバイスの全体的および基本的な情報を記録します。たとえば、セクターのサイズ、各クラスターのサイズ、ヘッドの数、ディスクセクターの合計数、FAT テーブルの数、パーティションのブートコードなどの情報です。

パーティションテーブル: これはストレージ台帳です。パーティションテーブルが失われるとデータが失われることを意味するため、通常は FAT1 と FAT2 の 2 つのコピーが保持されます。パーティションテーブルには主に各クラスターの使用状況が記録されます。この位置のクラスターが空の場合、使用されていないことを意味します。特別なマークは不良なクラスターを表します。その位置にデータがある場合は、ファイルブロックの次の位置を示します。

ディレクトリ領域: ディレクトリとファイルの場所の情報を記録します。

データ領域: ファイルの特定の情報を記録する領域。

次の例は、FAT ファイルシステムとは何かを理解するのに役立ちます。

各クラスターが 8 つのセクターで構成されていると仮定すると、サイズは 512 * 8 = 4K になります。図 5 に示すように、ルートディレクトリ内の readme.txt ファイルのサイズは 10K です。

図5

1. ディレクトリ領域のルートディレクトリにある readme.txt ファイルを見つけます。 FAT テーブル内の場所は 0004 です。
2.位置0004に対応するクラスターの8セクター内の対応するファイルブロックreadme(1)を読み取ってメモリに保存し、次のデータブロック0005の位置を取得します。
3. 位置0005に対応するクラスターの8セクター内の対応するファイルブロックreadme(2)を読み取ってメモリに保存し、次のデータブロック0008の位置を取得します。
4.位置0005に対応するクラスタの4つのセクターから対応するファイルブロックreadme(3)を読み取り、メモリに保存し、終了マークを取得します。
5. readme(1)、readme(2)、readme(3)を1つのreadmeファイルに結合します。

この例では、FAT ファイルシステムでは、FAT テーブルとディレクトリエントリを照会することによってファイルの保存場所が決定されることがわかります。ファイルの配布はクラスター内のデータブロックに基づいており、ファイルデータが保存されているテキストは「チェーン」によって示されます。

ファイルを読み取るときは、ファイルヘッダーから読み取りを開始する必要があります。この方法では、読書効率は高くありません。

さまざまな Linux ファイルシステムは類似しており、図 6 に示すように、通常は ext ファイルシステムを使用します。

図6

ブートブロックはサーバーの起動に使用されます。このパーティションがブートパーティションでない場合でも、保持されます。

スーパーブロックには、ファイルシステムの種類、i ノードの数、データブロックの数など、ファイルシステムに関する情報が格納されます。

Inodes ブロックにはファイルの inode 情報が格納され、各ファイルは inode に対応します。ファイルのメタ情報、具体的には次のものが含まれます。

ファイル内のバイト数

ファイル所有者のユーザーID

ファイルのグループID

ファイルの読み取り、書き込み、実行権限

ファイルには 3 つのタイムスタンプがあります。ctime は inode が最後に変更された時刻、mtime はファイルの内容が最後に変更された時刻、atime はファイルが最後に開かれた時刻を示します。

リンクの数、つまりこのinodeを指すファイル名の数

ファイルデータブロックの場所

ディレクトリまたはファイルを表示する場合、まず inode テーブルからファイル属性とデータ保存ポイントが検出され、次にデータブロックからデータが読み取られます。

データブロック: ディレクトリとファイルのデータを格納します。

\var\readme.txt ファイルプロセスを読むと、図 7 に示すように、ext ファイルシステムを理解することができます。

図7

1. ルートディレクトリ A に対応する inode ノードは 2 であり、inode1 に対応するデータブロックは d1 です。
2. d1 の内容を検索すると、ディレクトリ var に対応する inode は 28 であり、対応するデータブロックは d5 であることがわかります。
3. d5 の内容を検索し、readme.txt が inode=70 に対応していることを確認します。
4. Inode70 はデータ領域 d2、d3、および d6 ブロックを指します。これらのデータブロックを読み取り、メモリ内の d2、d3、および d6 データブロックを結合します。

ハードディスクをフォーマットすると、オペレーティングシステムによってハードディスクが自動的に 2 つの領域に分割されます。

1 つはファイルデータを格納するデータ領域です。
もう 1 つは、inode に含まれる情報を格納する inode 領域です。

inode リソースが消費されると、データ領域に空き領域があっても新しいファイルを書き込むことができなくなります。

概要: Windows ファイルシステムは多くの場合「シリアル」ですが、Linux ファイルシステムは「パラレル」です。

分散ファイルシステムを見てみましょう。

永続層を提供するストレージ空間が単一のデバイスではなく、それぞれがネットワークを介して接続された複数のデバイスである場合、データは複数のストレージデバイスに分散して保存されます。つまり、メタデータにはデータブロックの数だけでなく、データノードも記録されます。

このように、メタデータは各データノードに保存され、リアルタイムで同期される必要があります。実際、これを実行するのは非常に困難です。メタデータサーバーを分離して「マスタースレーブ」アーキテクチャにすると、各データノードでメタデータテーブルを維持する必要がなくなり、データ保守の難しさが軽減され、効率が向上します。

Hadoop のファイルシステム HDFS は、典型的な分散ファイルシステムです。

図8

1. クライアントはFileAを64Mのブロックに分割します。ブロック1とブロック2の2つのブロックに分割します。
2. クライアントは、図の紫色の点線 1 で示されているように、nameNode に書き込みデータ要求を送信します。
3. NameNode ノードはブロック情報を記録します。そして、図の赤い点線 2 で示すように、利用可能な DataNode をクライアントに返します。

ブロック1: ホスト11、ホスト22、ホスト31

ブロック2: ホスト11、ホスト21、ホスト32

4. クライアントはブロック 1 を DataNode に送信します。送信プロセスはストリーミング書き込みです。

ストリーミング書き込みプロセス:

1) 64M ブロック 1 を 64K パッケージに分割します。

2) 次に最初のパッケージをホスト11に送信します。

3) パッケージを受信した後、host11 は最初のパッケージを host22 に送信し、クライアントは 2 番目のパッケージを host11 に送信します。

4) ホスト22は最初のパッケージを受信した後、それをホスト31に送信し、同時にホスト11から2番目のパッケージを受信します。

5) 図の黒い点線 3 で示すように、ブロック 1 が送信されるまでこれを繰り返します。

6) Host11、host22、host31 は、NameNode とクライアントに「メッセージが送信されました」という通知を送信します。

7) メッセージを受信したクライアントは、書き込みが完了したことを通知するメッセージをネームノードに送信します。これで本当に完了です。

8) ブロック 1 を送信した後、図の青い点線 4 に示すように、ブロック 2 がホスト 11、ホスト 21、ホスト 32 に送信されます。

……。

HDFS は分散ストレージのプロトタイプであり、後ほど詳しく説明します。

3. ストレージメディア

倉庫にはさまざまな種類の保管媒体があります。最も一般的に使用されているのは、ディスクと SSD ディスク、CD、テープなどです。ディスクはコスト効率の良さから常に主要な地位を占めてきました。

丸い磁気ディスクが四角い密閉された箱の中に入っており、動くとききしむ音がします。これは私たちがよく目にする磁気ディスクです。磁気ディスクは実際にデータを保存する媒体であり、各磁気ディスクの前面と背面には磁気ヘッドが「浮いている」状態になっています。

ディスクは多数の同心円に分割されており、各同心円はトラックと呼ばれます。各トラックは小さなセクターに分割されており、各セクターには 512B のデータが保存できます。磁気ヘッドは磁気ディスク上で高速回転し、トラックを連続的に変更してデータを読み書きします。

実際、磁気ディスクは高速回転を担い、磁気ヘッドは磁気ディスク上の水平方向の移動のみを担っています。ディスクのパフォーマンスを決定する主な要因は、ディスクの回転速度、ヘッドの切り替え、ディスク、各ディスクの容量、およびインターフェース速度です。回転速度が速いほど、トラック変更時間が短くなり、単一チップの容量が大きくなるため、ディスクのパフォーマンスが向上します。

図9

図10

図11

ディスクのパフォーマンスは、主に IOPS とスループットの 2 つのパラメータに基づいて測定されます。

IOPS は、ディスクが 1 秒間に読み書きする回数です。

スループットとは、読み取られるデータの量です。

実際、これらの指標には、大きなパケット (ブロック) か小さなパケット (ブロック) か、読み取りか書き込みか、ランダムか連続かといった前提条件が必要です。一般的に、メーカーが提供するディスク IOPS パフォーマンスは、小さなパケットと順次読み取りのテスト指標を指します。この指標は通常、最大値です。

X86 サーバーでよく使用される SATA ディスクと SAS ディスクのパフォーマンスは次のとおりです。

図12

実際の生産見積もりによると、SATA 7200 rpm ディスクは約 60 IOPS と 70 MB/秒のスループットを提供します。

2014 年に初めて使用した生容量 2P SRVSAN ストレージのデータ永続性レイヤーでは、12 台の内蔵 SATA7200 3TB ハードドライブを搭載した 57 台の X86 サーバーが使用されています。合計で 684 個のディスクがあり、提供される IOPS は 41,040 個、速度は 47.88 GB/秒のみです。

これらの指標は明らかにストレージのニーズを満たすことができないため、これを「加速」する方法を見つける必要があります。

実際、機械式ハードディスクには多くの最適化が施されています。たとえば、セクターアドレスは連続して番号付けされていません。

ディスクの回転速度が十分速いため (7200 rpm、つまり 1 秒間に 120 回転、1 回転は 8.3 ミリ秒、つまり同じトラックの読み取りと書き込みの最大遅延は 8.3 秒)、ヘッドが読み取りまたは書き込みを逃さないように、セクターアドレスは連続的ではなく、2:1 クロスファクター (1、10、2、11、3、12...) などのジャンプ番号が付けられます。

同時に、ディスクにはキャッシュとキューもあります。一度に 1 つの I/O を読み取ったり書き込んだりするわけではありません。代わりに、一定量の I/O を蓄積し、ヘッドの位置とアルゴリズムに基づいて完了します。 I/O は必ずしも「先着順」ではありませんが、効率性には準拠しています。

速度を上げる最善の方法は、SSD ディスクを使用することです。ディスクの制御部は、機械部＋制御回路で構成されています。機械部分の速度制限により、ディスクのパフォーマンスを大幅に向上させることは不可能です。 SSD は完全な電子制御を使用して優れたパフォーマンスを実現します。

SSD は、フラッシュメモリを記憶媒体として使用し、適切な制御チップと組み合わせたストレージデバイスです。現在、ソリッドステートドライブの製造に使用されている NAND フラッシュには 3 種類あります。

単層ストレージ（SLC、1ビットのデータを格納）
2層ストレージ（MLC、4ビットデータを保存）
3層ストレージ（TLC、8ビットデータを保存）

SLC はコストが最も高く、寿命が最も長いですが、アクセス速度が最も速く、TLC はコストが最も低く、寿命が最も短いですが、アクセス速度が最も遅くなります。コスト削減のため、サーバーで使用されるエンタープライズレベルの SSD はすべて MLC を使用し、TLC は USB フラッシュドライブとして使用できます。

図13

SSD の普及には、コストの高さ、書き込み回数の制限、修復不可能な損傷、書き込み回数の増加やドライブの空き容量不足による速度低下など、依然としていくつかの障害があります。

ページは、ディスクの最小の IO 単位セクターに対応し、SSD の最小単位です。

たとえば、各ページには 512B のデータと 218b のエラー訂正コードが格納され、128 ページが 1 ブロック (64KB) を形成し、2048 ブロックが 1 つの領域を形成し、フラッシュメモリチップは 2 つの領域で構成されます。ページサイズが大きいほど、フラッシュチップの容量が大きくなります。

しかし、SSD には、特定のページのデータを変更するとブロック全体に影響するという悪い癖があります。このページが配置されているデータのブロック全体をキャッシュに読み込む必要があり、その後ブロックが 1 に初期化され、その後データがキャッシュから読み込まれて書き込まれます。

SSD の場合、速度は問題にならないかもしれませんが、書き込み回数は制限されているため、ブロックが大きいほど良いです。もちろん、機械式ディスクにも同様の問題が存在します。ブロックが大きいほど、読み取りと書き込みの速度は速くなりますが、ブロックが完全に書き込まれていなくても、ブロックのスペースを占有するため、無駄も深刻になります。

SSD のパフォーマンスは、モデルやメーカーによって大きく異なります。以下は、分散ブロックストレージがキャッシュとして使用する SSD パラメータです。

PCIe 2.0 インターフェースを採用し、容量は 1.2T、総合読み取りおよび書き込み IOPS (4k スモールパケット) は 260,000 回、読み取りスループットは 1.55GB/秒、書き込みスループットは 1GB/秒です。

SRVSAN サーバーは、キャッシュとして SSD と 12 個の 7200 rpm 3T SATA ディスクで構成されています。ディスクは 1200 倍および 1200M のスループットのみを提供します。

これはキャッシュ SSD によって提供される容量よりもはるかに少ないため、キャッシュに直接アクセスすると非常に高いストレージパフォーマンスを実現できます。 SRVSAN の鍵は、ホットデータのアルゴリズムを計算し、ホットデータのヒット率を向上させることです。

高価な SSD をキャッシュとして使用し、安価な SATA ディスクを容量層として使用します。

<<: クラウド自動化とオーケストレーションの間の障壁: それをどうやって打破するか?

>>: ソフトウェア定義アーキテクチャによりクラウドアクセスのネットワーク最適化が可能

分散ストレージについて知っておくべきこと（写真とテキスト付き）

製品のマーケティングにWeiboを使用するのは信頼できるでしょうか?

#NewYearPromotion# racknerd: 米国 VPS は年間 10.18 ドルから、ロサンゼルス/サンノゼを含む 8 つのデータセンターがオプションで利用可能

onetechcloud: 完全に最適化されたライン VPS、64 元/四半期、米国 CN2/ネイティブ/高防御 + 香港 CN2/CMI ライン

贅沢か奇跡か？黄太極の100億の思考

ニュース記事の過剰問題についての簡単な議論

リベートサイトは廃れており、ねずみ講を調査して対処するのは困難です

ホリデーブランドのマーケティングプロモーションのスキルと戦略！

ウェブサイト KPI シリーズ: ショッピングカートあたりの平均アイテム数

朗報：iwstack が米国ダラスにデータセンターを開設

oneasiahost 簡単なレビュー

推薦する

ufovpsの「日本クラウドサーバーCN2 GIA（東京）」シリーズのVPS、3ネットワークバックホールCN2 GIAの簡単なレビュー

権威あるウェブサイトを理解する: コンテンツの権威とナビゲーションの権威

それは単に利益が大きいからでしょうか? Google が Web3 を導入する意図は何ですか?

パブリッククラウドを導入して企業がコストを削減できる6つの方法

ウェブサイトのコンテンツを読むためにページをめくる必要があるのはなぜですか?

Tencent Cloud は、わずか 7 日間でデータウェアハウスを構築できる新しいアジャイルデータウェアハウス製品をリリースしました。

早速始めましょう。この記事では、クラウドネイティブ時代のコンテナセキュリティについて理解を深めていきます。

SEOの典型的なケース：サイトにニュースが掲載されない本当の理由

業務再開が迫る中、伝統的な産業は4つの戦略でオンライン販売の成長を達成するためにデジタルマーケティングを採用しています。

cloudcone-$2.45/KVM クラウド/512M メモリ/10G ハードディスク/3T トラフィック/Multacom Los Angeles

ウェブサイトの統計情報を使用して、さまざまな観点からコンバージョン率を調査し、改善します。

コロクロッシングはどうですか?コロクロッシングロサンゼルスVPSの簡単なレビュー

ウェブサイト構築に新しいウェブサイトを素早く組み込む方法

WeChatで借用書を発行できるようになりました。標準テンプレート、定期的な返済リマインダー、その他の機能が提供されています。

3月、IDCのブランド注目度指数の上位10ブランドである中国HiChinaの成長率は2,000近くに達した。