クラウド ストレージのパフォーマンス: 可用性と耐久性の違い

クラウド ストレージのパフォーマンス: 可用性と耐久性の違い

車のエンジンをかけたり、電化製品を壁のコンセントに差し込んだり、ハードドライブ上のファイルをダブルクリックしたりすると、何が起こるかはおわかりでしょう。これらにより、あなたが望む結果が得られます。しかし、クラウドでは、貴重なファイルは他人の手に渡ります。毎回確実に結果が得られると確信していますか?

[[276070]]

オブジェクト ストレージに制御を渡す前に、潜在的なクラウド ストレージ プロバイダーはいくつかの質問に答える必要があります。あなたのビジネスが依存している IT 基盤が十分に保護されていると確信できますか?データが予期せず利用できなくなる可能性はどれくらいありますか?

耐久性: よく宣伝されているが、ほとんどは学術的なものだ

ハードドライブは故障します。ハードドライブが満載のデータセンターでは、ハードドライブは頻繁に故障します。クラウドストレージプロバイダーのBackblazeが新たに公開したハードドライブデータによると、2019年第2四半期に108,461台のハードドライブのうち474台が故障し、年間故障率は1.8%となった。しかし、これらの障害はいずれも顧客に影響を与えませんでした。なぜなら、Backblaze、Microsoft、Amazon、Google などの企業にとって、データの耐久性、つまり健全性は非常に重要だからです。ホストされているファイルの損失や破損を防ぐために、極端な対策を講じています。

すべての主要なクラウド サービス プロバイダーは、ファイルを複数のチャンクに分割する、消失訂正符号と呼ばれる前方誤り訂正テクノロジを使用しています。次に、元のファイルのいずれかが失われた場合にファイルを再構築するために使用される追加のパリティ ブロックを計算します。バックブレイズのマーケティング担当副社長アヒン・トーマス氏は、同社のリード・ソロムベースのJavaライブラリは各ファイルを17個のフラグメントに分割し、さらに3個のフラグメントを計算して奇数ビットを維持すると述べた。これらのフラグメントは 20 個の異なるドライブに分散されます。

「いつドライブが3台失われても、すべては大丈夫だ」とトーマス氏は語った。 「それでは、4 番目のドライブを失う前に、失われた 3 つのドライブを交換して再構築できるかどうかという疑問が生じます。」

Facebook もコールド ストレージ ラックでリード ソロモン消去コードを使用しており、Microsoft Azure Storage には独自のネイティブ再構築コードがあり、再構築に必要な消去コード フラグメントの数を削減できると主張しています。

ハードドライブの故障率に関する統計、特定のクラウド プロバイダーの消去コーディング アーキテクチャに関する十分な理解、および故障後の再構築にかかる時間に関する大まかな知識があれば、複雑な計算を使用してデータの耐久性を計算できます。ただし、クラウド プロバイダー (Backblaze を除く) は通常この情報を共有しないため、パーセンテージに反映された耐久性の主張にしか頼ることができません。 Microsoft の地理的に冗長化された Azure ストレージ プランでは、耐久性が 9 で測定されるのが一般的です。 11 個の 9 は通常、99.9999999% の耐久性を意味します。このレベルでは、9 を 1 つ増やすか減らすかという議論は、実用的なものから学術的なものへと変わります。

「どのクラウドサービスでもデータが失われる可能性は極めて低い」とバックブレイズのトーマス氏は続けた。 「カードに何らかの問題が発生し、メールを確認しなかったり、アカウントに通知が届かなかったりする可能性があります。」

実際、次の世紀に地球が危険な小惑星に衝突する可能性は、大規模なクラウドプロバイダーがランダムにデータを失う可能性よりも高いのです。重要なのは、プロバイダーがハードウェアが最終的には故障することを認識しており、故障を念頭に置いて設計していることです。本格的なクラウド ストレージ プロバイダーであれば、データの耐久性はほぼ保証されます。

ただし、持続性の計算では人的要因が考慮されないことに注意してください。間違ったコード行によってバグが導入されると、システム全体が完全に破壊される可能性があります。武力紛争によりデータセンターが失われる可能性があります。あるいは、理論的には、一連の自然災害が、ファイルを地理的に分散させている複数のデータセンターの場所に影響を及ぼす可能性もあります。これらは永続性の計算の範囲外の要因であるため、IT 管理者はこれらを考慮する必要があります。

「当社の最大の顧客の一つはゲノム解析会社で、データのコピーをオンサイトで保管しており、一つは東海岸の Amazon S3 に、もう一つは西海岸の Backblaze B2 に保管しています」と Backblaze のトーマス氏は語る。 「これにより、ベンダーと地理的多様性の両方が実現します。」

参照する永続性仕様に関係なく、重要なデータのコピーを 3 つ保持することがベスト プラクティスです。ほとんどの組織はこの理想に達していませんが、CIO と家庭ユーザーは同様に、永続性に影響を与えるすべての変数を考慮する必要があります。

必要なときにファイルはそこにありますか?

したがって、データはクラウド内で安全に保管されているので安心してください。しかし、クラウド プロバイダーから、データへのアクセス性について同様の保証を受けられますか?現代のデータ センターはユビキタスな稼働時間に近づくことができますが、常にそうであるとは限りません。可用性は、データにアクセスできる時間の長さを定量化します。 ISP の問題、ネットワーク ハードウェアの障害、停電など、クラウド ストレージ プロバイダーへの接続に影響するその他の変数は考慮されません。ただし、これは永続性の仕様よりはまだはるかに低いです。 99%、99.9%、または 99.99% の可用性保証が一般的であり、定期的なデータ センターのメンテナンスが可能になります。

必要な可用性のレベルは、データをどのように使用するか、またいくら支払ってもよいかによって決まります。 99% のケースでは、年間 3.65 日間のダウンタイムを許容できます。忙しい電子商取引サイトでは、このような売上の損失は許容されません。 9 (99.9%) を追加すると、アイドル時間は年間 8.75 時間になり、99.99% ではダウンタイムが約 53 分に制限されます。

クラウド サービス プロバイダーは、サービス レベル契約 (SLA) で可用性を公開し、保証します。プロバイダーがこの義務を果たせなかった場合、翌月の請求書に適用されるサービスクレジットの形で料金の一部を払い戻すことができます。多くの場合、これらは、サービス中断が発生したときに、より積極的に対応できるようにするために階層化されています。たとえば、Amazon S3 標準オブジェクト ストレージ クラスは 99.99% の可用性を実現するように設計されており、月間稼働率が 99.9% ~ 99.0% の場合、10% のサービスクレジットが付与されます。 1 か月の可用性が 99.0% 未満で 95.0% を超える場合、値は 25% に増加します。サービスが 95% を下回ると、100% のクレジットが提供されます。

もちろん、金額のためにこれをやっているわけではないでしょう。 SLA で指定された可用性を満たすプロバイダーが必要です。この契約は、単にサプライヤーが納品能力に自信を持っていることを示しているだけです。

両方か、それともどちらもか?

多くの場合、必ずしも最高の可用性やフェイルセーフの耐久性を購入するわけではありません。クラウド ストレージは、ストレージ クラスを指定したり、月ごとの可用性を動的に決定したり、11 ナイン未満の非クリティカルなデータの耐久性を縮小したりできるレベルまで進化しました。

Google Cloud Storage は、標準ストレージ クラス、ニアライン ストレージ クラス、コールドライン ストレージ クラスに分けられます。標準は、短期間に頻繁にアクセスされる (またはホットな) データの保存に適しています。同社では、さらにドリルダウンして単一、二重、または複数のリージョンを定義し、パフォーマンスと地理的な冗長性を微調整できるようにしています。もちろん、データをさまざまな場所に保存することで、Google は SLA を 99.0% から 99.95% に引き上げる柔軟性を獲得し、通常の月間可用性は 99.99% を超えますが、これは驚くことではありません。ニアライン ストレージは、バックアップ、アーカイブ、ロングテール マルチメディア コンテンツなど、月に 1 回以下しか読み取られたり変更される予定のないデータに適しています。一方、コールドライン ストレージは、法律上または規制上の理由や災害復旧のために保管される、アクセス頻度の低いデータとして説明されます。 Coldline はコストが大幅に低くなりますが、可用性が若干低く、最低 90 日間の保存期間が必要であり、データ アクセス コストが発生します。

Amazon の Simple Storage Service (S3) には、さまざまなユースケースに対応する独自のストレージ クラスがあります。一方、S3 Standard は、頻繁にアクセスされるデータに対して高い耐久性、可用性、パフォーマンスを提供します。一方、S3 1 ゾーン - 低頻度アクセス (IA) では、地理的な冗長性が削減され、ストレージ料金が大幅に割引されますが、データの取得にはより高い料金が必要になります。

Amazon、Google、Microsoft は、カスタム クラウド ストレージ ソリューションを構成するための十分な柔軟性を提供していますが、これは良い点であると同時に難しい点でもあります。ストレージ、リクエスト、管理、転送、アクセラレーション、リージョン間レプリケーションに基づいてサービスを構築する場合、同様に複雑な価格表を解析する際に混乱してしまうことはよくあります。 11 ナインの耐久性と 99.9 パーセントの可用性を備えた純粋なクラウド ストレージを探しているのであれば、Backblaze のようなプロバイダーは、ビッグ 3 のいずれよりもシンプルで手頃な価格です。より計算負荷の高いワークロードやミリ秒単位の災害復旧ポイントに取り組むようになると、エッジ コンピューティング、ハイエンド AI、機械学習に適したオブジェクト ストレージ以外のサービスを検討することが理にかなっています。

耐久性と可用性の概念をしっかりと理解することで、クラウド ストレージ プロバイダーが提供するサービスを信頼しやすくなります。内部ストレージに関連する機器、メンテナンス、電力、人件費を削減することが、組織の最も重要なファイルの保護にかかるコストを節約する鍵となります。

<<:  分散ID生成スノーフレークアルゴリズム

>>:  エッジコンピューティングと5Gテクノロジーが小売体験をどのように再定義するか

推薦する

Kafka をゼロから使い始めるのに役立つ非常に詳細な説明です。

Kafkaを理解するKafka の紹介Kafka は分散ストリーミング プラットフォームです。 Ka...

Baidu エントリの通過率を向上させる方法

最近、大手ウェブサイトは、これが真実かどうかに関わらず、Baidu 製品内のリンクは重みをエクスポー...

ウェブサイトSEO担当者の敷居が上がる

現在、さまざまな検索エンジンのアップグレード、アルゴリズムの更新、ルールの変更により、ウェブサイトの...

エッジコンピューティングはコロナウイルス後に繁栄すると予想される

コロナウイルスが世界的に流行する前は、エッジコンピューティングはIT分野で最も注目されている新興トレ...

ポイントウォールマシンは全く効果がありません! ASO 介入が回復するまでにどれくらいの時間がかかりますか?

Xiaomaowan トライアルポイントウォールセルフサービス配信システム: e.xiaomaow...

タオバオ無料ブログマーケティング

誰もが Taobao Affiliate をよく知っています。Taobao Affiliate とは...

週刊ニュースレビュー:Xiaomiフォーラムのユーザー800万人のデータベースが流出、Jumei Youpinが今夜上場へ

1. 中国のビットコインは衝撃的な規制危機に直面しており、破産の波が押し寄せている規制当局からの連絡...

123.125.71.* Baidu Spider IPセグメントの詳細な説明

今日、私のウェブサイトのログにこのようなIPが見つかりました。その時はかなり緊張しました。以前、Ba...

持続可能性は企業のクラウド移行における重要な考慮事項となっている

気候への影響を軽減するためにクラウドへの移行を検討している企業にとって、持続可能性はますます重要な要...

Kubernetes をバックアップするための 5 つのベスト プラクティス

アプリケーションとデータのバックアップは、組織が頻繁に処理する必要があるものです。 Kubernet...

中小のタオバオ販売業者はWeChatマーケティングを諦めるべき

これはクリックベイトのタイトルではありませんし、下品な言葉を使ってトラブルを起こそうとしているわけで...

プロモーションにビデオを活用するには? Baiduビデオコレクションが大盛況!

月給5,000~50,000のこれらのプロジェクトはあなたの将来です動画プロモーションは多くの人にと...

2020 年のクラウド コンピューティング開発予測

2020 年には、マルチクラウド分野では、マルチクラウド管理、「ブティック」クラウド、AI/機械学習...

ウェブサイトを再構築する際に既存のランキングを保護する方法

ウェブサイトを再構築する目的は、パフォーマンスを向上させることです。したがって、最初に行うべきことは...