クラウド ストレージのパフォーマンス: 可用性と耐久性の違い

クラウド ストレージのパフォーマンス: 可用性と耐久性の違い

車のエンジンをかけたり、電化製品を壁のコンセントに差し込んだり、ハードドライブ上のファイルをダブルクリックしたりすると、何が起こるかはおわかりでしょう。これらにより、あなたが望む結果が得られます。しかし、クラウドでは、貴重なファイルは他人の手に渡ります。毎回確実に結果が得られると確信していますか?

[[276070]]

オブジェクト ストレージに制御を渡す前に、潜在的なクラウド ストレージ プロバイダーはいくつかの質問に答える必要があります。あなたのビジネスが依存している IT 基盤が十分に保護されていると確信できますか?データが予期せず利用できなくなる可能性はどれくらいありますか?

耐久性: よく宣伝されているが、ほとんどは学術的なものだ

ハードドライブは故障します。ハードドライブが満載のデータセンターでは、ハードドライブは頻繁に故障します。クラウドストレージプロバイダーのBackblazeが新たに公開したハードドライブデータによると、2019年第2四半期に108,461台のハードドライブのうち474台が故障し、年間故障率は1.8%となった。しかし、これらの障害はいずれも顧客に影響を与えませんでした。なぜなら、Backblaze、Microsoft、Amazon、Google などの企業にとって、データの耐久性、つまり健全性は非常に重要だからです。ホストされているファイルの損失や破損を防ぐために、極端な対策を講じています。

すべての主要なクラウド サービス プロバイダーは、ファイルを複数のチャンクに分割する、消失訂正符号と呼ばれる前方誤り訂正テクノロジを使用しています。次に、元のファイルのいずれかが失われた場合にファイルを再構築するために使用される追加のパリティ ブロックを計算します。バックブレイズのマーケティング担当副社長アヒン・トーマス氏は、同社のリード・ソロムベースのJavaライブラリは各ファイルを17個のフラグメントに分割し、さらに3個のフラグメントを計算して奇数ビットを維持すると述べた。これらのフラグメントは 20 個の異なるドライブに分散されます。

「いつドライブが3台失われても、すべては大丈夫だ」とトーマス氏は語った。 「それでは、4 番目のドライブを失う前に、失われた 3 つのドライブを交換して再構築できるかどうかという疑問が生じます。」

Facebook もコールド ストレージ ラックでリード ソロモン消去コードを使用しており、Microsoft Azure Storage には独自のネイティブ再構築コードがあり、再構築に必要な消去コード フラグメントの数を削減できると主張しています。

ハードドライブの故障率に関する統計、特定のクラウド プロバイダーの消去コーディング アーキテクチャに関する十分な理解、および故障後の再構築にかかる時間に関する大まかな知識があれば、複雑な計算を使用してデータの耐久性を計算できます。ただし、クラウド プロバイダー (Backblaze を除く) は通常この情報を共有しないため、パーセンテージに反映された耐久性の主張にしか頼ることができません。 Microsoft の地理的に冗長化された Azure ストレージ プランでは、耐久性が 9 で測定されるのが一般的です。 11 個の 9 は通常、99.9999999% の耐久性を意味します。このレベルでは、9 を 1 つ増やすか減らすかという議論は、実用的なものから学術的なものへと変わります。

「どのクラウドサービスでもデータが失われる可能性は極めて低い」とバックブレイズのトーマス氏は続けた。 「カードに何らかの問題が発生し、メールを確認しなかったり、アカウントに通知が届かなかったりする可能性があります。」

実際、次の世紀に地球が危険な小惑星に衝突する可能性は、大規模なクラウドプロバイダーがランダムにデータを失う可能性よりも高いのです。重要なのは、プロバイダーがハードウェアが最終的には故障することを認識しており、故障を念頭に置いて設計していることです。本格的なクラウド ストレージ プロバイダーであれば、データの耐久性はほぼ保証されます。

ただし、持続性の計算では人的要因が考慮されないことに注意してください。間違ったコード行によってバグが導入されると、システム全体が完全に破壊される可能性があります。武力紛争によりデータセンターが失われる可能性があります。あるいは、理論的には、一連の自然災害が、ファイルを地理的に分散させている複数のデータセンターの場所に影響を及ぼす可能性もあります。これらは永続性の計算の範囲外の要因であるため、IT 管理者はこれらを考慮する必要があります。

「当社の最大の顧客の一つはゲノム解析会社で、データのコピーをオンサイトで保管しており、一つは東海岸の Amazon S3 に、もう一つは西海岸の Backblaze B2 に保管しています」と Backblaze のトーマス氏は語る。 「これにより、ベンダーと地理的多様性の両方が実現します。」

参照する永続性仕様に関係なく、重要なデータのコピーを 3 つ保持することがベスト プラクティスです。ほとんどの組織はこの理想に達していませんが、CIO と家庭ユーザーは同様に、永続性に影響を与えるすべての変数を考慮する必要があります。

必要なときにファイルはそこにありますか?

したがって、データはクラウド内で安全に保管されているので安心してください。しかし、クラウド プロバイダーから、データへのアクセス性について同様の保証を受けられますか?現代のデータ センターはユビキタスな稼働時間に近づくことができますが、常にそうであるとは限りません。可用性は、データにアクセスできる時間の長さを定量化します。 ISP の問題、ネットワーク ハードウェアの障害、停電など、クラウド ストレージ プロバイダーへの接続に影響するその他の変数は考慮されません。ただし、これは永続性の仕様よりはまだはるかに低いです。 99%、99.9%、または 99.99% の可用性保証が一般的であり、定期的なデータ センターのメンテナンスが可能になります。

必要な可用性のレベルは、データをどのように使用するか、またいくら支払ってもよいかによって決まります。 99% のケースでは、年間 3.65 日間のダウンタイムを許容できます。忙しい電子商取引サイトでは、このような売上の損失は許容されません。 9 (99.9%) を追加すると、アイドル時間は年間 8.75 時間になり、99.99% ではダウンタイムが約 53 分に制限されます。

クラウド サービス プロバイダーは、サービス レベル契約 (SLA) で可用性を公開し、保証します。プロバイダーがこの義務を果たせなかった場合、翌月の請求書に適用されるサービスクレジットの形で料金の一部を払い戻すことができます。多くの場合、これらは、サービス中断が発生したときに、より積極的に対応できるようにするために階層化されています。たとえば、Amazon S3 標準オブジェクト ストレージ クラスは 99.99% の可用性を実現するように設計されており、月間稼働率が 99.9% ~ 99.0% の場合、10% のサービスクレジットが付与されます。 1 か月の可用性が 99.0% 未満で 95.0% を超える場合、値は 25% に増加します。サービスが 95% を下回ると、100% のクレジットが提供されます。

もちろん、金額のためにこれをやっているわけではないでしょう。 SLA で指定された可用性を満たすプロバイダーが必要です。この契約は、単にサプライヤーが納品能力に自信を持っていることを示しているだけです。

両方か、それともどちらもか?

多くの場合、必ずしも最高の可用性やフェイルセーフの耐久性を購入するわけではありません。クラウド ストレージは、ストレージ クラスを指定したり、月ごとの可用性を動的に決定したり、11 ナイン未満の非クリティカルなデータの耐久性を縮小したりできるレベルまで進化しました。

Google Cloud Storage は、標準ストレージ クラス、ニアライン ストレージ クラス、コールドライン ストレージ クラスに分けられます。標準は、短期間に頻繁にアクセスされる (またはホットな) データの保存に適しています。同社では、さらにドリルダウンして単一、二重、または複数のリージョンを定義し、パフォーマンスと地理的な冗長性を微調整できるようにしています。もちろん、データをさまざまな場所に保存することで、Google は SLA を 99.0% から 99.95% に引き上げる柔軟性を獲得し、通常の月間可用性は 99.99% を超えますが、これは驚くことではありません。ニアライン ストレージは、バックアップ、アーカイブ、ロングテール マルチメディア コンテンツなど、月に 1 回以下しか読み取られたり変更される予定のないデータに適しています。一方、コールドライン ストレージは、法律上または規制上の理由や災害復旧のために保管される、アクセス頻度の低いデータとして説明されます。 Coldline はコストが大幅に低くなりますが、可用性が若干低く、最低 90 日間の保存期間が必要であり、データ アクセス コストが発生します。

Amazon の Simple Storage Service (S3) には、さまざまなユースケースに対応する独自のストレージ クラスがあります。一方、S3 Standard は、頻繁にアクセスされるデータに対して高い耐久性、可用性、パフォーマンスを提供します。一方、S3 1 ゾーン - 低頻度アクセス (IA) では、地理的な冗長性が削減され、ストレージ料金が大幅に割引されますが、データの取得にはより高い料金が必要になります。

Amazon、Google、Microsoft は、カスタム クラウド ストレージ ソリューションを構成するための十分な柔軟性を提供していますが、これは良い点であると同時に難しい点でもあります。ストレージ、リクエスト、管理、転送、アクセラレーション、リージョン間レプリケーションに基づいてサービスを構築する場合、同様に複雑な価格表を解析する際に混乱してしまうことはよくあります。 11 ナインの耐久性と 99.9 パーセントの可用性を備えた純粋なクラウド ストレージを探しているのであれば、Backblaze のようなプロバイダーは、ビッグ 3 のいずれよりもシンプルで手頃な価格です。より計算負荷の高いワークロードやミリ秒単位の災害復旧ポイントに取り組むようになると、エッジ コンピューティング、ハイエンド AI、機械学習に適したオブジェクト ストレージ以外のサービスを検討することが理にかなっています。

耐久性と可用性の概念をしっかりと理解することで、クラウド ストレージ プロバイダーが提供するサービスを信頼しやすくなります。内部ストレージに関連する機器、メンテナンス、電力、人件費を削減することが、組織の最も重要なファイルの保護にかかるコストを節約する鍵となります。

<<:  分散ID生成スノーフレークアルゴリズム

>>:  エッジコンピューティングと5Gテクノロジーが小売体験をどのように再定義するか

推薦する

ランキングはあってもトラフィックがないキーワードの理由と解決策について簡単に説明します。

私は約2年間、会社のウェブサイトのプロモーションを担当しています。Baidu入札に加えて、SEO最適...

#黒5# hostsolutions: 著作権/苦情なし、大容量ハードディスク/大容量トラフィック、VPS/専用サーバー

ルーマニアのホスティング会社 HostSolutions は、今から 1 週間にわたるブラック フラ...

微博は、QQオンラインショッピングの販売者が預かり金の返還を要求し、テンセントが一部の販売者のQQグループを解散したと報じた。

4月2日、QQオンラインショッピングプラットフォームとJD POPプラットフォームは今晩共同で声明を...

オンサイト最適化を通じてホームページのキーワードランキングを向上させる

ウェブサイトの場合、ホームページとチャンネルページはサイト全体で最も高い重みを集めます。では、ホーム...

hostdoc: 新しいロサンゼルス データ センター、I9-9900K+NVMe SSD+10Gbps 帯域幅を使用した安価で高性能な VPS

Hostdoc は、米国ロサンゼルスに新しいデータセンターを追加することを発表しました。このマシン群...

毎日の話題:モバイルインターネットの波でシャンダの「伝説」時代は終わった

A5ウェブマスターネットワーク(www.admin5.com)は4月18日、かつてのインターネット大...

先進的な企業がクラウドファーストのアプローチを採用する必要がある理由

クラウド コンピューティングは、イノベーション、成長、そしてビジネスの急速な拡大を支援するプラットフ...

インターネットポート: スウェーデンの VPS、著作権なし、月額 2 ユーロ、512M メモリ/1 コア/10g SSD/5T トラフィック

internetport (2008~) はスウェーデンの会社で、主にスウェーデンで VPS、独立サ...

host1plus-$3.75/768m メモリ/30G ハードディスク/1T トラフィック/5 コンピュータ ルーム (オプション)

英国を拠点とする host1plus は現在、VPS を 25% 割引しています。最初の 25% 割...

スケジューリングとオーケストレーションのための 7 つの CNCF ツール

Kubernetes のようなコンテナ マネージャーは、多数のコンテナを管理する上で重要になっていま...

Amazon Redshift の紹介

近年、データ ウェアハウスの状況は劇的に変化しており、社内ソリューションの数分の 1 のコストで、極...

ウェブサイト分析: 主要なデジタル E コマース コンテンツのオンライン最適化 (パート 2)

【1号につき1文】イノベーションを効果的に保護しなければ、イノベーションは生まれません。私たちにはス...

sharktech (シャークデータセンター) - 40G の高防御、すべての VPS が 50% オフ、史上最低価格

Sharktech の VPS は特別なことをしています。すべての VPS が 50% オフという前...

Kubernetesの代替品の必要性

​k8s はコンテナ オーケストレーションの分野ではよく知られるようになりました。多くの開発者にとっ...

テンセントクラウド、データセンターの自動運用と管理の向上を支援するテンセント知微の新製品システムを発表

11月24日、第9回CDCCデータセンター標準サミットにおいて、Tencent Cloudは新しくア...