クラウドの停止に注意してください: データセンターの冗長性をどのように設計しますか?

クラウドの停止に注意してください: データセンターの冗長性をどのように設計しますか?

多くのパブリック クラウド プロバイダーは、日常業務で壊滅的な停止を頻繁に経験しており、IT マネージャーはクラウド プラットフォームの障害と教訓から学び、それを社内のインフラストラクチャに適用する必要があります。

クラウド プラットフォーム、特に大規模なパブリック プラットフォームには複数レベルの冗長性が備わっていますが、予期しないダウンタイムの影響を受けないプラットフォームはありません。データ センターなどのクラウド コンピューティング プラットフォームでは、ダウンタイムの原因となる問題が発生する可能性があります。

[[255698]]

オンプレミスのハードウェア障害やソフトウェア エラーは避けられませんが、パブリック クラウドは IT 管理者にこれらの問題に対処する方法を提供します。パブリック クラウドには、可用性クラスター、冗長データ センター、可用性ゾーン、クラウド リージョンが備わっており、管理者は中断が発生した場合でもビジネス オペレーションをより適切に計画できます。これらの戦略は重要ですが、管理者はパブリック クラウドの冗長性機能を活用するために信頼性の高いアプリケーションを設計する必要があります。

組織の IT 資産の回復力はインフラストラクチャよりもアプリケーションに依存するという考え方は、従来の考え方とは異なります。過去 20 年間、管理者はバックアップ、レプリケーション、その他のインフラストラクチャ中心のテクノロジーを通じて回復力を維持してきました。しかし、ほとんどのパブリック クラウド プラットフォームでは、この戦略はもはや機能しません。

近年、クラウド コンピューティング プロバイダーは耐えられないほどの損失を被っています。クラウド プロバイダーとユーザーの両方が、障害発生時にローカル クラウドの冗長性を設計する方法を学んでいるようで、管理者はそれらの教訓を従来の仮想化データ センターの冗長性に適用したいと考えています。

データセンターの冗長性の再考

ほとんどの従来の組織では、いくつかの基本的なサービスはダウンタイムを防ぐために設計されています。ネットワーク タイム プロトコルやネットワーク ルーティングなどのサービスは、多くの場合、高度な冗長性を備えるように設計されます。ただし、システムが冗長性を備えているからといって、その構成が自然な冗長性を十分に活用できるようになっているわけではありません。

一部のコア サービスには高可用性オプションがありません。 IT 部門は、ほとんどの場合、対処しなければならない技術的負債に直面しており、理想的に動作していないレガシー システムのサポートが必要になります。たとえば、一部のレガシー アプリケーション認証システムはサーバー上にのみ存在できるため、データ センターの冗長性が制限されます。

経営者はすべての卵を一つのカゴに入れるべきではありません。ほとんどの従来の展開では、データセンター内で冗長ハードウェアを使用するのが最適です。管理者は、複数の可用性ゾーンを提供できるクラウド コンピューティング プロバイダーと同様に、システムを共有しない冗長仮想化クラスターを使用することで、この戦略をさらに進めることができます。これにより、アプリケーションはデータ センター内のより高いレベルの冗長性に依存するようになりますが、ビジネス ニーズがそのレベルの冗長保護を正当化する場合にのみ価値があります。

これらの戦略をクラウドとデータセンター全体で並行して実装することで、可用性ゾーンなどのパブリック クラウド プロバイダーの概念を使用すると、同様の従来のインフラストラクチャを採用するときに役立ちます。この用語を使用すると、開発者は同様のクラウドの概念に精通している可能性があるため、インフラストラクチャの概念を理解しやすくなります。

クラウドコンピューティングの冗長性は完璧ではなく、ダウンタイムから教訓が得られる

高度に冗長化されたシステムでも、パフォーマンスの低下は避けられません。最近のパブリック クラウドの障害により、カタログ サービスが 1 つのリージョンから別のリージョンへのサービスの実行を継続できなくなりました。リダイレクトされたトラフィックが他のエリアの容量を超え、サービスが需要を満たすことができなくなります。

管理者がデータ センターの冗長性を設計する場合、停止が発生した場合の負荷を計画する必要があります。管理者はデータ センターの冗長性をサポートするために 2 台のサーバーを所有しているかもしれませんが、そのうちの 1 台のサーバーでは負荷全体を処理できない可能性があります。重要なのは、通常時と異常時のビジネスニーズを満たすシステムを設計することです。

多くの組織は、正しく構成されていれば、停止中に何か他のものを発見できたはずだと考えています。 Netflix の Chaos Monkey システムは、障害のシミュレーションでよく知られていますが、そこから得られる教訓は、管理者が実際の障害への対処を練習しなければ、IT システムがどのように反応するかを知ることはできないということです。また、システムは孤立したものではなく、各アプリケーションとサービスには依存関係があり、テストがさらに複雑になります。

プライベート データ センターやパブリック クラウドでは停止は珍しくありませんが、データ センター内では、管理者がシステムの内部の仕組みを把握し、理解している必要があることがよくあります。クラウド プロバイダーが停止を経験すると、ダウンタイムから何も学べなかったように感じるかもしれませんが、それは事実ではありません。パブリック クラウド プロバイダーは従来のデータ センターとは異なるツールと方法論を使用しますが、冗長性の構築と調整に関して得られる教訓は普遍的です。

<<:  すべてのクラウドプラットフォームが同じように作られているわけではない

>>:  AWS、Google Cloudに勝ち、クラウド災害復旧会社CloudEndureを2億5000万ドルで買収

推薦する

Cloud+ Community Salon Online の新刊が近づいてきました。準備はできていますか?

インターネットの発展は日々変化しています。ビジネス シナリオの多様化により、システム ソリューション...

2021 年のクラウド コンピューティング開発動向の予測

世界的なパブリック クラウド プロバイダーは現在、優位な地位を強化することに注力しており、その一方で...

juhost: 香港の格安 VPS、40% オフ、月額 2.99 ドルから、100M 帯域幅、1G メモリ/1 コア/20gSSD/1T トラフィック

Juhost は、安価な香港 VPS のプロモーションを開始しました。すべての香港 VPS が 40...

まだ昇進について心配ですか?ご参考までにプロモーションチャンネルのリストはこちらです

運用においては、ユーザー数と収益が最も重要な 2 つの指標です。新規ユーザーの維持率を高め、既存ユー...

webhostingbuzz - ブラックフライデーで全品85%オフ

webhostingbuzz は、ブラック フライデー ホスティング製品プロモーションを事前に発表し...

産業革新の新たな主流、迅中株は「新億中流」ダークホース起業企業トップ100にランクイン

11月22日午後、北京国際会議センターで開催された第12回年次起業家会議において、スタートアップダー...

翌日に新しいサイトのエンジンスナップショットにコンテンツをタイムリーに含める経験

筆者は長年ウェブサイトを構築していませんでしたが、最近少し時間ができたので、2つのウェブサイトを構築...

「言葉にできない」tois-512m メモリ/xen/30g ハードディスク/20M 無制限/6.45 米ドル

「言葉にできない」toisLabsは2011年1月に設立され、2013年10月に運用を開始しました。...

コンテンツは製品です: サプライ チェーン、製品の反復からチャネルまでの開発履歴です。

1. コンテンツの製品反復コンテンツの祖先は情報です。グラハム・ロートンの「万物の起源」によれば、情...

分散型 Kv-2 ラフトリーダー選出の実装

[[441163]]この記事から、raft をベースに分散 KV を構築していきます。 Raft は...

クラウド、データセンター、エッジインフラストラクチャの未来

ガートナーは、経済の不確実性が増すこの年に、インフラストラクチャおよび運用 (I&O) チー...

VPS.net - 無料 136M メモリ (xen onapp)/G ポート/香港/日本など

VPS.net は、現在から 6 月 30 日まで、各ノードに 136 MB のメモリを無料で提供し...

母親と乳児のためのウェブサイトを始めるには: BabyTree が答えを持っています

BabyTreeが答えを持っています赤ちゃんの日記、子育ての知識から幼児教育用品まで、母子向けウェブ...

キーワードランキングをGoogleの1ページ目に素早く向上させる新しい方法

これは私が最近 Google ランキングを改善するために使用している方法であり、これを皆さんと共有し...