多くのパブリック クラウド プロバイダーは、日常業務で壊滅的な停止を頻繁に経験しており、IT マネージャーはクラウド プラットフォームの障害と教訓から学び、それを社内のインフラストラクチャに適用する必要があります。 クラウド プラットフォーム、特に大規模なパブリック プラットフォームには複数レベルの冗長性が備わっていますが、予期しないダウンタイムの影響を受けないプラットフォームはありません。データ センターなどのクラウド コンピューティング プラットフォームでは、ダウンタイムの原因となる問題が発生する可能性があります。
オンプレミスのハードウェア障害やソフトウェア エラーは避けられませんが、パブリック クラウドは IT 管理者にこれらの問題に対処する方法を提供します。パブリック クラウドには、可用性クラスター、冗長データ センター、可用性ゾーン、クラウド リージョンが備わっており、管理者は中断が発生した場合でもビジネス オペレーションをより適切に計画できます。これらの戦略は重要ですが、管理者はパブリック クラウドの冗長性機能を活用するために信頼性の高いアプリケーションを設計する必要があります。 組織の IT 資産の回復力はインフラストラクチャよりもアプリケーションに依存するという考え方は、従来の考え方とは異なります。過去 20 年間、管理者はバックアップ、レプリケーション、その他のインフラストラクチャ中心のテクノロジーを通じて回復力を維持してきました。しかし、ほとんどのパブリック クラウド プラットフォームでは、この戦略はもはや機能しません。 近年、クラウド コンピューティング プロバイダーは耐えられないほどの損失を被っています。クラウド プロバイダーとユーザーの両方が、障害発生時にローカル クラウドの冗長性を設計する方法を学んでいるようで、管理者はそれらの教訓を従来の仮想化データ センターの冗長性に適用したいと考えています。 データセンターの冗長性の再考 ほとんどの従来の組織では、いくつかの基本的なサービスはダウンタイムを防ぐために設計されています。ネットワーク タイム プロトコルやネットワーク ルーティングなどのサービスは、多くの場合、高度な冗長性を備えるように設計されます。ただし、システムが冗長性を備えているからといって、その構成が自然な冗長性を十分に活用できるようになっているわけではありません。 一部のコア サービスには高可用性オプションがありません。 IT 部門は、ほとんどの場合、対処しなければならない技術的負債に直面しており、理想的に動作していないレガシー システムのサポートが必要になります。たとえば、一部のレガシー アプリケーション認証システムはサーバー上にのみ存在できるため、データ センターの冗長性が制限されます。 経営者はすべての卵を一つのカゴに入れるべきではありません。ほとんどの従来の展開では、データセンター内で冗長ハードウェアを使用するのが最適です。管理者は、複数の可用性ゾーンを提供できるクラウド コンピューティング プロバイダーと同様に、システムを共有しない冗長仮想化クラスターを使用することで、この戦略をさらに進めることができます。これにより、アプリケーションはデータ センター内のより高いレベルの冗長性に依存するようになりますが、ビジネス ニーズがそのレベルの冗長保護を正当化する場合にのみ価値があります。 これらの戦略をクラウドとデータセンター全体で並行して実装することで、可用性ゾーンなどのパブリック クラウド プロバイダーの概念を使用すると、同様の従来のインフラストラクチャを採用するときに役立ちます。この用語を使用すると、開発者は同様のクラウドの概念に精通している可能性があるため、インフラストラクチャの概念を理解しやすくなります。 クラウドコンピューティングの冗長性は完璧ではなく、ダウンタイムから教訓が得られる 高度に冗長化されたシステムでも、パフォーマンスの低下は避けられません。最近のパブリック クラウドの障害により、カタログ サービスが 1 つのリージョンから別のリージョンへのサービスの実行を継続できなくなりました。リダイレクトされたトラフィックが他のエリアの容量を超え、サービスが需要を満たすことができなくなります。 管理者がデータ センターの冗長性を設計する場合、停止が発生した場合の負荷を計画する必要があります。管理者はデータ センターの冗長性をサポートするために 2 台のサーバーを所有しているかもしれませんが、そのうちの 1 台のサーバーでは負荷全体を処理できない可能性があります。重要なのは、通常時と異常時のビジネスニーズを満たすシステムを設計することです。 多くの組織は、正しく構成されていれば、停止中に何か他のものを発見できたはずだと考えています。 Netflix の Chaos Monkey システムは、障害のシミュレーションでよく知られていますが、そこから得られる教訓は、管理者が実際の障害への対処を練習しなければ、IT システムがどのように反応するかを知ることはできないということです。また、システムは孤立したものではなく、各アプリケーションとサービスには依存関係があり、テストがさらに複雑になります。 プライベート データ センターやパブリック クラウドでは停止は珍しくありませんが、データ センター内では、管理者がシステムの内部の仕組みを把握し、理解している必要があることがよくあります。クラウド プロバイダーが停止を経験すると、ダウンタイムから何も学べなかったように感じるかもしれませんが、それは事実ではありません。パブリック クラウド プロバイダーは従来のデータ センターとは異なるツールと方法論を使用しますが、冗長性の構築と調整に関して得られる教訓は普遍的です。 |
<<: すべてのクラウドプラットフォームが同じように作られているわけではない
>>: AWS、Google Cloudに勝ち、クラウド災害復旧会社CloudEndureを2億5000万ドルで買収
9月6日午前、NetEaseは検索方向から電子商取引事業を展開し、独自のドメイン名huihui.cn...
Kubernetes は、大規模な分散コンテナ化されたソフトウェア アプリケーションを管理するオープ...
オンプレミスからクラウドまで、アプリケーションとネットワーク パフォーマンスのエンドツーエンドの可視...
兄弟が協力すれば金属を切断することができます。友人の輪の中の「兄弟」たちは最近本当に忙しい。走り回っ...
2011年第1四半期以降のVipshopの収益2011年第1四半期以降のVipshopの純利益推移チ...
AWS ECS と AWS Lambda は特定の目的に適しているため、適切なものを選択することがク...
EuroCheapo は、ユーザーが安価でお得なホテル、航空券、レンタカーを検索して予約できるヨーロ...
クラウド コンピューティングの最適化という概念は、企業がクラウド コンピューティングの価値を懸念して...
クラウド ネイティブは、新しいソフトウェア アーキテクチャ モデルとして、アプリケーションのアジャイ...
火鍋を食べたいけど、外に出てみんなで集まるのは面倒ですか?フードデリバリーアプリを開いて、自宅まで配...
新しい技術用語が継続的に出現することは避けられませんが、現在最も人気のある用語はエッジ コンピューテ...
デジタル経済が発展するにつれて、CIO が負うリスクも増大しています。顧客体験を向上させ、市場の混乱...
dataclubは主にスウェーデン(ストックホルム)、リトアニア、オランダの3つのデータセンターで独...
SEO の最高レベルは、ユーザー エクスペリエンスの価値を最大化することです。私は 4 年間 SEO...
開発者がクラウド コンピューティング プラットフォームにワークロードを展開する場合、多くの場合、これ...