災害復旧は非常に伝統的なトピックであり、IT システムが構築された最初の日から考慮しなければならない問題です。一般的には、主に「データセンター災害、地域災害、人為的ミス」の3つの側面からITシステムに災害が発生した際の復旧作業を指します。 災害耐性という言葉を個別に見ると、「容」と「危」に分けることができます。 「災害」は、大きなものも小さなものも存在します。ある意味では、それらは「単一点」の問題です。たとえば、コアビジネスが単一のサーバーに展開されていて、このサーバーがダウンして起動できない場合、ビジネスにとって大惨事となります。 「寛容」とは、さまざまな「単一点」の問題を解決することです。リソース展開の粒度の観点から、次の図に示すように、単一ポイントの問題の解決に取り組んできました。 ビジネス災害復旧ソリューションは数多く存在しますが、それらはすべて「冗長性」を通じて「単一点」の問題を解決するという同じ核心を持っています。したがって、異なる次元における単一点の問題に対するソリューションの決定要因とコストは大きく異なります。 1) なぜ災害復旧が必要なのでしょうか? 現在のシステムの「災害」を整理し、主な問題点を特定して、優先順位を付けます。例えば、一点に隠れた危険性、拡張性の難しさ、運用・保守コストの高さなど、現状に応じて整理することが、その後のソリューション選択において重要です。 2) 災害復旧はどの程度現在の要件を満たすことができますか? 現在のシステムの「容量」を設計し、現在のシステムの潜在的な災害避難経路の冗長設計を行います。実際に災害が発生したときに、復旧にどのくらいの時間がかかるか、SLA=99.999% などのビジネス安定性 SLA を見積もってください。 災害復旧の範囲と目的に基づいて、災害復旧計画を設計する際には、次の 3 つの側面を考慮し、評価する必要があります。 1) 人的資源、時間、費用などのコスト。コストは回復時間に反比例します。ビジネスの回復時間が短いほど、コストは高くなります。これは強い正の相関関係です。 2) 可用性: まず、ソリューションの導入によって既存のシステムにどのような不確実性が追加されるかを考慮し、これらの不確実性が安定性に与える影響を評価します。現在、単一のアベイラビリティゾーンにデプロイされており、マスターとスレーブ間のデータ同期には強力な同期が使用されています。顧客は、同じリージョン内で異なる AZ 粒度で災害復旧を実現することを計画しています。このような変更により、ネットワークの遅延や AZ 間の安定性などの不確実性が生じます。 AZ 間のネットワークが頻繁にジッタすると、ノードから ACK が返されるのを待つ間に遅延が発生し、オンライン サービスがハングすることがよくあります。次に、現在のソリューションが災害復旧の切り替えと復旧の目標を満たすことができるかどうかを検討します。 3) スケーラビリティ。主にその後のビジネス災害復旧のスムーズな展開を目的とします。ある意味、自社構築のIDCであれ、クラウドメーカーであれ、データセンターは無限に大きくできるわけではありません。物理的なコンピュータ ルームの制限により、ビジネスが順調に発展すると、リソースが不足し、物理的な設備によって拡張が制限されることになります。したがって、災害復旧ソリューションを選択する際には、将来を見据えて、事前にセットベースのソリューションの手配をしておく必要があります。 災害復旧の分類と主要指標 RPO および RTO。 従来の災害復旧の主な技術 コスト、可用性、スケーラビリティの観点から、主な災害復旧ソリューションは 4 つあります。 中国では、「2 つの場所、3 つのセンター」の災害復旧アーキテクチャが企業ユーザーに広く認知され、エンタープライズ レベルの災害復旧アーキテクチャの標準となっています。しかし、建設コストが高く、サイクルが長いため、実際にこの基準に従って建設する企業はほとんどありません。ハイブリッドクラウド災害復旧アーキテクチャとは、クラウド環境内に「2拠点3センター」を実現し、同時に利用するものです。クラウド内のリソースの弾力性により、リソース コストと構築、運用、保守の複雑さが大幅に削減されます。 ソフトウェアがすべてを定義し、クラウド災害復旧が企業のIT生産性を解放企業のお客様が自社データセンター内に災害復旧環境の構築を完了した場合、ラックスペース、電力、ITリソース、人的リソースなど、多くのリソースを消費することが避けられません。災害復旧環境自体は、経済効果を生まないセキュリティシステムであり、膨大な企業リソースを占有します。 ソフトウェア定義の方法により、クラウド リソース プールは、企業内の環境とまったく同じ複雑な IT 環境を作成し、エンタープライズ レベルのアプリケーションの完全なミラーリングを実現できます。アプリケーション災害復旧システムをクラウドに移行すると、企業の既存の災害復旧センターを本番センターに変えることができ、顧客が自社で構築したデータセンターの収容能力を拡大したり、IT リソースの運用コストを大幅に削減したりすることができます。 バックアップ環境の可用性を確保するために、いつでも災害復旧訓練を実施します。従来の災害復旧環境では、災害復旧環境の構築は一度限りの作業ではないため、災害復旧訓練は大きな頭痛の種となります。運用環境とデータは変化し続けるため、災害復旧環境も運用環境に合わせて変化する必要があります。そうしないと、災害が発生したときにすぐに切り替えて業務を開始することができません。したがって、定期的な災害復旧訓練が必要です。従来の環境での災害復旧訓練では、ハードウェアおよびソフトウェア ベンダーとの協力が必要であり、時間と労力がかかり、結果が満足のいくものでないことが多々あります。 クラウド環境では、災害復旧環境を簡単に複製できるため、災害復旧環境を本番環境と並行してテストおよびリハーサルできます。災害復旧環境の可用性とデータの整合性は、実際のリハーサルを通じて検証できます。リハーサル後は、いつでもリハーサル環境を削除またはシャットダウンできるため、リハーサルのコストと複雑さが大幅に軽減されます。 クラウド災害復旧により数秒でロールバックを実現し、人為的エラーを解決実稼働環境では、人為的エラー、システム アップグレード、パッチ適用、その他の操作による IT システムやデータの損傷を防ぐことは困難です。特に、一部の操作やバグにより、障害が検出されるまでにシステムが一定期間実行される場合があります。この時点で、災害復旧環境のデータは上書きされており、復旧が困難になっている可能性があります。 クラウド上に実装された災害復旧環境では、データスナップショットやデータログなどの機能が利用できます。最新のビジネスデータを保存するだけでなく、数秒でデータのロールバックも実現できます。システム障害を発見した後、災害復旧環境で最新のデータに切り替えることができるだけでなく、過去 24 時間内の任意の時点を選択して復旧することもできるため、災害復旧システムにおけるダーティ データの問題を解決できます。 災害復旧環境の切り替えにより、本番システムのスムーズなクラウド移行を実現既存の IT 生産システム環境は複雑で、大量のデータが存在することがよくあります。このようなシステムでは、多くの場合、データの移行と環境の構築に長い時間が必要になり、実稼働システムは長時間のダウンタイムに直面しますが、これは許容できません。 クラウド環境では、ディザスタリカバリソリューションは、本番システムと並行して本番データを転送し、企業の内部構造と同一の本番システムミラー環境をクラウド内に構築できます。クラウド上のデータと本番センターのデータを同期させた後、災害復旧切り替えにより本番業務をクラウドに切り替え、本番環境のダウンタイムを最小限に抑え、スムーズなクラウド移行を実現します。 災害復旧は非常に古く伝統的な IT ビジネスですが、クラウド コンピューティング テクノロジーの継続的な成熟と普及により、パブリック クラウドで最初に実装するのに非常に適したビジネスになりました。 まず、構築リスクが低く、生産システムと完全に並行しており、初期投資が少なく、事前の調達も必要ありません。また、クラウド移行のプロセスにおいて、企業が自社チームのクラウド機能を構築する絶好の機会にもなります。クラウド災害復旧プロジェクトを終えると、企業はクラウド リソースとクラウド テクノロジーを総合的に理解し、この機会を利用してクラウド環境が企業の生産システムを担う能力を検証し、徐々に企業レベルの IT 環境のクラウド変革を実現できるようになります。 クラウド災害復旧業界が直面する課題従来の災害復旧の考え方に代えて、「クラウド リソースを効果的に使用して、効率的で信頼性の高い災害復旧サービスを構築し、IT インフラストラクチャ設備のセキュリティと安定性を確保し、ビジネスの継続的かつ安定した成長を確保する方法」は、効率的、安全、インテリジェントにデータを保護し、ビジネスの成長を実現するために企業が検討すべき主要な課題です。現在の状況では、クラウド災害復旧業界は新たな課題に直面することになります。 1. クラウドネイティブ機能クラウド ネイティブが IT 業界に再編をもたらしたことは容易に想像できます。アプリケーション開発プロセスから IT 実務者の技術的能力に至るまで、これは破壊的な革命です。これを基に、クラウド ネイティブ プラットフォームに基づくオープン アプリケーション モデル定義が登場し、クラウド ネイティブ プラットフォームがさらに抽象化され、インフラストラクチャよりもアプリケーションに重点が置かれるようになりました。同時に、ますます多くのパブリック クラウドがサーバーレス サービスをサポートし始めており、これは、アプリケーション中心とシステム構築における軽量インフラストラクチャ層の役割という将来の開発トレンドをさらに示しています。 この大きな流れの中で、従来の移行や災害復旧は依然としてデータ転送のレベルに留まり、クラウド指向の機能やユーザービジネスの再考と構築は無視されています。クラウド コンピューティングのビジョンは、水や電気のようにクラウド リソースをオンデマンドで利用できるようにすることです。そのため、クラウドベースの移行と災害復旧もこの歴史的傾向に従う必要があります。 従来の災害復旧では、多くの場合、ストレージに重点が置かれ、ストレージに対する最高の制御が行われます。さらに、物理時代では、コンピューティング、ストレージ、ネットワークなどのインフラストラクチャ層に効果的なスケジューリング方法がなく、高度に自動化されたオーケストレーションを実現することは不可能でした。クラウド ネイティブに基づいて構築されたアプリケーションの場合、コアはクラウド ネイティブ サービス自体になります。ユーザーのビジネス システムが完全にクラウドに移行されると、ユーザーは基盤となるストレージを完全に制御できなくなるため、従来の災害復旧方法は効果的ではなくなります。 クラウドネイティブな災害復旧ソリューションを構築する際には、ビジネスを核とした構築方法を考え、クラウドネイティブサービスのオーケストレーション機能を活用して業務システムの継続性を実現する必要があります。クラウドネイティブ アーキテクチャは、ビジネスの安定性を向上させ、企業内の内部摩擦を最小限に抑えることもできます。 2. マルチクラウドサポート機能海外のクラウドコンピューティング市場は安定しており、成熟しています。例えば、パブリッククラウド市場における主要なクラウド事業者は、AWS、Microsoft Azure、Google Cloud のみであり、これらは「三脚三脚」とも言えるでしょう。しかし、私の国のクラウド コンピューティング市場はまったく異なります。私の国では実際に少なくとも 10 のパブリック クラウドが運用されており、状況はむしろ「多くのヒーロー間の競争」のようなものです。さまざまな独自のクラウドおよびプライベート クラウド製品と組み合わせると、最初はユーザーに選択肢がなくなります。 国内のクラウド市場は複雑かつ多様です。単一ベンダーに縛られることを避けるため、多くの企業ユーザーは長期的なクラウド プラットフォーム構築戦略としてハイブリッド クラウドを選択しています。ハイブリッド クラウドは現在、ユーザーがクラウド プラットフォームを構築するための推奨ソリューションです。マルチクラウド戦略を採用する企業は、より大きなクラウド災害復旧の課題に直面することになります。そのためには、クラウド災害復旧ツールをマルチクラウド環境にさらに適応させ、ユーザーのクラウド間災害復旧のニーズを満たし、ユーザーのビジネス データのクラウド間フローを実際に通常の慣行にする必要があります。 3. より複雑なハイブリッドクラウドのシナリオ従来の IT アーキテクチャとクラウドが共存すると、企業がクラウドを使用する環境はより複雑になります。ローカルからクラウド、クラウドからクラウド(パブリック クラウドとプライベート クラウドを含む)、オンクラウドとオフクラウドの災害復旧はすべて、新しいシナリオで災害復旧ベンダーにいくつかの新しい課題をもたらし、多様なニーズを満たすために従来の考え方を変えることを要求します。 4. タイムリーな回復能力の向上データ復旧の速度は、ビジネス復旧の進行を大きく制限します。災害復旧プロセスは元のバックアップ データに影響を与えないため、災害や障害によるコア ビジネスの中断の発生を最小限に抑えることができます。元のバックアップ データのセキュリティを効果的に確保すると同時に、バックアップ データの検証の基盤も構築します。ユーザーがパブリック クラウドや回線を広範に利用する場合、タイムリーなリカバリ ソリューションはより大きな課題に直面します。 5. CDP(継続的データ保護)継続的データ保護機能が向上CDP(継続的データ保護)は、プライマリデータの動作に影響を与えることなく、対象データの変更を継続的にキャプチャまたは追跡し、以前の任意の時点に復元できる方法です。 CDP テクノロジーを使用すると、ユーザーは特別なシステム バックアップ時間を確保する必要がなくなります。障害が発生した場合でも、短時間(数秒)で障害発生前の任意の時点にデータを復元できます。ユーザーデータの量は日々増加しており、いくつかの重要なアプリケーションが失われると、ユーザーに多大な損失が発生します。そのため、より高いビジネス継続性に対する需要は常に高まっています。 |
<<: クラウド コンピューティングを活用して IT 業界で環境の持続可能性を実現するにはどうすればよいでしょうか?
>>: Dockerをオフラインで素早くインストールする方法
[51CTO.com クイック翻訳] 組織における Kubernetes の応用が新たな発展段階に入...
ウェブサイトのキーワードランキングをすぐに向上させたい場合は、「分析」から始めましょう。分析とは何で...
百度の最近の大幅な調整以前は、多くのタオバオユーザーは非常に良い収入を得ており、中には月に1万元以上...
centexhosting.com についてはほとんど何も知りません。以前、Scabal に hos...
北京、2019 年 4 月 23 日 – Amazon グループ会社の Amazon Web Ser...
ここで言う独創性とは、ウェブサイト構築を指します。「オリジナルコンテンツ」とは、著者が最初に作成した...
今日は春節休暇後の最初の営業日です。多くの企業は、2月3日から7日まで、従業員が自宅からリモートワー...
【概要】国内レジャー観光市場の規模と発展の見通しは?どのような観光商品が人気になるのか?テンセントテ...
10月29日、Tencent CloudはH265ハードウェアエンコーダーYaochi V500の正...
dedipath の春のプロモーション: ハイブリッド サーバーと VPS がすべて 32% オフ。...
ライブストリーミング業界では、ライブストリーミングギルドが視聴回数を水増しするのは一般的な現象となっ...
クラウド ストレージの使用は、多くの企業がクラウド コンピューティング テクノロジーを導入する最初の...
実際、検索エンジンはウェブサイトに対してそれほど高い期待を抱いていません。検索エンジンにとって、ウェ...
インターネット マーケティングは、結局のところ、販売です。販売といえば、顧客を惹きつけて製品やサービ...
いわゆる検索エンジン不正行為とは、Baidu の「検索エンジン最適化ガイド 2.0」の言葉を借りれば...