クラウドサービスの信頼性を確保する方法

クラウドサービスの信頼性を確保する方法

顧客の観点から見ると、クラウド サービスは問題なく機能するはずです。ただし、サービスの中断は避けられません。それは「それが起こるかどうか」という問題ではなく、厳密に言えば「いつ起こるか」という問題です。オンライン サービスがどれだけ慎重に設計され構築されたとしても、予期しない出来事が起こることは避けられません。違いは、サービス プロバイダーがこれらの状況をいかに予測し、タイムリーに回復するかにあります。それによって顧客体験を保証します。

設計の原則

クラウド サービスの 3 つの設計指針は、1. データの整合性、2. フォールト トレランス、3. 迅速な回復です。これらは、顧客がサービスにおいて少なくとも満たされることを期待する 3 つの主要な属性です。データの整合性とは、クライアントがサービスに委託した情報の忠実性を保護することを指します。フォールト トレランスとは、サービス プロバイダーが障害を検出し、サービスが中断されないように自動的に修正措置を講じる機能です。迅速な復旧機能とは、予期しない障害が発生した場合に、サービスを迅速かつ完全に復旧する能力を指します。

サービスプロバイダーとして、さまざまな潜在的な障害をできるだけ早く特定して発見し、サービス設計フェーズでこれらの状況を十分に考慮する必要があります。このような思慮深い計画は、予期しない課題が発生したときにどのようにサービスを提供し、どのように対応するかを正確に決定するのに役立ちます。サービスは、これらの障害シナリオから最小限の中断で回復できる必要があります。すべての障害ポイントや障害モードを予測することはできませんが、先見性、事業継続計画、そして多くの実践を通じて、緊急事態に備えるための一連の緊急時計画プロセスを開発することができます。

クラウド コンピューティングの特性によれば、共有インフラストラクチャと疎結合に依存するシステムで構成された複雑なシステムであり、多くの特性がプロバイダーの直接的な制御外にあると言えます。従来、多くの企業は、アプリケーション、インフラストラクチャ、および関連サービスを直接制御できるオンプレミスのコンピューティング環境を維持してきました。しかし、クラウド コンピューティングの使用が拡大するにつれて、多くの企業はコストを削減し、リソースの弾力性 (コンピューティング、ストレージ、ネットワーク リソースなど) を活用し、ビジネスの俊敏性を促進し、IT リソースをより効率的に活用するために、ある程度の制御を放棄することを選んでいます。

[[244825]]

チームの役割を理解する

エンジニアリング サービス チームの観点から見ると、設計およびアーキテクチャ サービス (ボックス製品やオンプレミス ソリューションとは対照的) は、責任範囲の拡大を表します。オンプレミス展開用のソリューションを設計する場合、エンジニアリング チームは、ソフトウェア運用推奨事項で説明されているコンピューティング環境に基づいて、サービスを設計、構築、テストし、パッケージ化してリリースするだけで済みます。対照的に、サービスの設計、構築、テストの後、エンジニアリング サービス チームは、サービスの継続的な運用を確保するために、関連する展開と監視も実行する必要があります。緊急事態が発生した場合は、できるだけ早く解決する必要があります。また、エンジニアリング サービス チームは、サービス コンピューティング環境をさらに制御できないことがよくあります。

故障モード影響分析

多くのサービス チームは、サービスの信頼性を向上させ、障害の発生を防ぐために、障害モデル分析 (FMA) と根本原因分析 (RCA) を使用しています。これらは必要だが十分ではないというのが私の見解です。代わりに、設計チームは、より効果的な結果を確実に得るために、故障モード影響解析 (FMEA) を採用する必要があります。

FMA は、繰り返し可能な設計プロセスを通じて、サービス設計プロセスにおける障害を特定し、軽減することを目的としています。 RCA では、不利な結果につながる要因の性質、大きさ、場所、タイミングを特定して判断します。総合的なエンドツーエンドの FMEA アプローチの主な利点には、障害ポイントとモードの包括的な図表が含まれ、既知の障害のマッピングを軽減するためのエンジニアリング投資の優先順位リストが可能になります。

FMEA は、システム信頼性エンジニア技術の開発研究を利用して、起こりうる (複雑な) システム障害の問題を発見します。この研究は、重大度、発生頻度、検出能力を評価することで、障害の影響の観点から起こり得る問題を理解し、さまざまなリスクに基づいて必要なエンジニアリング投資の優先順位を決定できるようにすることを目的としています。

準備フェーズ: このステップでは、システムの整合性を理解し、システムのコンポーネント、データ ソース、データ ビジネス フローを含むシステムの完全な論理図を生成することが重要です。これはテンプレートを使用して行われ、設計チームが重要な手がかりを発見できる可能性のある障害ポイントを提供することで、全体的な分析結果が向上します。

コンポーネント間の相互作用を検出します。すべてがこのステップの範囲内にあります。前述のロジック図から始めて、すべてのコンポーネントが動作障害の影響を受けやすいかどうかを判断します。すべてのコンポーネント (コネクタ) 間の相互作用と、各コンポーネントがシステム全体でどのような役割を果たすかを理解します。

<<:  インフォア、データ駆動型サプライチェーンを実現するコントロールセンターを発表

>>:  インフォア、コールマン AI デジタルアシスタントを発表

推薦する

貧弱なウェブサイト構築はマーケティングプロモーションの突然の死につながる

中小企業が有料検索エンジン広告を通じて自社の製品やサービスを宣伝することは効果的でしょうか? その答...

hostyun: 新しい日本の VPS、10% 割引、IIJ 回線、ソフトバンク回線、200M 帯域幅、月額 19.8 元から

Hostyun(10年間運営している元祖ホストシェアリング組織)は本日、日本のデータセンターを追加し...

Sihua Technologyがクラウド時代のストレージをどのように定義しているかをご覧ください

[51CTO.com からのオリジナル記事] ビッグデータ時代の到来により、従来のストレージ アーキ...

独占暴露:リンク購入の背後にある隠れた懸念

ウェブサイトの最適化にとって、「外部リンク」は非常に重要なリンクです。検索エンジンは、ウェブサイト ...

巨大企業の拡大路線から見たインターネットサービス:中心はあるが境界はない

今週開催された第1回中国インターネットセキュリティカンファレンスでは、カンファレンス全体の注目はやは...

pnzhost - 年間 15 ドル: アジア最適化 VPS/KVM/512 メモリ/1TB 帯域幅/Alipay

pnzhostは2009年に設立された新しいホスティング会社です。主にVPSと専用サーバー事業を運営...

広告によって飼いならされたインターネット

本稿では、インターネット広告とインターネット生態系の関係から出発し、ユーザーがインターネット広告に飼...

ウェブマスターの経験:アリババのような製品を作るには、拡張を支援するプラットフォームに焦点を当てる

アリババの戦略は、常に一種の経営の知恵として評価されてきました。独自のプラットフォームの構築、ソーシ...

vpsace - 4.75 ドル/Kvm/1g メモリ/25g ハードディスク/1.5T トラフィック/追加 IP 0.25 ドル/各

vpsaceは2011年に設立されました。コロクロッシングとの関係が曖昧だと言う人が多いようですが、...

CNCF: クラウドネイティブの6つの主要トレンド

Cloud Native Computing Foundation (CNCF) は、2019 年後...

Google I/O 2018: Google Instant Games がすべての Android 開発者に公開

米国現地時間5月8日午前10時(北京時間5月9日)、3日間にわたる2018 Google I/O 開...

Directspace - 年間 15 ドル、768M メモリ/西海岸ポートランド

512M の保証メモリと年間 15 ドルの Directspace の VPS は非常に人気があるの...

大規模サイトは完璧ではない。Meilele ウェブサイト SEO の成果と結論の分析

住宅建材業界に身を置く私にとって、Meilele のウェブサイトの SEO を分析するのは当然のこと...

大規模なグループ購入ウェブサイトが第2ラウンドの土地買収を開始し、第2層、第3層、第4層の市場にサイトを建設する

約3年間の苦難の末、残った共同購入エリートたちは新たな土地争奪戦を開始した。北京ビジネスデイリーの記...