2018 年のクラウド ダウンタイム インシデントの一覧

2018 年のクラウド ダウンタイム インシデントの一覧

クラウド セキュリティは業界で最も懸念される問題であり、クラウド サービス プロバイダーはクラウド セキュリティに関して繰り返し努力してきましたが、障害を防ぐのは依然として困難です。

[[257110]]

1. 6月17日: Microsoft Azure アイルランド データセンターの停止

事故の詳細: 2018 年 6 月 17 日から 18 日にかけて、アイルランドのデータ センターの恒温システムに問題があったため、Microsoft Azure が高温の影響を受け、ストレージとネットワークが停止しました。

ダウンタイム: 5時間以上

2. 6月27日:Alibaba Cloudの停止

事故の詳細:2018年6月27日16時21分頃、Alibaba Cloudで重大な技術的障害が発生し、16時50分に回復し始めました。公式の障害時間は約 30 分、復旧時間は約 1 時間かかりました。アリババは技術検討の結果、エンジニアリングチームが新しい自動運用・保守機能の導入時に変更検証操作を実行したことが障害の原因であると説明した。この操作はテスト環境では問題は発生しませんでしたが、実行後に未知のバグを引き起こしました。

改善策: 問題を特定して解決するための手動介入。

ダウンタイム: 30 分、回復時間は約 1 時間かかりました。

3. 7月20日:テンセントクラウドのハードドライブ障害

事故の詳細:2018年8月5日、北京青波CNCテクノロジー株式会社(以下、「Frontier CNC」)は、公式Weiboアカウントに「テンセントクラウドがスタートアップ企業にもたらした災難」と題するブログ記事を公開した。投稿によると、2018年7月20日にTencent Cloudのクラウドハードディスクが故障し(Tencent Cloudは後に事故の原因について説明した)、その結果、同社が保管していたすべてのデータが失われ、データを回復することができなかったという。これは、長期にわたるプロモーションと転用を通じて蓄積された正確な登録ユーザーとコンテンツデータを含む、スタートアップ企業の約1,000万元のプラットフォームデータです。

改善策:テンセントクラウドは、異常を監視した後、できるだけ早くユーザーに障害状況を通知し、すぐにファイルシステムの専門家を組織し、メーカーの技術専門家と協力してデータの修復を試みたと述べました。しかし、何度も努力したにもかかわらず、一部のデータ整合性チェックは依然として失敗しました。

4. 7月24日: Tencent Cloudのダウンタイム

事故の詳細:2018年7月24日、ユーザーはTencent Cloudにログインする際にタイムアウトとログアウトを繰り返し経験した。オペレータを変更した後でも結果は同じでした。その後、テンセントクラウドは、事業者の光ケーブルが中断されたと暫定的に判断した旨の通知を出した。オペレーターはブレークポイントを見つけ、接続処理中でした。影響を受けた主なユーザーは、広州地域の一部のユーザーでした。

改善策: オペレーターが介入し、できるだけ早く問題を修復しました。

ダウンタイム: ダウンタイムは不明、回復には30~40分かかります

5. プライムデー: Amazon AWS の停止

事件の詳細: プライムデーは、Amazon が世界中で開催する 36 時間の会員プロモーション イベントです。事件が始まるとすぐに、Amazonのウェブサイトとアプリは同時に深刻な障害に見舞われ、電子商取引事業が被害を受けただけでなく、Amazonの他の製品やサービスもさまざまな程度で影響を受けました。 Amazon の説明によると、AWS マネジメントコンソールにグローバルな問題があったとのことです。

ダウンタイム: 停止は 6 時間近く続きました。

6. 9月4日:Microsoft Azureデータセンターが落雷によりオフラインに

事故の詳細:9月4日午前、Microsoft Azureの米国中南部データセンター付近で落雷を含む悪天候が発生し、冷却システムの電圧に影響を及ぼし、複数のAzureサービスに接続障害が発生したため、当該地域のデータセンターに保存されているリソースへのお客様のアクセスが困難になりました。影響を受けるサービスには、Office 365 Active Directory、Visual Studio Online、Visual Studio Team Services などがあります。

修復措置: 9 月 5 日の朝、マイクロソフトのエンジニアがデータ センター内の電源とほとんどのネットワーク機器を復旧し、その他のサービスも復旧中です。

ダウンタイム: 24時間以上

7. 11月9日: Google CloudのKubernetesサービス(GKE)がダウン

事象の詳細:11月9日、Googleのパブリッククラウド上で提供されるKubernetesサービス(GKE)のノードプール構築機能に異常が発生し、保守担当者がCloud Console UIから新規ノードを作成できなくなりました。

対策: Google はエンジニアリング チームを派遣して障害の原因を調査し、修復作業を開始しました。 Google は、影響を受ける企業ユーザーはまず GCP 組み込みの gcloud コマンドを使用して新しい Kubernetes ノードを構築できると述べています。

ダウンタイム: 約19時間

<<:  2018年にBATは組織構造を調整した。

>>:  「ハイブリッドクラウド産業推進アライアンス」が設立され、ZStackの強みが強化

推薦する

検索エンジンと一次B2B:恋人か友人か?

恋人同士であるということは、将来の計画があり、一緒に暮らしたいという願望があることを意味します。同性...

千里の道も一歩から。SEOに近道はない

数日前、新しい同僚が会社にやって来て、外部リンク構築の仕事を私のチームに配属されました。雑談の中で、...

WeChatマーケティング3.0時代の到来:WeChatオペレーションの台頭

WeChatマーケティングの今後の動向はますます明確になっているこれは20日にモーメントでのマーケテ...

災害復旧について話すとき、私たちは何について話すのでしょうか?

災害復旧というと、多くの学生は「同じ都市でのデュアルアクティブ」、「2 つの場所に 3 つのセンター...

ufovps: 春節の 50% 割引 + トップアップでさらに 50% 割引、香港 (BGP/CN2)、日本 CN2、米国国際 BGP、ネイティブ IP 付き

ufovps(香港で1年間登録)は、1月29日から2月17日まで、特別な春節プロモーションを開始しま...

「ハートブリーディング」脆弱性が国内の主要ウェブサイトに影響、アリペイ、タオバオなど多くのウェブサイトが修正

「4月8日はハッカーやホワイトハットにとって眠れない夜だ」誰かがこう表現した。午前中はまだ WIN ...

Goを使用してXA分散トランザクションを簡単に完了する、ナニーレベルのチュートリアル

[[423848]]取引一部のビジネス要件では、一連の操作の一部ではなく、すべてを実行する必要があり...

SEO は急速に変化しています。オンラインプロモーションに適応するにはどうすればよいでしょうか?

検索エンジン最適化 (SEO) 業界で働く友人たちは、とても苦労しています。退屈で面倒な作業に対処す...

北京はオンライン融資プラットフォームを調査する可能性あり、中央銀行はP2Pによる違法な資金調達を警告

記者の張仙安が北京からレポートします6月には北京の望金宝と深センの客訊が再び逃亡したと報じられ、中央...

実践: 人気のニュース写真を使ってBaiduからのトラフィックを獲得する

かつて、Baidu ImagesはGoogle Imagesを模倣しており、2大検索エンジンの画像機...

テスラに妥協しない自信を与えたのは誰でしょうか?

テスラは315を避けたが、上海モーターショーは避けなかったと多くの人が言っている。今年の315ガラを...

5G時代のマーケティング、生産手段と生産関係を再定義する時が来た

月給5,000~50,000のこれらのプロジェクトはあなたの将来ですAI、ブロックチェーン、モノのイ...

ソフト記事を掲載するためのメディアの選び方が分からない?公開手順は次のとおりです

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスソフト製品については、特...

ウェブサイトのバックリンク統計におけるSEOツールの違いを分析する

外部リンク構築は、すべての SEO 担当者が注意を払う作業です。なぜなら、SEO プロセスでは、ほと...

SaaSを選択し、8つの原則を念頭に置いてください

SaaS モデルは確かに中小企業にとって優れたソリューションですが、SaaS はまだ初期段階にありま...