2018 年のクラウド ダウンタイム インシデントの一覧

2018 年のクラウド ダウンタイム インシデントの一覧

クラウド セキュリティは業界で最も懸念される問題であり、クラウド サービス プロバイダーはクラウド セキュリティに関して繰り返し努力してきましたが、障害を防ぐのは依然として困難です。

[[257110]]

1. 6月17日: Microsoft Azure アイルランド データセンターの停止

事故の詳細: 2018 年 6 月 17 日から 18 日にかけて、アイルランドのデータ センターの恒温システムに問題があったため、Microsoft Azure が高温の影響を受け、ストレージとネットワークが停止しました。

ダウンタイム: 5時間以上

2. 6月27日:Alibaba Cloudの停止

事故の詳細:2018年6月27日16時21分頃、Alibaba Cloudで重大な技術的障害が発生し、16時50分に回復し始めました。公式の障害時間は約 30 分、復旧時間は約 1 時間かかりました。アリババは技術検討の結果、エンジニアリングチームが新しい自動運用・保守機能の導入時に変更検証操作を実行したことが障害の原因であると説明した。この操作はテスト環境では問題は発生しませんでしたが、実行後に未知のバグを引き起こしました。

改善策: 問題を特定して解決するための手動介入。

ダウンタイム: 30 分、回復時間は約 1 時間かかりました。

3. 7月20日:テンセントクラウドのハードドライブ障害

事故の詳細:2018年8月5日、北京青波CNCテクノロジー株式会社(以下、「Frontier CNC」)は、公式Weiboアカウントに「テンセントクラウドがスタートアップ企業にもたらした災難」と題するブログ記事を公開した。投稿によると、2018年7月20日にTencent Cloudのクラウドハードディスクが故障し(Tencent Cloudは後に事故の原因について説明した)、その結果、同社が保管していたすべてのデータが失われ、データを回復することができなかったという。これは、長期にわたるプロモーションと転用を通じて蓄積された正確な登録ユーザーとコンテンツデータを含む、スタートアップ企業の約1,000万元のプラットフォームデータです。

改善策:テンセントクラウドは、異常を監視した後、できるだけ早くユーザーに障害状況を通知し、すぐにファイルシステムの専門家を組織し、メーカーの技術専門家と協力してデータの修復を試みたと述べました。しかし、何度も努力したにもかかわらず、一部のデータ整合性チェックは依然として失敗しました。

4. 7月24日: Tencent Cloudのダウンタイム

事故の詳細:2018年7月24日、ユーザーはTencent Cloudにログインする際にタイムアウトとログアウトを繰り返し経験した。オペレータを変更した後でも結果は同じでした。その後、テンセントクラウドは、事業者の光ケーブルが中断されたと暫定的に判断した旨の通知を出した。オペレーターはブレークポイントを見つけ、接続処理中でした。影響を受けた主なユーザーは、広州地域の一部のユーザーでした。

改善策: オペレーターが介入し、できるだけ早く問題を修復しました。

ダウンタイム: ダウンタイムは不明、回復には30~40分かかります

5. プライムデー: Amazon AWS の停止

事件の詳細: プライムデーは、Amazon が世界中で開催する 36 時間の会員プロモーション イベントです。事件が始まるとすぐに、Amazonのウェブサイトとアプリは同時に深刻な障害に見舞われ、電子商取引事業が被害を受けただけでなく、Amazonの他の製品やサービスもさまざまな程度で影響を受けました。 Amazon の説明によると、AWS マネジメントコンソールにグローバルな問題があったとのことです。

ダウンタイム: 停止は 6 時間近く続きました。

6. 9月4日:Microsoft Azureデータセンターが落雷によりオフラインに

事故の詳細:9月4日午前、Microsoft Azureの米国中南部データセンター付近で落雷を含む悪天候が発生し、冷却システムの電圧に影響を及ぼし、複数のAzureサービスに接続障害が発生したため、当該地域のデータセンターに保存されているリソースへのお客様のアクセスが困難になりました。影響を受けるサービスには、Office 365 Active Directory、Visual Studio Online、Visual Studio Team Services などがあります。

修復措置: 9 月 5 日の朝、マイクロソフトのエンジニアがデータ センター内の電源とほとんどのネットワーク機器を復旧し、その他のサービスも復旧中です。

ダウンタイム: 24時間以上

7. 11月9日: Google CloudのKubernetesサービス(GKE)がダウン

事象の詳細:11月9日、Googleのパブリッククラウド上で提供されるKubernetesサービス(GKE)のノードプール構築機能に異常が発生し、保守担当者がCloud Console UIから新規ノードを作成できなくなりました。

対策: Google はエンジニアリング チームを派遣して障害の原因を調査し、修復作業を開始しました。 Google は、影響を受ける企業ユーザーはまず GCP 組み込みの gcloud コマンドを使用して新しい Kubernetes ノードを構築できると述べています。

ダウンタイム: 約19時間

<<:  2018年にBATは組織構造を調整した。

>>:  「ハイブリッドクラウド産業推進アライアンス」が設立され、ZStackの強みが強化

推薦する

Raksmart の米国無制限トラフィック CN2 VPS (3 つのネットワーク必須 CN2) の簡単なレビュー、効果は非常に良好です。

無制限のトラフィックを備えた US CN2 VPS を探している人もいます。この場合、Raksmar...

エンタープライズ イノベーションのために生まれた VMware が 2B 業界に新たなビジネス モデルを創出

[51CTO.com からのオリジナル記事] 現在、企業の IT 支出が中国全体の経済変革を推進して...

anynode: cn2 gt (zenlayer) + KVM シリーズ VPS、年間 15 ドルから、Alipay が利用可能

anynodeは、同社のVPSがロサンゼルスのZenlayerデータセンターネットワークに接続されて...

おもしろさも大きなビジネス:ジョークを販売する国内ウェブサイトの徹底レビュー

Chrome に対応していない Web サイトを想像できますか? コンテンツのほとんどをボットによっ...

2018 年のクラウド ダウンタイム インシデントの一覧

クラウド セキュリティは業界で最も懸念される問題であり、クラウド サービス プロバイダーはクラウド ...

SEO担当者はタオバオSEOの頻繁な再編にどう対処すべきか

CPSを行うことでウェブマスターが利益を上げる良い方法だと言えます。ポップアップ広告やクリック広告と...

アップデートは停止しましたか? Baidu Shareはメンテナンスされていないようです

看看GPS地図网のウェブマスターによると、Baidu Shareは更新を停止した可能性があります。そ...

最適化された企業ウェブサイトのホームページデザインスケッチ

著者は以前、「企業ウェブサイトの最適化におけるいくつかの重要なポイントの簡単な分析」という記事を書い...

WordPressは世界のウェブサイトの19%の基本プラットフォームとなっている

Sina Technology News、北京時間7月28日朝のニュースによると、Automatti...

これらのクラウドコンピューティングのコストは確実に自分で管理できるものであることを理解しましょう

クラウド コンピューティングが新たな標準となり、組織がデジタル ビジネス イニシアチブへと移行するに...

NSX + Kubernetes: ビジネスに DevOps の俊敏性をもたらす

[[204001]] Kubernetes はコンテナ オーケストレーションの事実上の標準となり、コ...

Xiaomi のマーケティングは Xiaomi のインターネットでの存在感にどの程度貢献していますか?

月収10万元の起業の夢を実現するミニプログラム起業支援プランモノのインターネットの時代が到来しました...

Linodeはどうですか?米国西海岸シアトルデータセンターのクラウドサーバーの評価

Linodeは現在、米国西海岸に3つのデータセンターを所有しており、南から北にロサンゼルス、フリーモ...

ハイブリッドクラウド空間をめぐる競争: クラウドコンピューティングはより多くの企業を引き付けるために進化する

長年にわたり、エンタープライズ クラウド コンピューティングは、可能なことと実用的なことの間で慎重に...

遂寧の人々が探求した6つのビジネス戦略と9つの信条

1. 勇敢に前進する――市場で足場を築く方法市場は企業が足がかりを築き、奮闘する戦場です。中小企業が...