アリババクラウド、大規模障害に対応:運用・保守エラーを大幅に改善

アリババクラウド、大規模障害に対応:運用・保守エラーを大幅に改善

6月28日朝のニュース:今朝早く、アリババクラウドの公式Weiboアカウントが、昨日発生した大規模な障害に対して公式な反応を示しました。声明によると、運用と保守における操作上の誤りにより、一部の顧客がAlibaba Cloud公式サイトコンソールにアクセスしたり、一部の製品機能を使用したりする上で問題が発生したという。

声明では障害の原因を検証し、エンジニアリングチームが新しい自動運用・保守機能の導入時に変更検証操作を実行したとしている。この機能は、テスト環境での検証中に問題は発生しませんでした。しかし、自動運用保守システムにオンライン化された後、未知のコードバグが発生しました。エラー コードにより一部の内部 IP アドレスが無効になり、一部の製品へのアクセス リンクが利用できなくなりました。

6月27日午後、多くのネットユーザーがWeibo上で、Alibaba Cloudコンソールへのアクセスに問題があり、画像サービスを含むバックエンドにログインできないと報告した。 Alibaba Cloud公式サイトの一部管理機能やMQ、NAS、OSSなどの製品の一部機能でもアクセス異常が発生しました。一部のユーザーからは、携帯電話からもPCからもアクセスできないという報告がありました。その後、アリババクラウドは公式サイトで、一部の管理・制御機能にアクセス異常が発生していたが、影響を受けた業務は徐々に正常に戻りつつあるとの発表を行った。

この事件に関するAlibaba Cloudからの公式回答は以下のとおりです。

6月27日のアリババクラウド障害

6月27日午後、当社側の操作ミスにより、一部のお客様がAlibaba Cloud公式サイトコンソールにアクセスできず、一部の製品機能を使用できないという問題が発生し、上級スタッフから苦情が寄せられました。障害は2018年6月27日北京時間16時21分頃に始まり、16時50分に復旧し始めた。

緊急技術検討の結果、障害の原因は以下のとおりです。

その日の午後、エンジニアリング チームは、新しい自動運用および保守機能を起動する際に変更検証操作を実行しました。この機能は、テスト環境での検証中に問題は発生しませんでした。しかし、自動運用保守システムにオンライン化された後、未知のコードバグが発生しました。エラー コードにより一部の内部 IP アドレスが無効になり、一部の製品へのアクセス リンクが利用できなくなりました。その後の手動介入により、エンジニアリング チームはすぐに問題を特定し、修復しました。

影響を受ける領域には、Alibaba Cloud の公式サイトコンソールのほか、MQ、NAS、OSS などの製品機能が含まれます。この失敗には言い訳の余地はない。私たちはそのような間違いを犯してはなりませんし、犯してはなりません。当社は、自動化された運用・保守技術とリリース検証プロセスを慎重に検討・改善し、すべてのコード行とすべての信頼を尊重します。

アリババクラウドコンピューティング株式会社

2018年6月27日

<<:  Ceph の運用とメンテナンスで分散ストレージの「落とし穴」を知る

>>:  クラウドネイティブがエンタープライズセキュリティに革命を起こす3つの理由

推薦する

SEO業界に参入しようとしているウェブマスターの友人に宛てた手紙

SEO 業界に参入したばかり、または参入準備中のウェブマスターの友人に宛てたメッセージです。最近、何...

銀行のデジタル変革:クラウドコンピューティングの導入 付録:銀行におけるクラウドコンピューティングアプリケーションの概要

[[222943]] 「ネットユニオン」「信用組合」に続き、金融インフラの構築が加速し続けており、金...

tmhhost: すべてのVPSが34%オフ、香港BGP200M\日本ソフトバンク\米国cn2 gia 200G高防御\米国3ネットワークcn2 gia\韓国CN2

tmhhostは、端午節+618年中節プロモーションを開始しました。日本ソフトバンク、ロサンゼルス2...

zji: 2800元/月、US双方向cn2 100M、2*e5-26xx/64gメモリ/500gSSD

アメリカ西海岸サンノゼにあるCN2双方向最適化回線を備えたZjiのサーバーがプロモーション中です。双...

世界のエッジコンピューティング市場は2026年までに152億ドルに達する

[[408880]]最近、Global Industry Analysts (GIA) は、「エッジ...

数百万人が参加するオンラインライブインタラクティブプラットフォーム向けのDockerベースのマイクロサービスアーキテクチャプラクティス

[51CTO.com からのオリジナル記事] この記事では、特定のプロジェクト例から始まり、迅速にス...

Pacificrack: 新年プロモーション、年間 15 ドル、2G メモリ/2 コア/20g SSD/5T データ、Alipay/クレジットカード

Pacificrack は新年のセールを開始しました。2GB メモリの VPS は年間 15 ドルか...

対外貿易ネットワーク促進方法集:自分に合ったものを選ぶことが最も重要

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています対外貿易ネ...

メタバースはクラウド コンピューティングにどのような影響を与えるでしょうか?

メタバースは、インターネット上で人々がやりとりする方法に革命をもたらすと期待される、相互接続された ...

ウェブサイトの内部リンクの最適化に関するこれらの詳細に気づきましたか?

以前の記事のいくつかで、著者はサイトの重さに影響を与えるいくつかの要因について簡単に触れました。内部...

Renren Videoは閉鎖の噂に対して次のように反応した。ウェブサイトは更新中で、後日オンラインになる予定だ。

さらに読む: Renren Videoが再びダウン、同じタイプのウェブサイトへのアクセスは正常Ren...

SEO外部リンク構築の今後の方向性について簡単に議論する

外部リンク: 外部リンクとは、他の人の Web サイト上にあり、あなたの Web サイトへのリンクが...

オランダのアムステルダムにおける gcore Basic VM の簡単なレビュー

gcoreはどうですか? gcore クラウド サーバーはどうですか? gcoreのクラウドサーバー...

投資家の2012年:虎は昼寝をせず、中小企業は苦境に立たされる

2006年から2012年までのVCPE機関のIPO出口の帳簿収益2012年は中国の投資家と起業家にと...