Alibaba Cloud は安定性向上のため「カオスエンジニアリング」を導入。独自のクラウドは「ランダム破壊」後も正常に動作する

Alibaba Cloud は安定性向上のため「カオスエンジニアリング」を導入。独自のクラウドは「ランダム破壊」後も正常に動作する

2018年の杭州雲奇カンファレンスで、アリババクラウドは素晴らしいショーを披露しました。観客によってランダムに選ばれた12,600個の異常物体が「カンフーモンキー」に変身し、専用のクラウドデータセンターで暴れ回って「破壊」を行いました。ハードドライブの電源障害、ネットワークの揺れ、サーバーのクラッシュなどをシミュレートしましたが、システムとアプリケーションは依然として安定して動作しました。
「IT 実務者にとって最大の未解決の謎は、ディスクがいっぱいになり、ネットワークが混雑すると、なぜ主要なアプリケーション サービスの中断が連鎖的に発生するのかということです。」アリババクラウドのプライベートクラウドおよびエンタープライズアプリケーション担当ゼネラルマネージャーの馬進氏は冗談めかしてこう語った。 「以前は、システム全体の訓練を実施できる条件がありませんでした。今日では、『カオスエンジニアリング』という概念を導入し、準本番環境に高頻度の異常を注入して、プライベートクラウドの信頼性を向上させています。」
昨年の雲奇カンファレンスでサーバーのプラグを抜く実演をして以来、馬進は「破壊王」と呼ばれている。しかし、「破壊」はシステムをより安定させるためです。過去 1 年間、彼とエンジニアは「カオス エンジニアリング」計画を開始し、サーバーのダウンタイム、コンピューティング リソースの枯渇、プログラムの異常終了、偶発的な削除、ネットワークのジッター、IO ハングなどの複雑な問題など、それぞれがシステムに一定の損害を引き起こす可能性のある 12,600 を超える異常な組み合わせを本番環境で構築しました。こうした問題に対する「独自のクラウド免疫システム」を構築することで、顧客が潜在的な障害の危険性を80%事前に排除できるように支援します。


観客がランダムに選んだ異常では破壊力が足りなかったのかもしれない。そこで馬進は決心し、極限環境で超異常を実証した。コアECSクラスターでローカルネットワーク異常が発生し、別のECSのコンピューティングリソースが飽和状態になったのだ。 「このような状況は、システム雪崩を簡単に引き起こす可能性があります。通常、顧客のサービスは停止し、回復には非常に長い時間がかかります」と馬金氏は説明した。デモ サイトのプライベート クラウドの迅速な分離と柔軟なスケーリング サービスが効果を発揮し、わずか数秒のジッターの後、アプリケーションは正常に戻りました。
「カオスエンジニアリング」は通常、エンジニアリング分野で使用され、制御可能な範囲内でシステム障害を引き起こす可能性のあるいくつかの実験の実践を指します。馬金氏は、アリババクラウドの「カオスエンジニアリング」とは、模擬生産環境で制御可能な建設的破壊を実行し、期待に応えられないシステムのフィードバックを継続的に最適化することで、顧客に安定した環境を継続的に磨き上げ、提供することにあると述べた。

[[244366]]


Alibaba Cloud は、2016 年に独自のクラウド ソリューションをリリースして以来、税関総署、浙江省政府サービス ネットワーク、中国聯通、CITIC などの大規模な政府および企業の顧客を含む、数百の政府、金融機関、企業の顧客のデジタル変革を支援してきました。独自のクラウドは 60 を超えるクラウド製品とサービスを提供しており、10 ~ 10,000 ユニットの単一クラスター展開をサポートし、コンピューティングをより多くのエッジ シナリオに拡張できます。今日のプライベート クラウドは海外市場に進出し、世界中の顧客にサービスを提供するために Intel と業界提携を結んでいます。

<<:  クラウド コンピューティング環境におけるストレージの 6 つの必須要素は何ですか?

>>:  2018年クラウドネイティブテクノロジープラクティスサミット(CNBPS)がクラウドネイティブを再定義

推薦する

SKYCCの売上が好調なのはネットワークマーケティングだけによるものではない

意外にも、ビデオマーケティング「IT敗者の告白」の後、SKYCCの販売量は実際に急上昇しました。ニュ...

ハイパーリンクのないURLが最適化に効果的かどうかを2つの側面から分析する

ハイパーリンクのないURLが最適化に効果的かどうかを2つの側面から分析するSEO担当者は、説明的なテ...

百度アプリは、いくつかのチャンネルでコンテンツ違反があったため、是正を求められた。

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスBaidu アプリはチャ...

ウェブマスターが多様なウェブサイト最適化テクニックをどのように作成できるかについての簡単な説明

インターネットが成熟するにつれて、検索アルゴリズムはますますインテリジェントになってきています。自分...

記事ページに100以上のトラフィックをもたらす方法

記事ページはどのようにして 100 以上のトラフィックをもたらすのでしょうか? 記事ページはどのよう...

画像サイトのコンテンツと画像記事のレイアウトを最適化するためのポイント

多くの画像ウェブサイト、特に美しい写真を表示するウェブサイトは、Baidu のキーワードランキングに...

ザック北京MADConカンファレンスはSEOに関する誤解トップ10を深く分析する

ご存知のとおり、北京MADConカンファレンスは終了しましたが、その重要性は国内SEOに大きな影響を...

Linodeはどうですか?フランスのパリのデータセンターにおけるクラウドサーバーレビュー

Linodeはどうですか? Linode France クラウド サーバーはいかがでしょうか? Ak...

ウェブサイトのSEOとユーザーエクスペリエンスの組み合わせ = 持続可能な開発

おそらく多くのウェブマスターの友人はキーワードに非常に長けており、さまざまな手段で短期間でトラフィッ...

ハイブリッドクラウドについて:パブリッククラウドとプライベートクラウドを1+1>2にする方法

[51CTO.com オリジナル記事] クラウド コンピューティングは 2016 年に驚異的な成長を...

iniz-6モデル販売中/128Mメモリ/KVM/年額15.5ドル

iniz は 6 つの特別価格 VPS をリリースしました。その中で、128M メモリと年間支払いを...

FIT2CLOUDがシリーズCおよびC+の資金調達を完了し、中国のマルチクラウド管理市場をリードし続けます

2020年4月16日、中国のマルチクラウド管理プラットフォームソフトウェアおよびサービスプロバイダー...

Wooservers 仮想ホスティング 年間 20 ドル - 無料ドメイン名 + 独立 IP

Wooservers は英国に登録されたホスティング会社です (英国登録番号: 07207169)。...

aoyouhost: 台湾のクラスターサーバー、8 つの C セグメント (232IP)、直接接続、無制限のトラフィック

aoyouhostの日本クラスターサーバー、直結回線、8C、無制限トラフィックをご紹介します。おそら...