Alibaba Cloud は安定性向上のため「カオスエンジニアリング」を導入。独自のクラウドは「ランダム破壊」後も正常に動作する

Alibaba Cloud は安定性向上のため「カオスエンジニアリング」を導入。独自のクラウドは「ランダム破壊」後も正常に動作する

2018年の杭州雲奇カンファレンスで、アリババクラウドは素晴らしいショーを披露しました。観客によってランダムに選ばれた12,600個の異常物体が「カンフーモンキー」に変身し、専用のクラウドデータセンターで暴れ回って「破壊」を行いました。ハードドライブの電源障害、ネットワークの揺れ、サーバーのクラッシュなどをシミュレートしましたが、システムとアプリケーションは依然として安定して動作しました。
「IT 実務者にとって最大の未解決の謎は、ディスクがいっぱいになり、ネットワークが混雑すると、なぜ主要なアプリケーション サービスの中断が連鎖的に発生するのかということです。」アリババクラウドのプライベートクラウドおよびエンタープライズアプリケーション担当ゼネラルマネージャーの馬進氏は冗談めかしてこう語った。 「以前は、システム全体の訓練を実施できる条件がありませんでした。今日では、『カオスエンジニアリング』という概念を導入し、準本番環境に高頻度の異常を注入して、プライベートクラウドの信頼性を向上させています。」
昨年の雲奇カンファレンスでサーバーのプラグを抜く実演をして以来、馬進は「破壊王」と呼ばれている。しかし、「破壊」はシステムをより安定させるためです。過去 1 年間、彼とエンジニアは「カオス エンジニアリング」計画を開始し、サーバーのダウンタイム、コンピューティング リソースの枯渇、プログラムの異常終了、偶発的な削除、ネットワークのジッター、IO ハングなどの複雑な問題など、それぞれがシステムに一定の損害を引き起こす可能性のある 12,600 を超える異常な組み合わせを本番環境で構築しました。こうした問題に対する「独自のクラウド免疫システム」を構築することで、顧客が潜在的な障害の危険性を80%事前に排除できるように支援します。


観客がランダムに選んだ異常では破壊力が足りなかったのかもしれない。そこで馬進は決心し、極限環境で超異常を実証した。コアECSクラスターでローカルネットワーク異常が発生し、別のECSのコンピューティングリソースが飽和状態になったのだ。 「このような状況は、システム雪崩を簡単に引き起こす可能性があります。通常、顧客のサービスは停止し、回復には非常に長い時間がかかります」と馬金氏は説明した。デモ サイトのプライベート クラウドの迅速な分離と柔軟なスケーリング サービスが効果を発揮し、わずか数秒のジッターの後、アプリケーションは正常に戻りました。
「カオスエンジニアリング」は通常、エンジニアリング分野で使用され、制御可能な範囲内でシステム障害を引き起こす可能性のあるいくつかの実験の実践を指します。馬金氏は、アリババクラウドの「カオスエンジニアリング」とは、模擬生産環境で制御可能な建設的破壊を実行し、期待に応えられないシステムのフィードバックを継続的に最適化することで、顧客に安定した環境を継続的に磨き上げ、提供することにあると述べた。

[[244366]]


Alibaba Cloud は、2016 年に独自のクラウド ソリューションをリリースして以来、税関総署、浙江省政府サービス ネットワーク、中国聯通、CITIC などの大規模な政府および企業の顧客を含む、数百の政府、金融機関、企業の顧客のデジタル変革を支援してきました。独自のクラウドは 60 を超えるクラウド製品とサービスを提供しており、10 ~ 10,000 ユニットの単一クラスター展開をサポートし、コンピューティングをより多くのエッジ シナリオに拡張できます。今日のプライベート クラウドは海外市場に進出し、世界中の顧客にサービスを提供するために Intel と業界提携を結んでいます。

<<:  クラウド コンピューティング環境におけるストレージの 6 つの必須要素は何ですか?

>>:  2018年クラウドネイティブテクノロジープラクティスサミット(CNBPS)がクラウドネイティブを再定義

推薦する

ウェブマスターネットワークからの毎日のレポート:福建省が違法ウェブサイトを閉鎖、NDRCが価格競争を調査

1. Renren.comは変化を計画、陳一州はグループ購入サイトの買収を希望中国版Facebook...

SSDVPS-512M メモリ (第 2 世代 VZ) + 20GSSD/月額 3.5 USD/QuadraNet

ssdvps.com は 2009 年に登録されたドメイン名です。公式ウェブサイトには関連情報があり...

kvmla: 香港将軍澳データセンター VPS が 20% オフ、追加 1G メモリと Windows サポート付き

kvmla は香港の将軍澳に新しいデータセンターを追加し、現在 VPS を販売しています。新しいキャ...

ライブ放送を視聴する人が数千人しかいなくても、それでも行う価値はあるのでしょうか?

ライブストリーミングは、昨年から始まったビジネス関連業界のキーワードです。大きなプロモーションがある...

ウェブサイトパターン分析: Pinterest の「ウォーターフォール」の背後にある心理学

Pinterestはとても人気があります。 comScore のデータによると、Pinterest ...

長い間ページがインデックスされていない場合、どうすれば Baidu に自分の Web サイトのインデックスを作成させることができますか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますウェブサイ...

初心者がウェブサイトを構築する際に必要な7つのポイントを公開

1. スペース(ウェブサイトの魂が存在する場所)私たちの魂が体の中に保存される必要があるのと同じよう...

大規模ウェブサイトの 301 リダイレクトの実施方法に関する個人的な経験分析

最近、SEOディレクターグループで、友人のウェブサイトが次のような問題に遭遇したのを見ました。ウェブ...

SEO 最適化: キーワード密度とウェブサイトのランキング

検索エンジン最適化に携わっている同僚の中には、キーワードについて質問してくる人も多いです。たとえば、...

オラクルは人事および人材管理プロセスを再構築し、人間味のある労働モデルを構築

オラクルは本日、求職者と従業員の高まる期待に組織が応えられるよう支援するため、Oracle Huma...

美容ウェブサイトの短命な人気の背景には、プライバシー紛争と創造性の欠如がある

武漢大学の「美人コンテスト」ウェブサイトwhuface.comのスクリーンショット(写真提供:Sin...

天津がインターネット企業の新たな拠点に:免税、家賃補助

天津経済技術開発区とその周辺地域、漢沽区、塘沽区、大港区などの沿海地域は、投資を誘致する沿海新興地域...

百度が皇帝になるための武器:百度マーケティング大学

12月14日、百度マーケティング大学が正式に設立されました。国内検索エンジン業界の「兄貴分」として、...

将来、ウェブサイト間の究極の競争は、誰が最大のユーザーベースを持つかということになるでしょう。

ウェブサイトのキーワードランキングに影響を与える要因は多すぎます。ウェブサイトのキーワードランキング...