マイクロソフト リサーチ アジア インテリジェント オペレーション: クラウド サービスのインテリジェントな推進力

マイクロソフト リサーチ アジア インテリジェント オペレーション: クラウド サービスのインテリジェントな推進力

この疫病は人々の生産や生活の仕方を変えました。共同作業、リモートワーク、オンライン教育などのシナリオが標準となり、これらのシナリオでもインフラストラクチャに対する要求が高まっています。

ガートナー リサーチの副社長であるシド・ナグ氏は、クラウド コンピューティングが主流の戦略になったと考えています。「次世代の製品ソリューションのほぼすべてがクラウド プラットフォーム上に構築されています。」しかし、クラウドに移行するユーザーが増えるにつれて、システム管理はかつてない課題に直面しています。膨大なユーザー、大規模なクラスター、複雑なシステム アーキテクチャにより、従来の運用および保守方法では状況に対応できなくなります。いかにリアルタイムに異常を検知し、障害に迅速に対応し、障害を予測し、容量を合理的に計画するかが重要な課題となっています。このとき、インテリジェントな運用と保守を実現する AIOps がデビューします。

AIOps は、多くの面で従来の運用と保守の問題点に直接的に影響します。 AI アルゴリズムは、膨大な量の運用および保守データを分析するという重要なタスクを担います。問題を自動的かつ正確に検出して特定し、意思決定レベルで運用効率を向上させ、コスト、品質、効率の観点から企業の運用と保守作業を最適化するための重要なサポートを提供します。ガートナーの戦略計画の想定によると、2023 年までに DevOps チームの 40% が IT 運用向け AI (AIOps) プラットフォームを使用してアプリケーションおよびインフラストラクチャ監視ツールを強化することになります。

注目の人工知能分野において、データ駆動型で AI 対応の Microsoft Cloud は、世界のクラウド サービス市場において常に合理的かつ楽観的な姿勢を維持してきました。データは、Microsoft クラウド管理に新しい次元、つまりデータ インテリジェンスを提供します。 Microsoft Research Asia のエグゼクティブ バイスプレジデントであり、Microsoft の著名な主任科学者でもある Dongmei Zhang 氏は、Microsoft は AIOps を主に「システム向け AI」、「顧客向け AI」、「DevOps 向け AI」という 3 つの側面から定義していると述べました。 AIOps は、これらのアプリケーション シナリオで多くの課題に直面します。

AIOps の応用: 正確な予測、効率的なソリューション、より良いサービス

システム向け AIでは、開発者は実行中のシステムの観点から問題を検討する必要があります。たとえば、システムの異常検出は、問題を見つけることだけではなく、早期に警告を提供することも重要です。ハードディスクの障害予測を例にとると、開発者は変化したデータやステータスを分析することで、ディスクに障害があるかどうかを予測できます。システムはハードディスクの大量の履歴データを学習した後、ディスクの現在の状態を比較して、将来的にタイムリーな対策を講じることができるかどうかを予測します。さらに、故障したハードドライブに加えて、隣接するディスクの状態も考慮する必要があります。

Microsoft Research Asia の主任研究員である Lin Qingwei 氏は、Microsoft Research Asia が Neighborhood-Temporal Attention Model (NTAM) を開発したと紹介しました。このモデルには、近隣認識コンポーネント、時間コンポーネント、意思決定コンポーネントが含まれており、時間と空間の両方でより多くの情報を取得できます。林青偉氏は、過去10年から20年の間に最先端の学術誌や会議で発表された論文の方法と比較したところ、このモデルは精度と再現率の点で良好な結果を示し、強力な予測能力を備えていると述べた。

DevOps 向け AI は、主に開発および運用担当者の生産性向上をターゲットにしています。問題が発生した場合、その解決はただ早く正常に戻すことではなく、大量のテストと診断を通じて問題自体をより迅速かつ効率的に解決することです。関連する展開は通常、非常に小規模から始まり、徐々に規模を拡大し、各ステップが安全であることが確認された後にのみクラウド プラットフォームに展開されます。資格、センサー信号、ステータスなど、展開プロセス全体を通じてすべてのヘルス信号を検出する必要があります。いずれかの側面で問題が発生した場合、開発者はまずそれが展開の問題によって発生したかどうかを確認し、次に展開に基づいて相関トラブルシューティングを実行します。

DevOps 向け AI におけるセキュリティ展開診断の問題に対処するために、Microsoft Research Asia は Active Transfer Learning Anomaly Detection (ATAD) ソリューションを提案しました。このソリューションは、転移学習を使用して他のデータから学習した知識を対象分野に変換すると同時に、エンジニアが能動学習を通じて優先順位を付け、より良い学習結果を達成できるようにします。このソリューションは、Microsoft クラウド プラットフォームで使用されています。 「このソリューションでは、通常、高品質のラベル付きデータを入手するのは難しいため、エンジニアは判断を下すために非常に強い洞察力を持っている必要があります」とリン・チンウェイ氏は語った。

AI for Customer は、より優れたユーザー エクスペリエンスを生み出し、顧客に優れたサービスを提供することを目的としています。

Lin Qingwei 氏は、インテリジェントな仮想マシンの事前構成を例に挙げ、Microsoft Research Asia が AI for Customer 分野で行った研究成果の一部を紹介しました。クラウドプラットフォーム上の仮想マシンを申請するには時間がかかります。この問題の解決策の 1 つは、ソフトウェアとシステム構成を事前にインストールして、ユーザーが必要なときに直接使用できるようにすることです。しかし、仮想マシンプールの容量には限りがあり、同様の機種を大量に構成することは不可能であるため、最適な構成を実現するためには、ユーザーがどのようなタイプの仮想マシンを構成するかを予測する必要があります。 Microsoft Research Asia は、予測と最適化に不確実性認識フレームワークを使用する新しい方法論フレームワークを提案しました。結果は、この方法が他のアルゴリズムよりも優れたパフォーマンスを達成することを示しています。

Microsoft Research Asia のデータ、ナレッジ、インテリジェンス グループと Microsoft Cloud 製品チームの緊密な協力により、クラウド システムの障害予測、異常検出、インテリジェント診断、容量計画、インシデント管理など、多くの実用的なアプリケーション シナリオに一連の革新的なテクノロジが実装されました。関連する研究成果は、ICSE、OSDI、USENIX ATC、WWW、AAAI、KDD などの影響力の大きい会議でも発表されており、サービス品質、ユーザー エクスペリエンス、産業生産性が大幅に向上しています。

AIOps の未来: 自律性、活性化、普遍性

AIOps の将来の研究方向について語る際、Lin Qingwei 氏は、第一に自動化と自律性の向上だと述べました。現在、AIOps の方向性は、ユーザーに特定の提案や推奨事項を提供することですが、Microsoft Research Asia は、将来、AIOps がより自律的になり、自動的に決定を下せるようになり、ユーザーが人間の介入なしに最善の決定を下せるようになることを期待しています。第二に、より積極的に行動し、問題が発生するまで解決を待つのではなく、問題の芽を摘み取るようにします。 3 つ目は、より汎用的になり、クロスプラットフォームの AIOps アプリケーションがクラウド プラットフォームだけでなくすべてのプラットフォームで利用できるようになることです。



<<:  SaaS データ保護の責任をどのように確立するのでしょうか?

>>:  クラウドコンピューティング環境における主要なセキュリティ技術の研究

推薦する

建設業界におけるエッジコンピューティングの応用価値は何ですか?

エッジ コンピューティングは、集中型のクラウド コンピューティング センターからデータ ソースや端末...

Spring Boot 2.x 基本チュートリアル: JTA を使用した分散トランザクションの実装

[[380215]] Spring Boot プロジェクトでは、複数のデータ ソースに接続するのが非...

常に変化する状況の中で、Baiduをあなたのウェブサイトのようにする方法

トラフィックとユーザーは、ウェブサイトの 2 つの重要な生命線です。この 2 つは互いに補完し合って...

Sinovation Ventures の Wang Hua: インターネットでトラフィックを生成する方法に関する 3 つの「相対的な真実」

トラフィックとユーザーの生成は一度きりのことではなく、モバイルで持続的かつ長期的な運用が必要です。な...

Kubernetes を使用する 4 つの理由

現代のソフトウェア開発者のほとんどが証明しているように、コンテナは物理インフラストラクチャと仮想イン...

ウェブサイトの最適化はランキングのためですか、それともユーザーエクスペリエンスのためですか?

ウェブサイトの最適化とは何でしょうか。百科事典では非常にわかりやすく説明されていると思います。しかし...

海外マーケティング戦略:海外広告プラットフォームランキング

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています企業の海外...

Kaniko を使用して Kubernetes クラスターでコンテナ イメージを構築する方法

序文Kubernetes に必要なコンテナイメージを構築するにはどうすればよいでしょうか?答えは D...

テンセントがminiStationをリリースし、メインフレーム市場への参入を発表

11月9日、テンセントのminiStationマイクロゲームコンソール発表会が北京静源芸術センターで...

プロバイダーサービス - 1g メモリ/30g SSD/月額支払い 2.94 ユーロ

Providerservice は時代の流れに遅れずについていっており、遅れるわけにはいきません。同...

旅行統合企業Ctrip:Qunarの買収は困難、eLongへの投資を希望

テンセントテクノロジーファン・シャオドンが5月12日に報じた。 CtripとQunarの合併・買収交...

カマテラはどうですか?イタリア、ミラノのクラウドサーバーのレビュー

カマテラはどうですか? Kamatera Italy クラウドサーバーはいかがでしょうか? Kama...

namecheap $6.99 転送クーポンコード

Namecheap では 9 月に大幅な割引を実施しており、前回の割引からかなり時間が経っています。...