マイクロソフト リサーチ アジア インテリジェント オペレーション: クラウド サービスのインテリジェントな推進力

マイクロソフト リサーチ アジア インテリジェント オペレーション: クラウド サービスのインテリジェントな推進力

この疫病は人々の生産や生活の仕方を変えました。共同作業、リモートワーク、オンライン教育などのシナリオが標準となり、これらのシナリオでもインフラストラクチャに対する要求が高まっています。

ガートナー リサーチの副社長であるシド・ナグ氏は、クラウド コンピューティングが主流の戦略になったと考えています。「次世代の製品ソリューションのほぼすべてがクラウド プラットフォーム上に構築されています。」しかし、クラウドに移行するユーザーが増えるにつれて、システム管理はかつてない課題に直面しています。膨大なユーザー、大規模なクラスター、複雑なシステム アーキテクチャにより、従来の運用および保守方法では状況に対応できなくなります。いかにリアルタイムに異常を検知し、障害に迅速に対応し、障害を予測し、容量を合理的に計画するかが重要な課題となっています。このとき、インテリジェントな運用と保守を実現する AIOps がデビューします。

AIOps は、多くの面で従来の運用と保守の問題点に直接的に影響します。 AI アルゴリズムは、膨大な量の運用および保守データを分析するという重要なタスクを担います。問題を自動的かつ正確に検出して特定し、意思決定レベルで運用効率を向上させ、コスト、品質、効率の観点から企業の運用と保守作業を最適化するための重要なサポートを提供します。ガートナーの戦略計画の想定によると、2023 年までに DevOps チームの 40% が IT 運用向け AI (AIOps) プラットフォームを使用してアプリケーションおよびインフラストラクチャ監視ツールを強化することになります。

注目の人工知能分野において、データ駆動型で AI 対応の Microsoft Cloud は、世界のクラウド サービス市場において常に合理的かつ楽観的な姿勢を維持してきました。データは、Microsoft クラウド管理に新しい次元、つまりデータ インテリジェンスを提供します。 Microsoft Research Asia のエグゼクティブ バイスプレジデントであり、Microsoft の著名な主任科学者でもある Dongmei Zhang 氏は、Microsoft は AIOps を主に「システム向け AI」、「顧客向け AI」、「DevOps 向け AI」という 3 つの側面から定義していると述べました。 AIOps は、これらのアプリケーション シナリオで多くの課題に直面します。

AIOps の応用: 正確な予測、効率的なソリューション、より良いサービス

システム向け AIでは、開発者は実行中のシステムの観点から問題を検討する必要があります。たとえば、システムの異常検出は、問題を見つけることだけではなく、早期に警告を提供することも重要です。ハードディスクの障害予測を例にとると、開発者は変化したデータやステータスを分析することで、ディスクに障害があるかどうかを予測できます。システムはハードディスクの大量の履歴データを学習した後、ディスクの現在の状態を比較して、将来的にタイムリーな対策を講じることができるかどうかを予測します。さらに、故障したハードドライブに加えて、隣接するディスクの状態も考慮する必要があります。

Microsoft Research Asia の主任研究員である Lin Qingwei 氏は、Microsoft Research Asia が Neighborhood-Temporal Attention Model (NTAM) を開発したと紹介しました。このモデルには、近隣認識コンポーネント、時間コンポーネント、意思決定コンポーネントが含まれており、時間と空間の両方でより多くの情報を取得できます。林青偉氏は、過去10年から20年の間に最先端の学術誌や会議で発表された論文の方法と比較したところ、このモデルは精度と再現率の点で良好な結果を示し、強力な予測能力を備えていると述べた。

DevOps 向け AI は、主に開発および運用担当者の生産性向上をターゲットにしています。問題が発生した場合、その解決はただ早く正常に戻すことではなく、大量のテストと診断を通じて問題自体をより迅速かつ効率的に解決することです。関連する展開は通常、非常に小規模から始まり、徐々に規模を拡大し、各ステップが安全であることが確認された後にのみクラウド プラットフォームに展開されます。資格、センサー信号、ステータスなど、展開プロセス全体を通じてすべてのヘルス信号を検出する必要があります。いずれかの側面で問題が発生した場合、開発者はまずそれが展開の問題によって発生したかどうかを確認し、次に展開に基づいて相関トラブルシューティングを実行します。

DevOps 向け AI におけるセキュリティ展開診断の問題に対処するために、Microsoft Research Asia は Active Transfer Learning Anomaly Detection (ATAD) ソリューションを提案しました。このソリューションは、転移学習を使用して他のデータから学習した知識を対象分野に変換すると同時に、エンジニアが能動学習を通じて優先順位を付け、より良い学習結果を達成できるようにします。このソリューションは、Microsoft クラウド プラットフォームで使用されています。 「このソリューションでは、通常、高品質のラベル付きデータを入手するのは難しいため、エンジニアは判断を下すために非常に強い洞察力を持っている必要があります」とリン・チンウェイ氏は語った。

AI for Customer は、より優れたユーザー エクスペリエンスを生み出し、顧客に優れたサービスを提供することを目的としています。

Lin Qingwei 氏は、インテリジェントな仮想マシンの事前構成を例に挙げ、Microsoft Research Asia が AI for Customer 分野で行った研究成果の一部を紹介しました。クラウドプラットフォーム上の仮想マシンを申請するには時間がかかります。この問題の解決策の 1 つは、ソフトウェアとシステム構成を事前にインストールして、ユーザーが必要なときに直接使用できるようにすることです。しかし、仮想マシンプールの容量には限りがあり、同様の機種を大量に構成することは不可能であるため、最適な構成を実現するためには、ユーザーがどのようなタイプの仮想マシンを構成するかを予測する必要があります。 Microsoft Research Asia は、予測と最適化に不確実性認識フレームワークを使用する新しい方法論フレームワークを提案しました。結果は、この方法が他のアルゴリズムよりも優れたパフォーマンスを達成することを示しています。

Microsoft Research Asia のデータ、ナレッジ、インテリジェンス グループと Microsoft Cloud 製品チームの緊密な協力により、クラウド システムの障害予測、異常検出、インテリジェント診断、容量計画、インシデント管理など、多くの実用的なアプリケーション シナリオに一連の革新的なテクノロジが実装されました。関連する研究成果は、ICSE、OSDI、USENIX ATC、WWW、AAAI、KDD などの影響力の大きい会議でも発表されており、サービス品質、ユーザー エクスペリエンス、産業生産性が大幅に向上しています。

AIOps の未来: 自律性、活性化、普遍性

AIOps の将来の研究方向について語る際、Lin Qingwei 氏は、第一に自動化と自律性の向上だと述べました。現在、AIOps の方向性は、ユーザーに特定の提案や推奨事項を提供することですが、Microsoft Research Asia は、将来、AIOps がより自律的になり、自動的に決定を下せるようになり、ユーザーが人間の介入なしに最善の決定を下せるようになることを期待しています。第二に、より積極的に行動し、問題が発生するまで解決を待つのではなく、問題の芽を摘み取るようにします。 3 つ目は、より汎用的になり、クロスプラットフォームの AIOps アプリケーションがクラウド プラットフォームだけでなくすべてのプラットフォームで利用できるようになることです。



<<:  SaaS データ保護の責任をどのように確立するのでしょうか?

>>:  クラウドコンピューティング環境における主要なセキュリティ技術の研究

推薦する

BaiduとGoogleのSEO最適化の違い

Baidu は中国の検索エンジンのリーダーであり、Google は世界の検索エンジンのリーダーです。...

推奨: stablehost-$13/1g メモリ/20g ハードディスク/2T トラフィック

今日は、ハイエンドの openvz ベースの仮想 VPS である stablehost を紹介します...

マルチクラウド戦略を成功させるための 7 つのヒント

ますます多くの企業にとって、クラウドへの移行は、AWS、Microsoft Azure、またはその他...

クラウドコストをより適切に管理するために、7 つのクラウド財務指標を追跡します。

今日、企業は、特に経済が不安定な時期にクラウド支出を追跡することの重要性を十分に認識しています。しか...

コンテナの利点はソフトウェアベースのネットワークに浸透している

コンテナは、IT およびネットワーク アプリケーション開発に大きな影響を与える新しいテクノロジーです...

SEOの詳細が重みを決定し、重みがランキングを決定する

前回の記事「オリジナル記事が転載記事よりランクが低い理由:重量増加」では、Webサイトの重量増加の概...

SEOは何も考えずに想像することを拒否し、データに基づいて話す必要があります

SEO に取り組む時間が長くなればなるほど、SEO について学ぶ価値のあることがさらに増えることに気...

speedykvm-$6/KVM/1g メモリ/50g SSD/1T トラフィック/ダラス

有名なInceroコンピュータルームは、2番目のVPSブランド「speedykvm」を作成しました。...

404 ページの本質: ユーザーのための忠実なガイド

ウェブサイト上のデッドリンクや間違ったリンクを避けることは困難です。サイト上の記事の削除やウェブサイ...

HostMist - 年間 25 ドル / 256 MB RAM / 20 GB HDD / 300 GB Flow / ロサンゼルス QR

ここでは、手間をかけずにブログや個人のウェブサイトを構築したい友人にお勧めの、ホストミスト社の小メモ...

ウェブサイトのランキングが回復しました。分析テスト結果

みなさんこんにちは。ハルビン仮想現実ウェブサイト設計です。数日前、仮想現実ウェブサイト設計の公式サイ...

ネットワークマーケティングについての簡単な説明:QQグループランキングマーケティング

QQをよく使う人にとって、QQグループは馴染みのないものではなく、QQグループの使い方を知っている人...

卓球フォーラムからスポーツフォーラムで人気を集める方法

最近、私は卓球フォーラムに注目しています。このフォーラムから、スポーツフォーラムに人々を引き付けるた...

618年の最初の戦いで、JD.com + PinduoduoがTaobaoより小さいのはなぜですか?

現在、あらゆる面からのデータから判断すると、618カーニバルの人気はタオバオに集中している。では、こ...