12月7日、Amazon Cloud Service(AWS)が開催する年次イベント「AWS re:Invent」において、AWSはフルマネージド運用サービス「Amazon DevOps Guru」を発表した。このサービスは機械学習テクノロジーを使用して、運用上の問題を自動的に検出し、改善策を提案することで、開発者がアプリケーションの可用性を向上させるのに役立ちます。 Amazon DevOps Guru は、Amazon.com と AWS の運用の卓越性を長年にわたってサポートしてきた機械学習テクノロジーを適用します。アプリケーション メトリック、ログ、イベント、トレースなどのデータを自動的に収集して分析し、通常の動作パターンから逸脱した動作 (たとえば、コンピューティング パワー構成の不足、データベース I/O の過剰使用、メモリ リークなど) を識別します。 Amazon DevOps Guru は、サービスの中断を引き起こす可能性のある異常なアプリケーション動作 (レイテンシーの増加、エラー率、リソース制限など) を特定すると、開発者に問題の詳細 (関連するリソース、問題のタイムライン、関連イベントなど) を発行し、開発者が問題の潜在的な影響と考えられる原因を迅速に理解できるように支援し、Amazon Simple Notification Service (SNS) や Atlassian Opsgenie、PagerDuty などのパートナー統合サービスを通じて具体的な修復推奨事項を提供します。開発者は、Amazon DevOps Guru の修復推奨事項を使用して、手動セットアップや機械学習の専門知識がなくても、問題の修正時間を短縮し、アプリケーションの可用性と信頼性を向上させることができます。 Amazon DevOps Guru には初期費用や義務はなく、お客様は Amazon DevOps Guru が分析したデータに対してのみ支払います。 オンプレミス展開の制限から解放され、ビジネスオペレーションをグローバルに拡大するために、クラウドベースのアプリケーション展開とマイクロサービス アーキテクチャに目を向ける組織が増えており、顧客のニーズを満たすためにアプリケーションがますます分散化されるようになっています。開発者は、アプリケーションの可用性を維持し、運用上の問題の検出、デバッグ、解決に費やす時間と労力を削減するための、より自動化された方法を必要としています。誤ったコードや構成の変更、コンテナ クラスターの不均衡、CPU、メモリ、ディスクなどのリソースの枯渇などによるアプリケーションのダウンタイム イベントは、必然的に顧客エクスペリエンスの低下と収益の損失につながります。企業は、多くの場合個別に管理される複数の監視ツールを導入するために多額の費用と開発者の時間を費やしており、ロード バランサー エラーやアプリケーション要求レートの低下などの一般的な問題に対するカスタム アラートを開発して維持する必要があります。アプリケーション リソースの異常な状態を識別して警告するためにしきい値を設定する必要がある企業にとって、正確なしきい値を設定することは困難で、多くの手作業が必要であり、アプリケーションの使用状況の変化 (たとえば、ホリデー ショッピング シーズン中のリクエストの急増) に応じてしきい値を継続的に更新する必要があります。しきい値を高く設定しすぎると、運用パフォーマンスが著しく低下するまで開発者に警告が送信されません。しきい値が低すぎると、開発者は誤検知が多くなりすぎてアラートを無視してしまう可能性があります。開発者が潜在的な運用上の問題について警告を受けたとしても、根本的な原因を見つけて特定することは依然として困難な場合があります。既存のツールを使用すると、開発者はグラフやアラートから問題の根本原因を特定するのが困難な場合が多く、根本原因が見つかったとしても問題を解決できないことがよくあります。トラブルシューティングの各ステップはコールドスタートであり、チームは問題の特定に何時間または何日も費やす必要があります。これは時間がかかり、面倒な作業であり、運用上の問題を解決する時間が遅くなり、アプリケーションの停止が長引く可能性があります。 Amazon DevOps Guru の機械学習モデルは、Amazon.com 向けの高可用性アプリケーションの構築、拡張、保守で 20 年以上にわたって培われた Amazon の運用上の専門知識を活用しています。これにより、Amazon DevOps Guru は、開発者に機械学習の経験がなくても、運用上の障害 (アラートの見逃しや設定ミス、リソース枯渇の早期警告、ダウンタイムの原因となる設定変更など) を自動的に検出し、リソースや関連イベントに関するコンテキストを提供し、修復アクションを推奨できるようになります。開発者は、Amazon DevOps Guru コンソールで数回クリックするだけで、すべてのリソースのレイテンシー、エラー率、リクエスト率などのアプリケーションとインフラストラクチャの履歴メトリクスを自動的に抽出して分析し、運用ベースラインを確立できます。 Amazon DevOps Guru は、事前にトレーニングされた機械学習モデルを通じて、確立されたベースラインからの逸脱を識別できるようになります。 Amazon DevOps Guru は、システムとアプリケーションのデータを分析して異常を自動的に検出するとともに、そのデータを、異常メトリクス、時間の経過に伴うアプリケーションの動作の視覚化、修復アクションの推奨事項などの運用上の洞察にグループ化します。 Amazon DevOps Guru は、関連するアプリケーションとインフラストラクチャのメトリクス (Web アプリケーションのレイテンシーの急増、ディスク容量の不足、誤ったコードの展開、メモリリークなど) を相関させてグループ化し、冗長なアラートを減らして、ユーザーが重大度の高い問題に集中できるようにします。お客様は、Amazon DevOps Guru コンソールで設定変更履歴、デプロイメントイベント、システムおよびユーザーアクティビティを確認して、注意が必要な潜在的な運用上の問題の優先順位リストを生成できます。お客様が問題を迅速に解決できるように、Amazon DevOps Guru は修復手順を含むインテリジェントな推奨事項を提供し、AWS Systems Manager のランブックおよびコラボレーションツールと統合して、お客様がアプリケーションをより効率的に保守し、展開されたインフラストラクチャを管理できるようにします。 Amazon DevOps Guru は、コード品質を向上させ、アプリケーション内で最もコストのかかるコード行を特定するためのインテリジェントな推奨事項を提供する機械学習を活用した開発者ツールである Amazon CodeGuru と連携して、顧客が運用データに対して自動化された機械学習技術を使用できるようにし、開発者がアプリケーションの可用性と信頼性を簡単に向上できるように支援します。 「お客様は、Amazon.com での長年の運用経験から学んだ専門知識を応用してアプリケーションの可用性を向上できる分野で、AWS が引き続きサービスを追加してくれることを期待しています」と、AWS の Amazon Machine Learning 担当副社長である Swami Sivasubramanian 氏は述べています。 「Amazon DevOps Guru では、Amazon の過去の経験を活用して、お客様が運用上の問題を検出、トラブルシューティング、防止し、問題が発生したときにインテリジェントな推奨事項を提供するのに役立つ特殊な機械学習モデルを構築しました。これにより、お客様は Amazon.com の運用で Amazon が学んだ運用上のベストプラクティスをすぐに活用でき、複数の監視システムの設定と管理に費やす時間と労力を節約できます。」 AWS マネジメントコンソールで数回クリックするだけで、お客様は Amazon DevOps Guru を数分で使い始め、アカウントとアプリケーションのアクティビティを分析し、運用上の洞察を得ることができます。 Amazon DevOps Guru は、AWS CloudTrail、Amazon CloudWatch、AWS Config、AWS CloudFormation、AWS X-Ray などの複数のソースから関連データを集約し、顧客が単一のコンソールを通じて運用データを視覚化できるようにすることで、複数のツールを切り替える必要性を軽減します。お客様は、Amazon DevOps Guru コンソールで関連する運用イベントとデータを表示して、運用上の洞察を得たり、Amazon SNS を通じてアラートを受信したりすることもできます。さらに、Amazon DevOps Guru は AWS ソフトウェア開発キット (AWS SDK) を通じて API エンドポイントをサポートしているため、パートナーや顧客は Amazon DevOps Guru を既存のソリューションに簡単に統合して、トラブルチケットの送信、トリアージ、重大度の高い問題のエンジニアへの自動通知を行うことができます。 PagerDuty と Atlassian は、Amazon DevOps Guru を運用監視およびインシデント管理プラットフォームに統合しており、両社のソリューションを使用する顧客は、Amazon DevOps Guru が提供する運用上の洞察を活用できるようになりました。 Amazon DevOps Guru は現在、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)、アジア太平洋 (シンガポール)、欧州 (アイルランド) の各リージョンでプレビューされており、今後数か月以内に他のリージョンでも利用可能になる予定です。 170,000 社を超える企業が、チームワーク、組織、ディスカッション、仕事の遂行を簡素化するために Atlassian 製品を活用しています。 「アトラシアンは、より多くの開発チームがコードを展開し、サービスを運用できるよう支援するために、Amazon DevOps Guru のリリースで AWS と提携できることを誇りに思います」と、Opsgenie の製品責任者である Emel Dogrusoz 氏は述べています。 「Opsgenie および Jira Service Management と統合することで、Amazon DevOps Guru は潜在的な問題が予測されたり、インシデントが特定されたりしたときに、すぐにチームに通知できます。Amazon DevOps Guru は新しい洞察を提供し、Atlassian は最速の応答時間を保証します。」 PagerDuty株式会社(NYSE: PD) は、デジタル運用管理のリーダーです。 「PagerDutyでは、インシデント対応ライフサイクルを自動化することでDevOps文化への移行を推進することに注力しており、Amazon DevOps Guruとの統合を通じてDevOpsへの取り組みをさらに深めていくことに興奮しています」とPagerDutyの製品担当副社長、Jonathan Rende氏は述べています。 「Amazon の何十年にもわたる運用の卓越性と Amazon DevOps Guru の機械学習機能を活用することで、PagerDuty は両社のお客様にリアルタイムの信号応答機能をさらに提供します。Amazon DevOps Guru の Amazon SNS を PagerDuty に取り込むことで、AWS のお客様は運用上のインシデントがユーザーサービスの停止に影響を与える前に、リアルタイムで対応することができます。」 Thomson Reuters は世界で最も信頼されている情報とニュースのプロバイダーであり、専門家が自信を持って意思決定を行い、ビジネスをより効率的に運営できるよう支援しています。 「顧客体験は当社にとって最も重要です。可用性、パフォーマンス、変更要求に関する複数のアラートを調整することは、顧客に影響を与えるインシデントの防止と軽減を図る上で困難な場合があります」と、トムソン・ロイターのインフラストラクチャ ホスティング責任者であるスティーブ・ソーンズ氏は述べています。 「Amazon DevOps Guru を使用し、その機械学習の洞察を活用して、問題を迅速に解決し、顧客に影響を与えるインシデントを回避するための明確な道筋を提供できることを嬉しく思います。PagerDuty との統合により、Amazon DevOps Guru からの問題解決の推奨事項を適切なチームにタイムリーかつ効率的に提供できるようになります。」 SmugMug は、ユーザーが写真やビデオをアップロードできる有料の画像共有およびホスティング サービスとオンライン ビデオ プラットフォームです。同社は、アマチュアおよびプロの写真家向けに、デジタル化および印刷された作品の販売を促進しています。 「私のチームは常に手作業を自動化する方法を模索しています。Amazon DevOps Guru のおかげでそれが実現し、AIOps が日常的なタスクの多くを引き継いでくれるようになり、日々の業務が効率化されて IT イノベーションに集中できるようになりました」と、SmugMug のオペレーションディレクター、Andrew Shieh 氏は語ります。 「今では、ビジネス ニーズを満たすだけでなく、ビジネス上の期待を上回る成果を上げています。組織と顧客にとって価値を生み出すという最も重要なことに集中する時間が増えたからです。」 NextRoll は、マーケットプレイスやマーケティング プラットフォームがマーケティング ソリューションを構築および強化し、収益性を向上させるお手伝いをします。 「当社は何千もの Amazon Elastic Compute Cloud (Amazon EC2) インスタンスを運用しており、運用上の問題の解決にチームが費やす時間を短縮する方法を常に模索しています」と NextRoll の CTO である Valentino Volonghi 氏は述べています。 「Amazon DevOps Guru を使用し、その機械学習ベースの洞察を活用して運用上の問題を特定、関連付け、解決できることを嬉しく思います。これにより、チームは時間を節約し、平均復旧時間を短縮できます。」 |
<<: SaaS 企業はどこまで行けるでしょうか?主にこの2つの指標によって決まる
>>: BMW グループと AWS が協力し、自動車業界のデータ主導型イノベーションを推進
[[381965]]この記事はWeChatの公開アカウント「建築改善への道」から転載したもので、著者...
現在のインターネットでは、企業が自社のウェブサイトをうまく運営したい場合、強力な SEO なしではそ...
pesyun (Standard Interconnect) の 11.11 プロモーションでは、(...
マネージド サービス プロバイダー (MSP) は、新型コロナウイルス感染症のパンデミックにどのよう...
組織にとってより優れたマルチクラウド管理戦略には、ID 管理、データセンターの複数のクラウドへの関連...
5月9日、 WeChatはミニゲームインセンティブ動画広告が正式に一般公開され、広告主は新バージョン...
北京時間4月13日、海外メディアの報道によると、アマゾンはこのほど、「アマゾン ウェブ サービス」(...
budgetvm は、十分なトラフィックを備えた openvz ベースの SSD ハード ドライブ ...
ウェブサイトの最適化の過程で、誰もが Baidu ランキングの最適化に関する独自の経験を蓄積し、どの...
イノベーションは進歩を推進し、テクノロジーが急速に進化するにつれて、新しいトレンドが驚くべき方法で未...
[要約] Zhaopin.com は投資家に想像の余地を与えることができず、その将来の市場価値は暗く...
2017年11月10日、深センで「新郷国家自主革新実証区とファーウェイ・新郷クラウドコンピューティン...
キーワードランキングを向上させる場合、キーワードの外部リンクは非常に重要であり、検索エンジンがウェブ...
ライト、ライト、ライト!CEENとAdmin5 Webmaster Networkが共同で開催した「...
Swiftway は最終的に約束を守り、支払いが 1 ~ 2 か月前に行われたにもかかわらず、VPS...