Amazon が Oracle の代わりに Aurora を採用、プライムデーのプロモーション デーが麻痺状態に

Amazon が Oracle の代わりに Aurora を採用、プライムデーのプロモーション デーが麻痺状態に
  • 海外メディアCNBCが入手した内部文書によると、プライムデーのプロモーションが麻痺した主な原因は、アマゾンがオラクルのデータベースからAurora PostgreSQLに移行したことだった。
  • この障害は、Amazon が 2020 年までに Oracle データベースから完全に移行しようとする中で直面する可能性のある課題を浮き彫りにしている。
  • アマゾンとオラクルは近年、それぞれ自社のデータベースソフトウェアとクラウドツールの方が優れていると主張し、激しい論争を繰り広げている。

Amazon は現在、Oracle データベース ソフトウェアからの移行がいかに難しいかを知りつつあります。

[[247571]]

CNBCが入手した内部報告によると、プライムデーに、この家電量販店最大手は、売り上げを鈍化させた大規模なウェブサイト障害に対処していたほか、オハイオ州にある最大規模の倉庫の1つで数万個の荷物の出荷を遅らせる技術的問題にも取り組んでいた。

文書によると、この問題は主にアマゾンがOracleデータベースから自社のデータベース技術に移行したことが原因とされている。この障害は、Amazon が 2020 年までに Oracle データベースから完全に移行しようとする中で直面する可能性のある課題と、そのレベルの信頼性を取り戻すことがいかに難しいかを浮き彫りにしている。また、これは、オラクルのデータベースがアマゾンの同等のソフトウェアよりもいくつかの点で確かに効率的であることを示唆しており、オラクルは今週サンフランシスコで開催される年次オープンワールドカンファレンスでこの点を強調する可能性が高い。

プライムデーの障害後、アマゾンのエンジニアは25ページのレポートを作成したが、アマゾンはこれはエラーを修正するためのものだと述べた。 Amazon では、この標準プロセスを使用して、重大なインシデントが発生する理由を理解し、将来的に発生しないようにする方法を検討しています。

報道によると、Amazon はプライムデーの問題の根本原因の特定に苦労していたが、これはデータベースの移行後に機能が失われたことが原因だったという。文書によると、アマゾンは、新たにインストールされたAurora PostgreSQLと呼ばれるデータベースでエラーが発生した場合の緊急時対応計画も提供していなかった。

ある質問では、エンジニアはなぜアマゾンの倉庫データベースが「Oracle データベースが使用されていた前回のトラフィック急増時と同じ問題」を経験しなかったのかと尋ねられた。彼らは、「Oracle と Aurora PostgreSQL は 2 つの異なる [データベース] テクノロジーであり、セーブポイントの処理方法が異なります」と答えました。

セーブポイントは、個々のトランザクションを追跡および回復するために使用される重要なデータベース ツールです。報告書によれば、プライムデーには保存ポイントが多すぎるためにAmazonのAuroraソフトウェアが過負荷になり、データベース全体のパフォーマンスが低下したという。

いずれにせよそれは起こり得る

「アマゾンがオラクルを使い続けていたら、この障害はおそらく起きなかっただろう」と、CNBCが文書の詳細を明らかにした後、イリノイ大学アーバナ・シャンペーン校のコンピューターサイエンス教授マット・シーザー氏は語った。 「また、アマゾンがオラクルのデータベースを使用していれば、問題をより早く診断できた可能性があり、停止期間を短縮できたはずだ。」

アマゾンの広報担当者は電子メールでの声明で、データベースの「パフォーマンスの低下が遅延と深刻な停止を引き起こした」と内部文書に記載されているにもかかわらず、停止はなかったと述べ、問題を軽視した。

「倉庫に停電はなく、この問題により荷物の約1%の配送が短時間遅れただけだったことに留意することが重要です。この問題はすぐに特定され、解決されました」と広報担当者は述べた。

オハイオ州の倉庫は、プライムデーを前に Oracle データベースから移行した 13 の倉庫のうち最新のものとなった。文書によると、この倉庫はプライムデーのプロモーション期間中に1日あたり110万個以上の荷物を取り扱った。在庫および出荷データを処理するすべてのサービスとソフトウェアは、これらの倉庫内の Aurora データベースに移行されています。

報道によると、プライムデーには数時間にわたって障害が続き、1万5000個以上の荷物の配送が遅れ、人件費で推定9万ドルの損失が発生したという。この損害には、エンジニアがトラブルシューティングやバグの修正に費やした時間や、失われた可能性のある売上は含まれません。

報告書の「学んだ教訓」というセクションで、Amazon のエンジニアは「セーブポイントの動作は Aurora PostgreSQL では Oracle とは異なる」と記しており、Oracle のソフトウェアの方が問題をより効率的に処理することを示唆している。報告書ではまた、PostgreSQL には分析用の SQL 文データが存在しなかったと述べており、これが問題の根本原因を「特定するのに役立つはずだった」という。

アマゾンがもっと準備を整えていれば、障害はそれほど深刻ではなかったかもしれない。同社は文書のあるセクションで、「基盤となるPostgreSQLデータベースでパフォーマンスの問題が発生したときに回避策がなかった」ため、問題の「解決に長い時間がかかった」と述べている。この文書はまた、「完全な対応計画や運用マニュアル」があれば「より迅速に影響を排除する」ことができたはずだと主張している。

コロンビア大学のコンピューターサイエンス教授ヘニング・シュルツリン氏は、この文書を確認した後、「私の推測では、アマゾンはデータベースを変更しただけで、アマゾンプライムデーで発生した特定の負荷パターンをテストしていなかったため、驚いたのではないか」と述べた。

アマゾンはオラクルとより直接的に競合するためにソフトウェアの提供を拡大しており、近年両社は舌戦を繰り広げている。 CNBCは8月に、アマゾンが2020年初頭までにデータベース全体をOracleから移行する取り組みを進めていると報じた。

「本当に大変です」

オラクルの会長兼共同創業者のラリー・エリソン氏はアマゾンの主張を信じていない。エリソン氏は12月の同社の決算発表で、アマゾンは「オラクルから離れるつもりはない」と述べた。同氏は8月のイベントでも自身の見解を繰り返し、「アマゾンがそんなことをできるとは思わない」と述べた。

「アマゾンにはOracleから移行するための10年の猶予があるが、彼らはまだOracleを使っている」と彼は語った。 「彼らにとって、自社の技術を使うのは簡単なことではありません。コスト効率が悪いのです。本当に難しいのです。」

市場調査会社ムーア・インサイツ・アンド・ストラテジーの上級アナリスト、パトリック・ムーアヘッド氏は、この事件は、アマゾンの倉庫で使用されているような古いアプリケーションを、何十年にもわたって世界最大の企業と取引してきたオラクルから移行することがいかに難しいかを示していると述べた。

「AWS Auroraは将来を見据えたアプリケーション向けに設計されているが、Oracleはより伝統的なアプリケーション向けに設計されている」と同氏は語った。

論文: Amazon Aurora: 高スループットのクラウドネイティブリレーショナルデータベースの設計上の考慮事項

<<:  21Vianet Blue CloudはMicrosoftと提携し、クラウドパートナーを募集し、インテリジェントクラウドのローカルエコシステムを構築します。

>>:  メラノックスは2018年第1四半期から第3四半期にかけて210万枚以上のイーサネットカードを販売した。

推薦する

WLS - $5/Windows/2CPU/1g メモリ/40g ハードディスク/1T トラフィック/ロサンゼルス

weloveservers からプロモーション メールを送信しました: KVM ベースの Windo...

host1plus-$3.75/768m メモリ/30G ハードディスク/1T トラフィック/5 コンピュータ ルーム (オプション)

英国を拠点とする host1plus は現在、VPS を 25% 割引しています。最初の 25% 割...

WeiboとWeChatのどちらのマーケティング価値が高いでしょうか?

WeiboとWeChatを比較すると、どちらの方がマーケティング価値があるのでしょうか?これは多くの...

7年間の努力を経て、QingCloudは汎用クラウドコンピューティングに取り組んでいます

[51CTO.com からのオリジナル記事] 情報と生活のデジタル化に続き、産業のデジタル化の時代が...

buyvm: 500g 高防御 + cn2 gia + 無制限トラフィック、月額 10 ドルから / Alipay + Windows

当時、サンノゼの EGI コンピュータ ルームでサーバーがホストされていた BuyVM は非常に人気...

オンライン収益プロジェクト:これは別の小さなプロジェクトです。遊び方がわからないとは言わないでください

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています若者よ、ま...

Baiduの検索結果は画像とテキストの組み合わせに重点を置く

今日、Lu Songsong さんのブログで、自分のサイトのインクルード数が記録を更新したと書いてあ...

プライベートクラウドには明確な「価値提案」が必要です

現在、貿易摩擦が未解決であるにもかかわらず、大企業はデジタルビジネス変革をサポートするために新しいテ...

エンタープライズウェブサイトSEO最適化計画、ステップバイステップで目標を達成するのはとても簡単です

優れた企業ウェブサイトの最適化は、企業にどのようなメリットをもたらすのでしょうか? 企業イメージの確...

ユーザーレベルを過大評価してはいけない。コンテンツシステム構築の80/20ルール

2 週間前、A5 フォーラムで外部リンクの構築に関する専門家の投稿を見ました。質問の多くは、「外部リ...

推奨: fliphost - $2.62/256M メモリ/100g ハードディスク/100m 無制限/ストレージ VPS

Fliphostは設立されてまだ1、2日しか経っていない。さらにQuery Foundry Info...

タオバオ特別価格版について語る1万語の長文記事!

2018年3月26日、 Taobao特別価格版アプリが正式にリリースされました。多くの人が疑問に思う...

1 つの記事で Yandex SEO を理解する: ロシアの対外貿易はここから始まります

画像出典: Tuchong Creative Yandex はロシアで最も広く使用されている検索エン...