Amazon が Oracle の代わりに Aurora を採用、プライムデーのプロモーション デーが麻痺状態に

Amazon が Oracle の代わりに Aurora を採用、プライムデーのプロモーション デーが麻痺状態に
  • 海外メディアCNBCが入手した内部文書によると、プライムデーのプロモーションが麻痺した主な原因は、アマゾンがオラクルのデータベースからAurora PostgreSQLに移行したことだった。
  • この障害は、Amazon が 2020 年までに Oracle データベースから完全に移行しようとする中で直面する可能性のある課題を浮き彫りにしている。
  • アマゾンとオラクルは近年、それぞれ自社のデータベースソフトウェアとクラウドツールの方が優れていると主張し、激しい論争を繰り広げている。

Amazon は現在、Oracle データベース ソフトウェアからの移行がいかに難しいかを知りつつあります。

[[247571]]

CNBCが入手した内部報告によると、プライムデーに、この家電量販店最大手は、売り上げを鈍化させた大規模なウェブサイト障害に対処していたほか、オハイオ州にある最大規模の倉庫の1つで数万個の荷物の出荷を遅らせる技術的問題にも取り組んでいた。

文書によると、この問題は主にアマゾンがOracleデータベースから自社のデータベース技術に移行したことが原因とされている。この障害は、Amazon が 2020 年までに Oracle データベースから完全に移行しようとする中で直面する可能性のある課題と、そのレベルの信頼性を取り戻すことがいかに難しいかを浮き彫りにしている。また、これは、オラクルのデータベースがアマゾンの同等のソフトウェアよりもいくつかの点で確かに効率的であることを示唆しており、オラクルは今週サンフランシスコで開催される年次オープンワールドカンファレンスでこの点を強調する可能性が高い。

プライムデーの障害後、アマゾンのエンジニアは25ページのレポートを作成したが、アマゾンはこれはエラーを修正するためのものだと述べた。 Amazon では、この標準プロセスを使用して、重大なインシデントが発生する理由を理解し、将来的に発生しないようにする方法を検討しています。

報道によると、Amazon はプライムデーの問題の根本原因の特定に苦労していたが、これはデータベースの移行後に機能が失われたことが原因だったという。文書によると、アマゾンは、新たにインストールされたAurora PostgreSQLと呼ばれるデータベースでエラーが発生した場合の緊急時対応計画も提供していなかった。

ある質問では、エンジニアはなぜアマゾンの倉庫データベースが「Oracle データベースが使用されていた前回のトラフィック急増時と同じ問題」を経験しなかったのかと尋ねられた。彼らは、「Oracle と Aurora PostgreSQL は 2 つの異なる [データベース] テクノロジーであり、セーブポイントの処理方法が異なります」と答えました。

セーブポイントは、個々のトランザクションを追跡および回復するために使用される重要なデータベース ツールです。報告書によれば、プライムデーには保存ポイントが多すぎるためにAmazonのAuroraソフトウェアが過負荷になり、データベース全体のパフォーマンスが低下したという。

いずれにせよそれは起こり得る

「アマゾンがオラクルを使い続けていたら、この障害はおそらく起きなかっただろう」と、CNBCが文書の詳細を明らかにした後、イリノイ大学アーバナ・シャンペーン校のコンピューターサイエンス教授マット・シーザー氏は語った。 「また、アマゾンがオラクルのデータベースを使用していれば、問題をより早く診断できた可能性があり、停止期間を短縮できたはずだ。」

アマゾンの広報担当者は電子メールでの声明で、データベースの「パフォーマンスの低下が遅延と深刻な停止を引き起こした」と内部文書に記載されているにもかかわらず、停止はなかったと述べ、問題を軽視した。

「倉庫に停電はなく、この問題により荷物の約1%の配送が短時間遅れただけだったことに留意することが重要です。この問題はすぐに特定され、解決されました」と広報担当者は述べた。

オハイオ州の倉庫は、プライムデーを前に Oracle データベースから移行した 13 の倉庫のうち最新のものとなった。文書によると、この倉庫はプライムデーのプロモーション期間中に1日あたり110万個以上の荷物を取り扱った。在庫および出荷データを処理するすべてのサービスとソフトウェアは、これらの倉庫内の Aurora データベースに移行されています。

報道によると、プライムデーには数時間にわたって障害が続き、1万5000個以上の荷物の配送が遅れ、人件費で推定9万ドルの損失が発生したという。この損害には、エンジニアがトラブルシューティングやバグの修正に費やした時間や、失われた可能性のある売上は含まれません。

報告書の「学んだ教訓」というセクションで、Amazon のエンジニアは「セーブポイントの動作は Aurora PostgreSQL では Oracle とは異なる」と記しており、Oracle のソフトウェアの方が問題をより効率的に処理することを示唆している。報告書ではまた、PostgreSQL には分析用の SQL 文データが存在しなかったと述べており、これが問題の根本原因を「特定するのに役立つはずだった」という。

アマゾンがもっと準備を整えていれば、障害はそれほど深刻ではなかったかもしれない。同社は文書のあるセクションで、「基盤となるPostgreSQLデータベースでパフォーマンスの問題が発生したときに回避策がなかった」ため、問題の「解決に長い時間がかかった」と述べている。この文書はまた、「完全な対応計画や運用マニュアル」があれば「より迅速に影響を排除する」ことができたはずだと主張している。

コロンビア大学のコンピューターサイエンス教授ヘニング・シュルツリン氏は、この文書を確認した後、「私の推測では、アマゾンはデータベースを変更しただけで、アマゾンプライムデーで発生した特定の負荷パターンをテストしていなかったため、驚いたのではないか」と述べた。

アマゾンはオラクルとより直接的に競合するためにソフトウェアの提供を拡大しており、近年両社は舌戦を繰り広げている。 CNBCは8月に、アマゾンが2020年初頭までにデータベース全体をOracleから移行する取り組みを進めていると報じた。

「本当に大変です」

オラクルの会長兼共同創業者のラリー・エリソン氏はアマゾンの主張を信じていない。エリソン氏は12月の同社の決算発表で、アマゾンは「オラクルから離れるつもりはない」と述べた。同氏は8月のイベントでも自身の見解を繰り返し、「アマゾンがそんなことをできるとは思わない」と述べた。

「アマゾンにはOracleから移行するための10年の猶予があるが、彼らはまだOracleを使っている」と彼は語った。 「彼らにとって、自社の技術を使うのは簡単なことではありません。コスト効率が悪いのです。本当に難しいのです。」

市場調査会社ムーア・インサイツ・アンド・ストラテジーの上級アナリスト、パトリック・ムーアヘッド氏は、この事件は、アマゾンの倉庫で使用されているような古いアプリケーションを、何十年にもわたって世界最大の企業と取引してきたオラクルから移行することがいかに難しいかを示していると述べた。

「AWS Auroraは将来を見据えたアプリケーション向けに設計されているが、Oracleはより伝統的なアプリケーション向けに設計されている」と同氏は語った。

論文: Amazon Aurora: 高スループットのクラウドネイティブリレーショナルデータベースの設計上の考慮事項

<<:  21Vianet Blue CloudはMicrosoftと提携し、クラウドパートナーを募集し、インテリジェントクラウドのローカルエコシステムを構築します。

>>:  メラノックスは2018年第1四半期から第3四半期にかけて210万枚以上のイーサネットカードを販売した。

推薦する

Kステーションの上位10の理由のまとめ

皆さんは、以前の百度Kステーション事件に深い印象を持っていると思いますよね?医療業界のサイト、タオバ...

ショッピングガイドウェブサイト、違いがなければ未来はない

最近、ショッピングガイドのウェブサイトについての議論が増えています。特に、TaobaoがMeilis...

速度が99%向上、Steinbeis Papierがインダストリー4.0プラットフォームをどのように導入しているかをご覧ください

「Rancher により、インテリジェント データ プラットフォームを極めて安定して実行し、新しいサ...

2022 年のクラウド ネイティブ セキュリティの開発に関する 24 の洞察

今日、クラウド ネイティブ テクノロジーは、企業に迅速な配信の利点をもたらすだけでなく、新たなセキュ...

TIC 2018では、独立系インターネット企業の発展の道筋について熱く議論され、独立性と制御性を備えた技術力が実証された。

「実は、インターネット分野に限らず、グローバルビジネスの歴史においても、基本的には巨大なエコシステム...

racknerd: 新年の特別オファー、米国 VPS (6 つのデータ センターが利用可能) が年間 9.89 ドルから

Racknerd は、年間支払いが 10 ドル未満の新年 VPS プロモーションを開始しました。 U...

alphavps-5 ユーロ/4g メモリ/4CPU/30gSSD/1T トラフィック/5 つのオプション コンピュータ ルーム

私は主に、ロンドン、ニューヨーク、ソフィア、ニュルンベルク、ロサンゼルスなど、複数のオプションのデー...

誤解されているWeChatの「ショッピングアカウント」

個人アカウント、パブリックアカウント、ビデオアカウントに続き、WeChatは新しいミニプログラム「シ...

クラウドコンピューティングの謎を解く

[[404031]]この記事はWeChatの公開アカウント「製品技術レッスン」から転載したもので、著...

子どもの視点から世界を見てみましょう!子ども向け製品ウェブサイトのユーザビリティ調査

ここ数年で子供向けの商品が急速に登場し、ますます人気が高まっています。 iResearchは、201...

エンタープライズ クラウドはどのように進化するのでしょうか?

Amazon Web Services (AWS) や Microsoft Azure などのパブリ...

新しいウェブマスターが SEO 凍結期間を乗り切り、外部リンクで経験を共有する方法

私は長年、自分のウェブサイトを構築してきました。多くの友人から、SEO でトラフィックを獲得するには...

「勝つ」という言葉から見る SEO の洞察

「勝つ」という言葉は、仕事や人生において私たちが最も見たい言葉です。誰もが自分自身の成功を達成する必...

ユーザーの注目を減らすための手順 eコマースアプリのデザインから学んだ9つの成功のヒント

【はじめに】 買い手であっても売り手であっても、最も重要な点は、製品設計によってまず行動を起こせるか...