2022 年に避けるべきクラウド コスト最適化の 6 つの間違いとその修正方法

2022 年に避けるべきクラウド コスト最適化の 6 つの間違いとその修正方法

翻訳者 |李睿

校正 |孫淑娟 梁策

企業や組織は毎年末に、事業規模の拡大やクラウドコストの削減など、翌年の発展に向けた計画を立てます。

クラウド コストの削減は、5 年連続で企業にとって最重要のビジネス運営イニシアチブとしてランク付けされています。調査機関が発表した2021年クラウド状況調査レポートによると、60%以上の企業がクラウドコストの最適化を計画しています。

では、何が問題なのでしょうか。また、なぜこれほど多くのエンジニアリング チームがクラウド コストの最適化に苦労しているのでしょうか。

以下では、クラウド コンピューティングのリソース、時間、およびコストの浪費につながる最も一般的な問題のいくつかを紹介し、効果的な解決策を見つけます。

クラウドコストの最適化がなぜ難しいのでしょうか?

パブリック クラウドの従量課金モデルにより、エンジニアリング チームにはより多くの自由が与えられますが、この自由には代償が伴います。 Pinterest などの企業のクラウド コンピューティングの請求額が示すように、これは驚異的なものになる可能性があります。

調査によると、ほとんどの企業は増大するクラウドコストへの対応に苦労しています。平均すると、パブリック クラウドの支出は予算を 24% 超過します。

クラウドの支出が予算を超える理由は多数あります。これらの問題は、多くの場合、低コストの可視性、複雑なクラウド価格設定、将来の需要を予測する際の問題に起因します。これらすべての問題は、企業の予算と支出に悪影響を及ぼす可能性があります。

クラウド コンピューティング サービスを導入しても、企業のコスト削減に完全に役立つわけではなく、クラウド コストの請求額が高額になると気が遠くなることがあります。

2022 年に企業が解決すべき 6 つのクラウド コスト最適化の問題

1. 貯蓄プランにまだ誘惑されている

クラウド コンピューティング サービスにかかる費用を節約することを考えたとき、まず思い浮かぶのは、使用するクラウド コンピューティング サービスにかかる費用を抑えることです。企業は、オンデマンド価格モデルと比較して大幅な割引を受けることができるため、予約プランまたはセーバープランを選択します。そして、一見予測可能なクラウド支出のための準備金を別に設けることは理にかなっているように思えます。

しかし、よく見てみると、会社は問題を解決したのではなく、コストの割引を得ただけであることがわかります。

(1)それでは何が問題なのでしょうか?

Pinterest が Amazon AWS クラウド コンピューティング サービスに事前に 1 億 7000 万ドルを投資したが、その後、追加のリソースを購入するためにさらに 2000 万ドルを費やす必要があったことを覚えている人がいるかどうかはわかりません。

この会社の事例は、今後 1 ~ 3 年でどれだけの容量が必要になるかを知るのは非常に難しいという事実を例証するのに役立ちます。

企業が長期間にわたって単一のサプライヤーを選択した場合、ビジネスの柔軟性が失われ、常に変化するニーズに高い代償を払わなければならなくなる可能性があります。

(2)節約プランはどうですか?

最善の解決策は、このアプローチをまったく使用しないことです。リソースを前もって購入するのではなく、次のようなクラウド コンピューティング費用に対処する方法を検討してください。

  • スケールを調整する
  • 自動スケーリング
  • パック
  • リソーススケジューリング

2. 過剰プロビジョニングの罠に陥る

オーバープロビジョニングは、エンタープライズ チームがワークロードの実行に実際に必要なリソースよりも多くのリソースを選択した場合に発生します。これは通常、アプリケーションが中断されることを誰も望んでいないため、問題が発生する前に防止したいという願望によって動機付けられます。

一部のビジネス環境では、チームが「万が一に備えて」作業負荷に必要な量よりも多くのリソースを取得するのが慣例となっています。このアプローチは、パフォーマンスの向上という点ではエンジニアにとって理にかなっています。しかし、クラウド コンピューティングの無駄とコストの増加につながります。

(1)過剰プロビジョニングの問題点は何ですか?

簡単に言えば、クラウド コンピューティングの無駄と、不必要で制御不能になる可能性のある支出につながります。

長期的に見て、チームが過剰プロビジョニングの習慣を身につけるのは良いことではありません。安全のためだけに、ワークロードに必要なサイズよりも大きいインスタンスを選択する習慣がある場合、ビジネスとアプリケーションの規模が拡大するにつれてこのアプローチは維持できなくなり、高額な請求に直面することになります。

このお金をもっと大切なことに使ったほうが良いのではないでしょうか?例えば、気候危機の解決に投資するなどでしょうか?過剰配分は実は気候危機を助長している。

(2)過剰プロビジョニングにどう対処するか?

一般的なアプローチは、カスタム監視およびコスト管理ソリューションに投資することです。サイズ設定の推奨事項は、企業が過剰にプロビジョニングされたリソースへの依存を減らすのに役立ちますが、手動での実行は依然として必要です。

もう 1 つの解決策は、自動化ソリューションを採用することです。自動スケーリングにより、コストを削減しながらアプリケーション要件を満たす最適なインスタンス タイプとサイズが選択されます。

クラスターに追加のノードが必要になるたびに、AI 駆動型のインスタンス選択アルゴリズムが最高のパフォーマンスを実現するリソースを選択します。さらに良いことに、すべてが自動的に行われるため、チームは何もする必要がありません。

過剰プロビジョニングは多くの組織の文化に根付いているため、パフォーマンス、信頼性、コストのバランスをとるコスト最適化ルーチンを確立することが不可欠です。自動化は、より広範な企業変革への道における重要な一歩となり得ます。

3. クラウドコンピューティングリソースの分離による問題

プロジェクトのインスタンスを開始した後、それを閉じるのを忘れてしまうことはよくあります。その結果、多くのチームは、所有権がないのにコストが発生し続ける孤立したインスタンスに苦労しています。

予定外の Azure クラウド プラットフォーム料金として 1 日あたり 8 万ドルを請求された Adob​​e の失態を覚えていますか?これは企業が絶対に避けたい問題です。

この問題は、多くの取り組みが同時に実行され、リソースの可視性が一元化されていない大企業では特に深刻です。

IT 部門の外部で、IT 部門の承認なしに管理される取り組み (シャドー IT) は、企業の IT 支出全体の最大 40% を占める可能性があります。さらに、調査によると、シャドー クラウドの使用量は、既知のクラウド サービスの使用量の 10 倍になる可能性があることがわかりました。

(1)分離されたクラウドコンピューティングリソースの問題点は何ですか?

分離されたクラウド コンピューティング リソースは、持続可能性に複雑な影響を与える財務上の損失となります。

つまり、データセンターは大量のハードウェアを使用し、大量の電力を消費するため、情報通信技術業界全体の二酸化炭素排出量が大幅に増加します。必要なエネルギーは 4 年ごとに倍増し、AWS や Azure などのクラウド コンピューティング プロバイダーによって開設される新しいリージョンも問題に拍車をかけています。

そのため、クラウド コンピューティングの無駄を削減することが、不必要な支出とそれに伴う二酸化炭素排出量を削減する鍵となります。

(2)この課題にどう対処するか?

本当に必要なリソースだけが稼働していることを保証することは、特に大企業では困難な場合があります。しかし、使用されていないインスタンスをどのように識別して廃止するのでしょうか?ここで再び自動化が役立ちます。

自動化されたクラウド最適化ソリューションは、クラウドの使用状況を継続的にスキャンし、非効率性を特定し、可能な限りリソースの使用を削減できます。これらのソリューションは、未使用のインスタンスやプロセスをシャットダウンして、企業のクラウド コストを削減することもできます。

4. 非効率な管理ニーズの減少と急増

電子商取引のインフラストラクチャを構築するエンジニアは、変化のペースをよく認識しています。たとえば、1 人のインフルエンサーが一夜にして数百万ドルの売上をもたらしたり、トラフィックの急増により Web サイトがクラッシュしたりすることがあります。

他のほとんどのアプリケーションの使用法は時間の経過とともに変化しますが、コストとパフォーマンスのバランスをとることは継続的な課題であり続けます。

(1)何が問題なのですか?

タブを開いたままにしておくと、トラフィックの急増により予期しない大きなクラウド料金が発生したり、リソースが極端に制限されている場合にアプリケーションがクラッシュしたりする可能性があります。

需要が低い場合、企業は高額なコストを支払うリスクを負います。需要が高い場合、企業が顧客に提供するサービスの品質が低下する可能性があります。

企業はクラウド コスト管理ソリューションを使用して使用状況を監視し、設定されたレベルを超えた場合や異常が発生した場合にリアルタイムでアラートを受け取ることができます。このようなツールは、企業が現在のニーズに応じてクラウド リソースを調整するのに役立つ有用な推奨事項を企業に提供できます。

ただし、クラウド容量を手動で拡張するのは困難で時間がかかります。

システム内で発生するすべての事象を追跡することに加えて、組織では多くの場合、次の事項も追跡する必要があります。

  • トラフィックの急増と減少をスムーズに処理し、使用するすべてのサービスにわたって各 VM のリソースをスケールアップおよびスケールダウンします。
  • 1 つのワークロードに適用された変更が他のワークロードに問題が発生しないことを確認します。
  • リソース グループを自分で構成および管理し、ワークロードに適切なリソースが含まれるようにします。

(2)この問題をどう解決するか?

これは、クラウド コンピューティングの自動化が役立つもう 1 つの領域であり、企業が多くの時間とコストを節約するのに役立ちます。自動スケーリングは、上記のすべてのタスクを自動的に処理し、クラウド コストを管理します。組織でコンテナ オーケストレーター Kubernetes を使用している場合は、3 つの組み込みメカニズムのメリットを享受できます。

  • Horizo​​ntal Pod Auto-Scaler (HPA) は、アプリケーションの使用状況の変化に合わせてポッドのレプリカを追加または削除します。アプリケーションを監視して、レプリカの数を変更する必要があるかどうかを確認し、レプリカを削除または追加すると現在の値が目標に近づくかどうかを計算します。
  • Vertical Pod Auto-Scaler (VPA) は、CPU およびメモリ リソース要求を増減して、企業に割り当てられたクラスター リソースを実際の使用状況に合わせて調整します。
  • Cluster Auto-Scaler は、サポートされているプラ​​ットフォーム上のクラスター内のノードの数を変更します。ノードのポッドをクラスター内の他のノードに再スケジュールできることが判明した場合、それらのポッドを削除し、スタンバイ ノードを削除します。

多くのソリューションでは、企業は水平自動スケーリング ポリシーと垂直自動スケーリング ポリシーを定義するだけでよく、残りの作業は自律最適化ツールが処理します。

5. プリエンプティブ(スポット)インスタンスを活用していない

クラウド コンピューティング サービス プロバイダーは、未使用の容量を、特に通常のオンデマンド見積もりの​​コストと比較すると、より低価格で販売します。

AWS クラウド プラットフォームでは、プリエンプティブ インスタンスは最大 90% の割引を受けることができます。

(1)プリエンプティブインスタンスの難しさは何ですか?

企業が余剰のコンピューティング リソースに入札する際、その容量がどれだけ長く利用可能であるかはわかりません。一部のプリエンプティブインスタンスにはプロビジョニングされた期間があります。たとえば、AWS では、企業向けに最大 6 時間の稼働時間を保証するタイプを提供しています。

しかし、それだけでなく、プロバイダーは、企業が使用しているプリエンプティブインスタンスを回収し、30 秒から 2 分以内に通知することができます。

しかし、人間はそのような短い時間では反応できません。新しい VM の作成にもこれよりも時間がかかるため、ダウンタイムが発生するリスクがあります。

そのため、プリエンプティブルインスタンスを使用することに決めた場合は、停止が発生することを受け入れる必要があります。クリティカルなワークロードや許容されないワークロードの場合、これらは明らかに適切な選択ではありません。

(2)この課題にどう対処するか?

リスクはあるものの、プリエンプティブ インスタンスは、ステートレスで水平方向にスケーリングできる (つまり、複数のレプリカを持つ) サービスに適しています。幸いなことに、Kubernetes はこのタイプのセットアップ用に設計されているため、最新のアーキテクチャのほとんどのサービスはステートレスです。

プリエンプティブインスタンスを使用するプロセスは次のとおりです。

①ワークロードと割り込み処理能力を決定する必要があります。

②ベンダーが提供するインスタンスを確認し、ニーズに最適なものを選択します。経験則としては、あまり人気のないインスタンスを選択し、中断される頻度を確認することです。

③価格が上昇した際に中断が発生しないように、この時点で戦略的に最高入札額を設定します。

企業では、プリエンプティブ インスタンスをグループで管理し、複数のタイプをリクエストして取得の可能性を高めることも検討できます。

企業はこれらの手順を手動で完了できますが、すべてを機能させるには、多くの構成、セットアップ、およびメンテナンス タスクを準備する必要があります。

ここでも自動化が役立ちます。上記のプロセスに加えて、企業が必要とするプリエンプティブ インスタンスが一時的に利用できなくなった場合、自動化されたソリューションが即座に支援を提供できます。

6. レイテンシの自動クラウド最適化を使用する

この記事で自動クラウド最適化について言及しているのには理由があります。

組織がすでにクラウド ネイティブ テクノロジーを採用し、Kubernetes を実行し、最新の DevOps メソッドも使用している場合は、インフラストラクチャのこの部分を自動化することが間違いなく良いアイデアです。

Deloitte は、クラウド自動化を 2021 年以降の主要トレンドの 1 つに挙げており、特に大規模なエンタープライズ環境では、IT チームに具体的な成果をもたらします。

まず、仮想マシンの構成、クラスターの作成、適切なリソースの選択など、企業が行う必要のある手作業が削減されます。この変更により時間が節約され、企業のエンジニアはより重要なタスクに集中し、革新を起こしてクラウド コンピューティング インフラストラクチャを最大限に活用できるようになります。

さらに重要なのは、自動化ツールによって更新の頻度を高めることができることです。これは、継続的デプロイメントの理念にとって重要です。また、人為的エラーの可能性を減らし、インフラストラクチャの運用コストを削減し、システムのセキュリティと回復力を向上させ、バックアップ プロセスを強化します。

最後に、自動化により、企業は、そうでなければ制御が難しい使用中のリソースを可視化できるようになります。

つまり、クラウド コンピューティングの自動化は、テクノロジー業界の新たな標準となっているのです。

(1)クラウドコンピューティングの自動化を遅らせることで生じる問題点は何でしょうか?

クラウド自動化の疑いのない利点と圧倒的な勢いを考えると、なぜ企業はそれを実行しないのでしょうか?

自動化には、新しいソリューションに対する抵抗、実装にかかるコストが高すぎることへの懸念、既存のプロセスを更新する必要性など、多くの課題が伴う可能性があります。

ほとんどのデジタル変革プロジェクトと同様に、成功の鍵は人にあり、企業は人的レベルでの変化を促進する必要があります。また、仕事に関して言えば、マッキンゼー・アンド・カンパニーの調査によると、従業員は一般的にテクノロジーに取って代わられることを懸念していることが明らかになっています。

しかし、自動化のメリットはリスクをはるかに上回ります。たとえば、2021 年の DevOps の現状に関する調査レポートでは、回答者の 97% が自動化によって仕事の質が向上すると考えています。

2022 年にクラウド自動化を遅らせると、次のメリットを逃すことになります。

  • アプリケーションに最も効率的なインスタンス タイプとサイズを選択します。
  • 需要の急増や急減に対応するためにクラウド リソースを自動的に拡張します。
  • 未使用のリソースを排除してコストを削減します。
  • 潜在的な中断を管理してプリエンプティブインスタンスを最適化します。
  • ストレージ、バックアップ、セキュリティ、構成変更などの他の領域での不要な経費をすべてリアルタイムで、企業が手動で実装する場合のコストのほんの一部で削減します。

(2)この課題をどう解決するか?

変化や新しい解決策に対する人々の抵抗を克服することは古くからある問題です。自動化されたクラウド最適化により、チームは反復的なタスクの負担から解放されますが、チームにこれを単に伝えるだけでは十分ではない可能性があります。したがって、2022 年にはより多くの企業が自動クラウド最適化を採用し、そのメリットを享受することを期待しています。

原題: 2022 年に避けるべき 6 つのクラウド コスト最適化の問題とその対処方法、著者: Laurent Gil

<<:  2022 年に注目すべき 5 つのクラウド ネイティブ トレンド

>>:  クラウドネイティブインフラストラクチャを効果的に監視するには、次の7つの手順を実行する必要があります。

推薦する

ChatGPTの人気に刺激され、NVIDIAは生成AIとスーパーコンピューティングクラウドサービスを開始

GPU メーカーの Nvidia は、顧客がクラウド内の DGX AI スーパーコンピューターにアク...

ユーザーの真のニーズをどうやって見つけ出すのでしょうか? 3つのアイデアがあります

月給5,000~50,000のこれらのプロジェクトはあなたの将来です相当のスキルがない限り、本格的な...

周紅毅:優秀なプロダクトマネージャーになるにはどうすればいいでしょうか?

今日、ユーザー エクスペリエンスという用語は、企業全体の研究開発、プロモーション、マーケティング業務...

atcloud: 480G 超高防御 VPS 月額 4 ドルから、米国/シンガポールに 6 つのデータセンター、512m メモリ/1 コア/500g ハードディスク/無制限トラフィック

atcloudは、主に従来のクラウド(VPS)とストレージ(大容量ハードディスクストレージ)シリーズ...

モバイル ウェブサイト デザイン ホワイト ペーパー: ユーザーのニーズを深く理解する

モバイル ウェブサイトがますます悲惨なものになってきていると感じますか? 現在、モバイル ウェブ ペ...

検索エンジンマーケティングの有効性分析を改善するために内部と外部の側面を最適化する方法

多くの人は、検索エンジンマーケティングを検索ランキングと同一視し、ウェブサイトのランキングが上がれば...

WeChatマーケティング:パーソナルブランドマーケティング時代の到来

テンセントのWeChatは今やどこにでもあります。バスや地下鉄では、多くの人がモーメントを閲覧してい...

WeChatプロモーションスキル | WeChatパブリックアカウントを運用するための実践的な戦略!

見出しの頭痛、いつまでたってもうまくいかない話題、次から次へと流れていくホットな話題、人気記事の閲覧...

GoogleのウェブサイトコンソールとYoudaoを使用してアンカーリンクを確認する

SEO 業界では、外部リンクが大きな焦点となっています。この分野の初心者は、外部リンクの専門家や W...

プライベートドメイントラフィック用の 6 つのチャネル!

多くの人は、プライベートドメインのトラフィックを生成する方法、トラフィックを迂回する方法、およびその...

コスト効率を高めるために Hyper-V の電源管理を制御する

電力は、データセンターを運用する上で最も大きな継続コストの 1 つです。 Data Center K...

ウェブサイトの重量を総合的に改善するには何をする必要がありますか?

このウェブサイトは複合体であると言えます。これには、ウェブサイトのトラフィック、ウェブサイトのコンバ...

記事が含まれていないか、タイトルの類似性に関連していない

私のフレンドリーリンク欄に北京の SEO があります。このブログといえば、私の 2 番目のフレンドリ...

あなたのウェブサイトの検索エンジンランキングが下がるのはなぜですか?

検索エンジンのアルゴリズムが変更または強化されると、一部のウェブサイトの特定のキーワードのランキング...

絶対に失敗しないSEO最適化戦略の2番目のポイントは、98%の人が無視している

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスCen Huiyu は ...