クラウド コンピューティングの限界: エッジでの機械学習が必要な理由

クラウド コンピューティングの限界: エッジでの機械学習が必要な理由

機械学習には高い処理要件があり、通信コストがかかることから、最終的にはエッジ(スマートフォン)で動作させる必要があります。

[[275122]]

今日、人々は機械学習を技術の最前線に据え、人工知能 (AI) によって推進される技術革新の新しい時代を迎えています。今日でも、機械学習はあらゆるデバイスエクスペリエンスに不可欠なテクノロジーであり、幅広いタスク、機能、アプリケーションを推進しています。顔認証、顔認識、指紋認識などのデバイス上のセキュリティから、Socratic、Snapchat、FaceApp、Shazam などのアプリを通じてユーザーがよりスマートで楽しい体験をできるようにするスマートフォンのカメラ機能やオーディオ機能まで、さまざまな機械学習ベースの機能が消費者によく使用されています。

ただし、大量のデータを作成する機械学習ベースのタスクの場合、多くの場合、これらのデータは処理のためにクラウドに移動され、その後アクションとともにデバイスに送り返されます。たとえば、Socratic と Shazam はどちらも、デバイス上ではなくクラウドで機械学習処理を使用します。ここで疑問が浮かびます。デバイス上で機械学習処理を実行する方が簡単で高速ではないでしょうか?

機械学習ベースのタスクをクラウドに送信して処理するのではなく、デバイス上またはエッジで実行する機能は、多くの人から「機械学習の進化の次の段階」と評されています。電力消費、コスト、レイテンシ、プライバシーなど、クラウドとデバイス間で機械学習データを転送することを非現実的にする重要な制限が多数あります。機械学習は数年前には夢物語のように思われていましたが、デバイスの技術革新により、計算集約型のタスクを処理できるようになりました。

クラウドコンピューティングの制約

クラウドにおける機械学習処理のすべての制約は相互に関連しています。

まず、クラウドでの機械学習タスクに必要な膨大な量のデータを処理するためのパワーとコストは膨大であり、帯域幅要件の増加によって生成されるトラフィックも膨大であることは言うまでもありません。 2017年には、もし全員がAndroidの音声アシスタントを1日3分使用したら、Googleは所有するデータセンターの数を2倍にする必要があると指摘されました。

2019年に、Googleはこの特定の課題を解決した可能性があります。実際、最近のカンファレンスで、同社は500GBの音声アシストモデルを0.5GBに縮小し、完全にモバイルデバイスで実行できるようになったと述べました。しかし、これはクラウドでの機械学習が処理できる膨大なインフラストラクチャと経済的需要を示しています。エッジでの機械学習は、クラウド コンピューティング サービスへの依存を減らし、クラウドベースの機械学習に必要なインフラストラクチャをサポートすることで、これらの負担を軽減できます。

クラウドでの機械学習処理にかかる莫大な経済的コストは、おそらく開発者の経験を通じて最もよくわかるでしょう。各デバイスは、サーバー上での計算に 1 秒あたり約 0.00003 ドルかかります。これは明らかに非常に小さなコストですが、開発者が可能な限り幅広いユーザーにリーチすることを目指していることを考慮すると、コストはすぐに膨らみ始めます。たとえば、デバイスが 100 万台の場合、サーバー上で 1 秒間のコンピューティング コストは 28 ドル、つまり 1 分あたり 1,680 ドルになります。 1 億人のユーザーをターゲットとする非常に成功したアプリの場合、開発者は 1 分あたり 160 万ドルを支払うことになります。

結局のところ、機械学習ベースのタスクにクラウド コンピューティングを使用することは、まったく実現不可能です。たとえ短距離であっても、クラウドにデータを送信するには大量の電力が必要です。デバイス上での機械学習ベースの処理には、はるかに少ない電力しか必要ありません。

デバイスとクラウド間でデータを送受信すると、顕著な遅延や待ち時間が発生しますが、これはほとんどの機械学習ベースのアプリケーション、特に時間が重要となるアプリケーションでは許容できません。レイテンシを改善すると、機械学習ベースのアプリケーションが実現できる新しい機能が実現します。たとえば、機械学習処理をクラウドで実行した場合、拡張ビデオの送信、処理、受信に時間がかかるため、Snapchat AR エクスペリエンスは実現できません。

クラウドでの機械学習処理のレイテンシの問題は、プロセスを段階的に見ることで最もよく説明できます。現在の 4G ネットワークで一方向 (デバイスからクラウドへ) のデータ ストリーミングを開始すると、理論上の遅延は 50 ミリ秒になり、これは約 4 つのビデオ フレームの遅延に相当します。その後、クラウドで機械学習データを処理するために、ビデオ フレームが 16 ミリ秒遅延される可能性があります。最後に、クラウドからデバイスに戻るまでに 50 ミリ秒の遅延が発生します。その結果、プロセス全体で約 10 ビデオ フレームの遅延が発生し、デバイス上の機械学習による即時応答を提供する場合よりもレイテンシが大幅に高くなります。 5G テクノロジーは、導入時の遅延がわずか 1 ミリ秒であるため、この機器をエッジ処理に変更する可能性を秘めていますが、5G テクノロジーが広く使用されるようになるにはまだ時間がかかるでしょう。

最後に、クラウド コンピューティングとデバイス間の継続的な相互作用により、プライバシーの脅威に対してより脆弱なシナリオが生まれます。ユーザーは、個人データをクラウドに送信するのではなく、デバイス上でより簡単に処理できます。機械学習タスク用に生成されたデータが何百マイルも離れたクラウドに移動し、その後、決定が下されるデバイスに戻る場合、影響を受ける可能性が高くなります。基本的に、ユーザーのプライバシーに対する攻撃を防ぐ最善の方法は、機密データがデバイスから外部に漏れないようにすることです。

開発者はエッジでの機械学習を望んでいる

開発者のニーズは、エッジでの機械学習処理に最適です。機械学習は開発者がアルゴリズムを記述する方法を変えています。開発者は、機械学習を使用することで、時間がかかり、場合によってはエラーが発生しやすい特定のユースケースに合わせて手動でコードを記述する必要がなくなります。代わりに、彼らはモデルを作成し、データセットを使用してそれをトレーニングしました。これは、手動でコードを記述するよりも強力なアプローチです。

機械学習は開発者には長年知られていましたが、主にデータセンターの高性能コンピューティングデバイスで使用されてきました。最近まで、モバイル デバイスでは計算効率が向上し、より複雑な機械学習モデルを実行できるようになったため、モバイル デバイスでのみ使用されていました。最新のデバイス革新と開発者のニーズを組み合わせることで、機械学習が最優先の選択肢になります。デバイス上の機械学習処理により、開発者はリアルタイム処理と低遅延により即座に結果を得ることができ、ネットワーク接続なしで機械学習タスクを実行できるようになります。

クラウドコンピューティングの機械学習処理が適切な場合もある

課題はあるものの、データ処理のクラウド コンピューティング モデルでは、機械学習アルゴリズムを継続的に変更およびアップグレードできます。したがって、クラウド コンピューティングとやり取りするデバイスであれば、機械学習タスクの処理方法も改善できます。さらに、集中的な計算を必要とし、時間に敏感ではないタスクもいくつかあります。したがって、クラウド コンピューティングにおけるレイテンシは大きな問題ではありません。例としては、研究、産業、軍事、または患者の放射線学や X 線検査などの医療用画像処理に詳細な画像やビデオ フィードを提供するドローンからのデータ処理が挙げられます。エッジでの機械学習は依然として重要ですが、必ずしもすべての機械学習ベースのタスクに「万能」なソリューションであるとは限りません。機械学習処理に携わるすべてのチーム(開発者から OEM まで)は、デバイス上のどのタスクがエッジでの機械学習の恩恵を受けることができるかを判断する必要があります。

エッジでの機械学習は未来に必要

さまざまな機械学習ベースのタスクやアプリケーションを活用するモバイル デバイスは、すでに世界中で何十億人もの人々に使用されています。ほとんどの場合、デバイス上でのリアルタイムの応答が必要であり、これはエッジでの機械学習によって提供されます。ユーザーと開発者は、パワー、コスト、プライバシー、速度の制限があるため、クラウド コンピューティング テクノロジに依存したくありません。スマートデバイスはまだ初期段階ですが、機械学習は将来の開発にとって最良の選択肢となるでしょう。

<<:  クラウドなしで産業用IoTプロジェクトを構築する方法

>>:  Helm Charts クラウド ネイティブ アプリケーションのワンクリック インストール ガイド

推薦する

「インターネット思考」の火をつけたのは何でしょうか?

「インターネット思考」という言葉は、今日では非常に人気があり、インターネット思考に関係するものであれ...

サーバーホストはどうですか?アムステルダム無制限帯域幅 VPS レビュー

Serverhost は、オランダのアムステルダム データ センターで、1Gbps の帯域幅、無制限...

Kubernetes レプリケーション コントローラーの仕組み

[[436665]]レプリケーション コントローラーは、ポッドのライフサイクルを管理し、必要な数のポ...

KubeVela の基本: 知っておくべきことすべて

KubeVela は、ハイブリッド クラウド環境でのアプリケーション配信をよりシンプルかつ高速にする...

効率的な配信のためにプロモーション チャネルを選択するにはどうすればよいでしょうか?

トラフィックは、オンラインでもオフラインでも、すべてのビジネスの要です。トラフィックは無料でも有料で...

SD-WANはマルチクラウドの課題解決に役立ちます

SD-WAN がリモート ユーザーがクラウドベースのアプリケーションにアクセスするための主な方法にな...

2014 SEO 究極戦略対決

これまで、2014 年に SEO 最適化をどのように進めていくかという質問が、多くのウェブマスターの...

農夫泉ブランドコンテンツマーケティングの歴史

今号を皮切りに、私たちはすべてのマーケターの参考と学習のために、市場で記憶に残るブランドを継続的に研...

AMD、クラウドコンピューティングとハイパースケールデータセンター向けに設計されたOpteron 4000シリーズプラットフォームを発表

—コアあたりの消費電力が史上最低¹のサーバープロセッサーで、優れたコスト効率とプラットフォームの柔軟...

ウェブサイトのホームページに掲載されるために必ず行うべき3つのこと

少し前に、SEO Sky がウェブサイト最適化の目的を詳しく説明しました。簡単に言えば、ウェブサイト...

オートナビは、何千人もの将来の交通専門家を育成することを目標に、産業界、学界、研究機関の統合に取り組んでいます。

[51CTO.com からのオリジナル記事] 今日、都市の急速な発展は都市統治に大きな課題をもたらし...

Kafka のバイナリ検索アルゴリズムの改善

[[356205]]私は最近、Kafak のソース コードをいくつか研究し、Kafak の改良された...

この記事では、EV SSL 証明書の申請がどれほど難しいかを説明します。

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますインターネ...

エッジコンピューティングがモノのインターネットにもたらす革命的な影響

エッジ コンピューティングがモノのインターネットに与える影響を理解するために、私たちの周囲にある多数...

アプリストアプロモーションの新しいチャネル: モバイルビデオ広告

アプリのプロモーション チャネルが成熟するにつれて、CP とパブリッシャーは、従来の製品トラフィック...