Alluxio データ オーケストレーション プラットフォームがハイブリッドおよびマルチクラウド上の AI および機械学習ワークロードのサポートをさらに拡大

Alluxio データ オーケストレーション プラットフォームがハイブリッドおよびマルチクラウド上の AI および機械学習ワークロードのサポートをさらに拡大

本日、世界初のオープンソース データ オーケストレーション ソフトウェアの開発者である Alluxio は、データ オーケストレーション プラットフォームのバージョン 2.7 の正式リリースを発表しました。このバージョンはすぐにご利用いただけます。バージョン 2.7 では、並列データ読み込み、データ前処理、トレーニング ワークフローにより、機械学習 (ML) トレーニングの I/O 効率が 8 ~ 12 倍向上し、コストを大幅に削減できます。新バージョンでは、パフォーマンス分析が強化され、Apache Hudi や Iceberg などのオープン テーブル形式のサポートも強化されているため、データ レイクへのアクセスの拡張が容易になり、Presto や Spark を使用した分析が高速化されます。

「Alluxio 2.7は、クラウド上の人工知能(AI)、機械学習、ディープラーニングにおけるAlluxioの地位をさらに強固なものにします」と、Alluxioの創設者兼CEOであるHaoyuan Li氏は述べています。 「データセットの増加とCPUおよびGPUの計算能力の向上により、機械学習とディープラーニングがAI技術の主流となりました。これらの技術の台頭はAIの発展を促進しましたが、データやストレージシステムへのアクセスにおけるいくつかの課題も浮き彫りにしました。」

「当社は、ゲーム AI プラットフォームでのモデル トレーニングのデータ前処理を高速化するために、1,000 ノードのクラスターに Alluxio を導入しました。Alluxio は安定性、拡張性、管理の容易さが実証されています」と、テンセントのビッグ データ プラットフォームの研究開発責任者である Chen Peng 氏は述べています。 「ますます多くのビッグデータと AI アプリケーションがコンテナ化されるにつれて、Alluxio はデータ分析とモデルトレーニングを加速する中間層として大企業や機関の第一の選択肢になりつつあります。」

「大規模な分析と AI/ML コンピューティング フレームワークを備えたデータ チームは、安定したパフォーマンスを確保しながら増大するデータ ソースへのアクセス性を高めるというプレッシャーにさらされており、そのためにはデータの局所性、ネットワーク I/O、コストの問題を考慮する必要があります」と ESG のアナリスト、マイク レオーネ氏は述べています。 「企業や組織は、コストのかかるアプリケーションの変更や新たなパフォーマンスの問題への対処を避けながら、クラウド オブジェクト ストレージなどのより手頃でスケーラブルなストレージを導入したいと考えています。Alluxio は、特にハイブリッドおよびマルチクラウド環境において、ストレージの詳細を抽象化し、データをコンピューティングに近づけることで、これらの課題に対処します。」

Alluxio 2.7 では次の機能が追加されました。

Alluxio と NVIDIA の DALI を使用した機械学習トレーニング

NVIDIA のデータ ローディング ライブラリ (DALI) は、CPU と GPU を介したデータのロードと前処理をサポートし、ディープラーニングを高速化する人気の Python ライブラリです。バージョン 2.7 では、Alluxio プラットフォームは DALI とともに展開できるように最適化されており、モデルのトレーニングと推論の前のデータの読み込みと前処理の手順を含む Python ベースの ML アプリケーションを高速化します。 I/O 集約型の作業を高速化し、その後の計算集約型のトレーニングを並行して処理できるようにすることで、Alluxio データ プラットフォームでのエンドツーエンドのトレーニングは、従来のソリューションに比べて大幅なパフォーマンスの向上を実現します。大量の小さなファイルのトレーニングの場合、このソリューションは他のソリューションと比較してスケールアウトを実現できます。

大規模データ読み込み

Alluxio の中心的な位置付けは、分散データ ソースの統合やキャッシュの実装などのデータ管理機能です。 Alluxio が複数の地理的な場所にまたがるコンピューティングおよびストレージ シナリオでますます使用されるようになるにつれて、Alluxio 自体も拡大しています。このアップデートでは、新しいテクノロジーを使用してデータをバッチ処理し、スケーラビリティを強化します。バッチ処理では、組み込みの実行エンジンを使用してデータの読み込みなどのタスクを処理することで、システム構成の作業負荷が軽減され、管理コントローラのリソース要件が軽減されるため、コストが削減されます。

Kubernetesでの使いやすさ

Alluxio は、Kubernetes 用のネイティブ コンテナ ストレージ インターフェイス (CSI) ドライバーと ML 用の Kubernetes オペレーターをサポートするようになり、コンテナ化された環境の Alluxio プラットフォームで ML ワークフローを操作することがこれまで以上に簡単になりました。 Alluxio ボリューム タイプが Kubernetes 環境で利用できるようになりました。この新しいバージョンでは、俊敏性と使いやすさに重点が置かれています。

Prestoの分析に基づいてキャッシュを動的に調整する

新バージョンでは、Shadow Cache と呼ばれる新しいインテリジェント キャッシュ機能も導入されており、キャッシュ サイズが応答速度に与える影響を動的に分析できるため、高性能と低コストのバランスを簡単に実現できます。大規模なマルチテナント Presto 環境では、この新しい機能により、セルフサービス管理を通じて管理オーバーヘッドが大幅に削減されます。

「ストレージと ML 計算が分離されているため、データ プラットフォーム チームは Alluxio を使用してデータの前処理と読み込みフェーズを簡素化できます」と、Alluxio のシニア プロダクト マネージャーである Adit Madan 氏は述べています。 「この簡素化により、Spark ML、Tensorflow、PyTorch などのフレームワークで GPU の使用率を最大化できます。Alluxio ソリューションは、AWS、GCP、Azure Cloud などの複数のクラウド プラットフォームで利用でき、プライベート データ センターまたはパブリック クラウドの Kubernetes でも​​利用できるようになりました。」

ダウンロード

Alluxio 2.7 は、こちらから今すぐダウンロードできます: https://www.alluxio.io/download/

<<:  IBM Zでハイブリッドクラウドの可能性を解き放つ

>>:  ガートナー:世界のクラウド収益は2022年に4,740億ドルに成長する

推薦する

API エコノミーは急速に成長しています。 UCloud が新しい高可用性ゲートウェイ製品 UAPIGateway をリリース

モバイルインターネット時代の到来とともに、国内外の大手インターネット企業が独自のオープンプラットフォ...

hosteons: 米国の無制限 Windows VPS、中国語版あり、使用方法チュートリアル付き

Hosteons の中国建国記念日の 7 日間の OVZ 50% オフ プロモーションは終了しました...

物語は美しいが、誰もそれを信じない。問題はこれにあるのかもしれない

私たちは子供の頃、大人が語る物語を聞きました。あらゆる種類の怪物、幽霊、愛、憎しみ、感情が私たちの顔...

伝統的な企業はどのようにインターネット思考を導入できるでしょうか?

3つのキーワード:伝統的な企業、導入、インターネットの考え方。伝統的な企業とは何でしょうか?私の考え...

IBM ミャオ・キーアン:ハイブリッドクラウドプラットフォーム戦略は、企業が将来を勝ち取るための重要な選択です

[[353673]]著者 ミャオ・ケヤンIBM副社長、中国本土のクラウドコンピューティングおよびコグ...

マイクロソフト、クラウドサービスの停止に関する予備分析を発表

Microsoft は、9 月 4 日に世界中の顧客に影響を与えた障害について、予備的な根本原因分析...

最も一般的なウェブサイト収益モデルの分析

収益性は、ウェブサイトが必ず通らなければならない道のようです。多くのウェブサイトは利益を上げる目的で...

垂直型電子商取引の熱心な顧客が亡くなり、6000万ドルの投資が水の泡に

電子商取引業界の発展は、砂を洗い流す波のようなものです。潮が引くと、誰が裸で泳いでいるかがわかります...

Green Radish アルゴリズムの応答戦略と処理方法の分析

2013年の初めに、百度は再びアルゴリズムをアップグレードし、2月19日に青大根アルゴリズムをリリー...

GoogleがChannel Intelligenceを1億2500万ドルで買収

北京時間2月7日、海外メディアの報道によると、Googleは本日、オンライン小売取引追跡会社Chan...

tudcloud: 香港直接接続 VPS、50 ユニット限定、完売、年間 35 ドル、512M メモリ/1 コア/5g SSD/300g トラフィック/50M 帯域幅

Tudcloudは、年間支払いのみで利用できる特別価格の香港VPSを2つ正式にリリースしました。1つ...

ウェブサイトの運営習慣がすべてを決める。良い検索ランキングは良い習慣に左右される(I)

ウェブサイトの所有者にとって、検索エンジンでウェブサイトのランキングを良くすることは最も重要なことで...

alphavpsはどうですか?米国AMD Ryzen 7000シリーズVPSレビュー、Netflix/TikTokのブロック解除

alphavpsはどうですか? alphavps の AMD Ryzen VPS はいかがでしょうか...