Angel: 新しい分散型機械学習システム

Angel: 新しい分散型機械学習システム

Angel は、パラメータ サーバーの概念に基づいた分散型機械学習フレームワークであり、機械学習アルゴリズムを高次元モデル上で簡単に実行できます。 Angel はモデル共有という中核概念に焦点を当て、大規模な高次元モデルを複数のパラメータ サーバー ノードに合理的に分割し、効率的なモデル更新インターフェイス、操作機能、変数同期プロトコルを通じてさまざまな効率的な機械学習アルゴリズムを実装します。優れた設計のおかげで、Angel は独立して実行でき、さまざまな機械学習アルゴリズムを効率的に実行できるだけでなく、Spark や既存のディープラーニング フレームワークをサポートして高速化する PS サービスとしても機能します。業界からの膨大なデータに基づいて繰り返し実践と調整が行われており、幅広い適用性と安定性を備えています。モデルの次元が高くなるほど、利点は明らかになります。

既存の機械学習システムは、さまざまな種類の機械学習タスク用に構築されています。データフローシステム Hadoop と Spark は、一般的なデータ処理タスクや機械学習パイプラインの構築に適していますが、パラメータ共有メカニズムが欠如しており、単一ポイントのボトルネックによるパフォーマンスの問題があります。グラフコンピューティングシステム GraphLab、GraphX、Tux2 は、機械学習の計算をグラフ構造に抽象化します。グラフ構造の特性を利用して計算を高速化できますが、疎なグラフ構造を持つアルゴリズムにのみ適しています。ディープラーニング システム TensorFlow、MXNet、Caffe2 は、パラメータ サーバーまたは Allreduce メソッドを使用して分散ニューラル ネットワークをトレーニングします。これらの特徴は、GPU を使用してニューラル ネットワークの計算を高速化できることですが、最適化とスパース グラフ構造のサポートが欠けています。

Angel は、分散機械学習の共通性を設計において抽象化し、洗練させます。この記事では、分散機械学習の核心部分はパラメータの共有にあると考えています。効率的なパラメータ共有メカニズムを提供できれば、さまざまな機械学習タスクを拡張し、高速化することができます。そのため、Angel は PS サービス機能を提供し、2 つの動作モードをサポートします。モードの 1 つは PS サービス モードと呼ばれ、このモードでは Angel はマスター サーバーおよびパラメーター サーバーのみを起動し、特定のコンピューティング タスクは他のコンピューティング プラットフォーム (Spark、TensorFlow など) によって完了されます。このモードでは、Angel はパラメータ サーバーの機能の提供のみを担当します。別のモードでは、Angel は Worker も起動し、Angel はモデルのトレーニングを完了する責任を負います。 Angel は PS サービス機能を提供し、さまざまな種類の機械学習タスクを処理し、より便利な機械学習開発エクスペリエンスを提供できるようにします。

さらに、Angelは次の機能も提供できます。(1) 異なるクラスタ環境での高速化のための複数のパラメータ同期プロトコル。 (2)アルゴリズム開発を容易にする使いやすく豊富なインターフェース(3)アルゴリズムのスケーラビリティを向上させるデータ並列処理とモデル並列処理の機能(4)複雑な環境におけるタスクの動作を保証する効率的なフォールトトレラントメカニズム。実際のデータセットで比較した結果、複数の機械学習アルゴリズムにおける Angel のパフォーマンスは、XGBoost、Spark、Petuum、TensorFlow などの一般的な機械学習システムよりも優れています。現在、AngelはTencent Videoのクリック予測や広告推奨など実際のビジネスに応用されています。

Angel のオープンソース システムは、北京大学と Tencent の共同イノベーション研究所によって開発されました。業界における高い可用性と学術コミュニティにおける革新の両方を考慮に入れています。 GitHub で完全にオープンソース化されており、ロジスティック回帰、SVM、KMeans、LDA、MF、GBDT などの複数の機械学習アルゴリズムを統合して最適化します。Angel は現在 Java と Scala をベースに開発されており、将来的には Python やその他の言語インターフェースを追加して、より使いやすくする予定です。将来的には、Angel の PS サービス機能がさらに活用され、グラフ コンピューティングやディープラーニング フレームワークがサポートされるようになります。

<<:  エッジコンピューティングは将来、AI の発展を推進し、クラウドコンピューティングを排除できるでしょうか?

>>:  ハイブリッド クラウドが移行戦略となる理由は何ですか?

推薦する

Beisen PaaSプラットフォームは、企業がカスタマイズされたHRアプリケーションを迅速に構築できるようにします。

[51CTO.comよりオリジナル記事] 最近、「テクノロジーが才能を実現する」をテーマにしたiTa...

#苦情防止/著作権フリーホスティング# vpslices-$2.3/1g メモリ/50g SSD/100m/無制限トラフィック/DDoS 保護

vpslices は HostCat に連絡し、全員に 20% 割引コードを提供するために協力しまし...

ブランドマーケティングを構築し、収益を上げるためのWeiboの合理的な使用

オンラインマーケティングには、オンラインマーケティングを実現する方法が数多くあります。Weiboマー...

Sina Weiboを例に挙げて:ウェブサイトのインタラクションデザインの最初の経験

9月の初めに、私はSina WeiboのUDC部門でインタラクティブデザインのインターンシップをしま...

ウェブサイトの最適化に欠かせない要素について簡単に説明します。多様な開発

ウェブ業界と検索業界が成熟するにつれて、検索アルゴリズムはよりインテリジェントでユーザーフレンドリー...

「最初から課金」が産業現場の持続的発展と収益性の鍵

セグメント化された業界ウェブサイトは、個人がウェブサイトを構築する方向性の 1 つでした。大規模で包...

「クラウドネイティブ」時代の効率的な開発のためのワンストップチェックイン:マイクロサービスやデータベースもこんな使い方ができることが判明

今週末、古都金陵は輝かしい文化で満ち溢れます。人気のDevRun開発者サロンがひっそりとスタートしま...

ウェブサイトのURLを解析する際によくある問題の例

多くの場合、外部リンクやコンテンツに重点を置き続けていると、構造が徐々に私たちにとっての呪いとなって...

デスクトップ仮想化のセキュリティリスク

デスクトップ仮想化技術により、さまざまなアクセス方法と便利な管理モードが可能になり、デスクトップ シ...

最も美しいウェブデザインは何ですか? 8つのウェブデザイントレンド

この記事は、ウェブサイトデザイン会社 weavora.com からの翻訳です。同社が考えるウェブデザ...

広州は小米のマーケティング「NewX」よりも熱い - 新技術、新メディア、新コンテンツのマーケティング探究

月収10万元の起業の夢を実現するミニプログラム起業支援プラン9月4日、「NewX-2018 Xiao...

百度は今年後半に低品質のサイトを厳しく処罰する予定で、ウェブマスターにとって悪いニュースがやってくる

この記事を読むためにクリックしたあなたは、タイトルのためにここに来たのだと思います。ここで私が伝えた...

Kubernetesを超えて: 注目すべき5つのクラウドネイティブテクノロジー

【編集後記】Kubernetesの登場により、コンテナ化技術やサービスメッシュなどさまざまな技術が急...

中国検索は検索戦争を混乱させ、その統合能力はまだテストされていない

検索エンジンはインターネットへの最初の入り口であり、5億人を超えるユーザーベースを擁し、常に「戦場」...

ソフトウェア定義ストレージ (SDS) がエンタープライズ クラウドネイティブ アプリケーションにどのように役立つか

Google、Facebook、Amazon などのハイパースケール クラウド コンピューティング企...