テンセントクラウドがImageNetのトレーニング記録を2分31秒で破り、新たな記録が樹立された。

テンセントクラウドがImageNetのトレーニング記録を2分31秒で破り、新たな記録が樹立された。

8月21日、テンセントクラウドは、128枚のImageNetトレーニングで業界新記録を樹立し、2分31秒というタイムでこの分野の世界記録を更新したと正式に発表した。マシン間のネットワーク帯域幅を変更すると、結果はさらに 2 分 2 秒に改善され、この記録は新たな高さに到達します。

この記録は、パブリック クラウドの 25Gbps VPC ネットワーク環境をベースに、128 個の V100 GPU と、新たに開発された Light 大規模分散型マルチマシンおよびマルチカード トレーニング フレームワークを使用して作成されました。最終結果は、ImageNet 28 エポックのトレーニングに 2 分 31 秒かかり、TOP5 の精度は 93% でした。これまでの業界最高記録は2分38秒でした。この記録の背後には、テンセントクラウドインテリジェントチタンチーム、テンセントインテリジェンスチーム、テンセントYoutuラボ、香港バプテスト大学コンピュータサイエンス学部のチュー・シャオウェン教授のチームがいると理解されている。

人工知能の最も重要な基礎技術の一つとして、ディープラーニングの応用はスマートシティやスマート製造など多くのシナリオに急速に拡大しています。しかし、需要の高まりと並行して、膨大なデータと長いトレーニング時間、ますます複雑化するコンピューティング モデル/構造、多数のパラメーター、幅広いハイパーパラメーターなど、ディープラーニングのトレーニングでは多くの問題が発生しています。これらの問題により、ディープラーニングアプリケーション開発の進歩が妨げられてきました。高性能 AI のトレーニングとコンピューティングをどのように実行するかは、AI の生産と研究開発の効率に関係するだけでなく、AI 製品の反復効率と成功した発売にも重要な影響を及ぼします。効率的なトレーニングのための非常に重要なベンチマークは、大規模なビジュアル データベース ImageNet をより短時間でトレーニングする方法です。

このような背景から、Tencent Cloud は複数のチームと協力し、Light 大規模分散型マルチマシンおよびマルチカード トレーニング フレームワークを開発し、ディープラーニング トレーニングの速度、マルチマシンおよびマルチカードのスケーラビリティ、バッチ コンバージェンスなどの点で業界に新しいトレーニング ソリューション セットを提供しています。

単一マシンのトレーニング速度に関しては、Tencent Cloud はまず GPU クラウド サーバーのメモリと SSD クラウド ディスクを使用して、トレーニング プロセス中にトレーニング プログラムのデータのプリフェッチとキャッシュを提供し、リモートに保存されたデータへのアクセスを高速化します。多数のスレッドが競合することでCPU効率が低下する問題を解決するため、Tencent Cloudはデータ前処理スレッドの最適な数を自動的に調整してCPU切り替えの負担を軽減し、データ前処理とGPUコンピューティングを並行して実行できるようにすることで、全体的なトレーニング速度を向上させます。

マルチマシン拡張トレーニングでは、従来の TCP 環境では、マシン間通信データをビデオメモリからメインメモリにコピーし、CPU でデータの送受信を行う必要がありました。計算時間が短く、通信時間が長いため、複数のマシンと複数のカードのスケーラビリティが大きな課題となりました。 Tencent Cloud は、Light によってマルチマシントレーニングを効率的に拡張しました。適応勾配融合技術、階層型通信+マルチストリーム手段、階層型TopK圧縮通信アルゴリズムなどにより、通信中のネットワーク帯域幅を最大限に活用し、マシン間通信の時間を最適化します。

さらに、大規模クラスターの計算能力を最大限に活用するために、業界では現在、主にトレーニングのバッチサイズを継続的に増やすことでトレーニング速度を向上させていますが、バッチサイズの増加は精度に影響を与え、損失をもたらします。この問題を解決するために、Tencent Cloud は、大規模バッチパラメータ調整戦略、勾配圧縮精度補正、AutoML パラメータ調整などの方法を通じて、バッチサイズを効果的に増やしながら、精度への影響を最小限に抑えました。

Light 大規模分散マルチマシンおよびマルチカード トレーニング フレームワークとプラットフォームなどの一連の完全なソリューションを通じて、ImageNet トレーニングの結果は新たなブレークスルーを達成しました。効率的なトレーニングを実現するとともに、その機能は Tencent Cloud Intelligent Titanium Machine Learning プラットフォームにも統合され、Tencent の社内外のビジネスで広く使用されています。

次に、共同プロジェクトチームは、機械学習プラットフォームの使いやすさ、トレーニング、推論パフォーマンスをさらに向上させ、安定的で使いやすく、便利で効率的なプラットフォームとサービスを構築し、アルゴリズムエンジニアに強力な機械学習ツールを提供し、各分野のユーザーのビジネス発展を支援します。

<<:  2020年テンセントグローバルデジタルエコシステムカンファレンスが9月に開催予定:クラウドへの移行は初めて、デジタル経済の新たなトレンドを解釈

>>:  アリババクラウドの収益は上半期に急増し、ディントークとクラウドは化学反応を起こした

推薦する

企業がハイブリッド クラウドの導入を検討する必要があるのはなぜですか?

ビジネスや人生の多くは意味論に帰着します。人々はさまざまな言葉で目標を表現し、成功を測定します。いく...

ウェブサイトを構築する前に、クラウドサーバーと仮想ホストの4つの違いを見てみましょう

クラウド サーバーと仮想ホストは名前が非常に似ているため、多くの企業はそれらの違いを理解していません...

クラウドコンピューティングに関する10のよくある質問

FAQ を参考にしてクラウド コンピューティングの基礎を学び、さまざまな種類のクラウド プラットフォ...

racknerd: 「520」すべての VPS と「ハイブリッド サーバー」が 50% オフのプロモーション、低価格、高構成の VPS

Racknerd は、5 月 21 日まで 1 週間続く新しい「520」プロモーションを開始しました...

Baidu Experienceの6つのライティングスキル

Baidu の製品の多くは SEO 担当者に広く利用されており、特に Baidu Encyclope...

Java アーキテクチャ - SpringCloud 分散アーキテクチャ 権限管理

概要この記事では、分散アーキテクチャの権限管理の 2 つの状況、つまり統合認証アクセスとクロスプラッ...

パブリック、プライベート、ハイブリッド、マルチクラウドソリューションが選ばれる理由

クラウドはほぼすべての組織で最も普及しているツールの 1 つになっていることは周知の事実です。現在の...

vpsdime-$7/6g メモリ/4 コア/80g ハードディスク/2T トラフィック/2g ポート/3 データセンター

vpsdime は比較的強力なビジネスであり、backupsy は少なくともその強さの象徴であるため...

gigsgigscloud: 日本 cn2 gia vps、200M 帯域幅、月額 12 ドルから、毎月 100G のトラフィック追加付き

gigsgigscloud は、日本 cn2 gia vps に関する最新ニュースを発表しました。新...

1か月でトラフィックが2倍に

著者は、共有するための最良の方法は、自分の実践的な経験を共有し、データを提示し、操作方法を説明するこ...

zoic: ロシアの VPS、15 元/1Gbps 帯域幅/無制限トラフィック/512M メモリ/10G ハードディスク

ロシアのホスティング会社である Zoic は、2009 年に設立されました。主な事業は、仮想ホスティ...

ホスティングレビュー 2018年10月プレビュー

皆様日頃の応援ありがとうございます。3年前はまだ負け犬でしたが今月1日に結婚しました!だから、独身の...

デスクトップ仮想化における3D仮想化ソリューションの体験概要

[[246459]]通常のデスクトップ仮想化と比較すると、3D デスクトップ仮想化は、通常のデスクト...

高級電子商取引のZunxiang.comはSAIFが数千万ドルを投資した後に中止された

5月30日、SAIFパートナーズから数千万ドルの投資を受けていた高級品EC企業VIP.comが閉鎖さ...

ウェブサイトの外部最適化と検索エンジン構築の「架け橋」

ウェブサイトの外部最適化を構築できるチャネルについて簡単に説明します。 1. 自分のウェブサイトのプ...