アリババは、NvidiaやGoogleと比較してコンピューティング電力消費を80%削減する1兆パラメータのAIモデルM6をリリースしました。

アリババは、NvidiaやGoogleと比較してコンピューティング電力消費を80%削減する1兆パラメータのAIモデルM6をリリースしました。

6月25日、アリババDAMOアカデミーは巨大モデルM6の「低炭素バージョン」をリリースしました。これは、兆パラメータの超大規模モデルのトレーニングにおけるエネルギー消費を大幅に削減した世界初の製品です。 DAMOアカデミーチームは一連の画期的な技術革新を通じて、わずか480枚のGPUカードを使用して、人間のニューロンの10倍の大きさである1兆個のパラメータを持つM6マルチモーダル大規模モデルをトレーニングしました。 NVIDIAやGoogleなど海外企業が達成した兆パラメータ規模と比較すると、エネルギー消費量は80%以上削減され、効率は11倍近く向上した。

AI コミュニティでは、ビッグモデルが次世代の人工知能インフラストラクチャになるというコンセンサスが形成されています。生物のニューロンの数が多いほど賢くなる傾向があるのと同様に、パラメータスケールが大きい AI モデルは知能の上限が高くなる傾向があります。大規模なモデルをトレーニングすることで、人間は汎用的な人工知能の探求をさらに一歩進めることができるようになるかもしれません。しかし、大規模モデルの計算コストも非常に高く、学界や産業界が大規模モデルの可能性について詳細な研究を行うことを大いに妨げています。

この問題に対処するため、DAMO アカデミーと Alibaba Cloud のチームは MOE (Mixture-of-Experts) フレームワークを改良し、エキスパート並列戦略を創造的に使用して、単一モデルの収容力を大幅に拡大しました。同時に、DAMO アカデミー チームは、線形代数、混合精度トレーニング、半精度通信などの最適化テクノロジーを加速することで、兆モデルのトレーニング速度を大幅に向上させ、必要なコンピューティング リソースを効果的に削減しながら、ほぼロスレスの結果を達成しました。

Nvidia が 3072 個の A100 GPU を使用して 1 兆個のパラメータを実現し、Google が 2048 個の TPU を使用して 1.6 兆個のパラメータの大規模モデルを実現したのに比べ、DAMO Academy は今回、480 個の V100 32G GPU のみを使用して 1 兆個のモデル M6 を実現し、コンピューティング パワー リソースを 80% 以上節約し、トレーニング効率を 11 倍近く向上させました。

同時に、DAMOアカデミーが発表したM6巨大模型は、中国で初めて商品化されたマルチモーダル大型模型となった。 M6 は従来の AI を超える認知能力と創造力を備えています。絵を描くこと、書くこと、質疑応答が得意です。電子商取引、製造、文学、芸術など、多くの分野で幅広い応用が期待されています。

M6は一定期間の試験期間を経て、アリババの新しい製造プラットフォーム「Rhino Intelligent Manufacturing」のAIアシスタントデザイナーとして正式に活躍する予定だ。ファッショントレンドを迅速にデザインし、フィッティング効果のシミュレーションを行うことで、新しいファストファッション衣料のデザインサイクルを大幅に短縮することが期待されます。 M6はAlipayやTaobaoなどのプラットフォームにも適用され、クロスモーダル検索、コピーライティング、イメージデザインなどのタスクに参加しています。

DAMOアカデミーの上級アルゴリズム専門家であるヤン・ホンシア氏は、「今後、M6チームは低炭素AIの完成に努め、さらなる応用を推進し、一般的な大規模モデルに関する理論研究を探求していく」と述べた。

今年初め以来、アリババは超大規模事前トレーニングモデルの分野で多くの成果を達成してきました。アリババDAMOアカデミーは、マルチモーダル巨大モデルM6のリリースに加え、最近、中国語コミュニティをリードする言語巨大モデルPLUGをリリースし、AI巨大モデルの基礎技術とアプリケーションの詳細なレイアウトを実現しました。

<<:  分散トランザクションのための 6 つのソリューション。非常によく書かれています。

>>:  Netty を使用して高性能な分散サービス フレームワークを作成する方法は?

推薦する

企業にマルチクラウド戦略を導入する 5 つのメリット

クラウド コンピューティングは企業のビジネスを新たなレベルに引き上げましたが、近年、クラウド コンピ...

企業ウェブサイトのブランド、人気、評判を向上させる方法

「一流企業は標準を売り、二流企業はブランドを売り、三流企業は製品を売ります。」これは伝統産業でよく言...

基本に立ち返り、群衆に従うことを拒否します。BaiduスナップショットSEOの重要性について話しましょう

いわゆる Baidu スナップショットとは、Baidu に含まれるほぼすべての Web ページに、B...

中軟科技、「建雲エコシステム」構築に向けた金融テクノロジー戦略を発表

10月10日、ChinaSoft(002453.SZ)は北京で大戦略会議を開催し、金融技術発展戦略を...

VMware、Yuan Xin 氏をグローバル副社長兼中華圏社長に任命

2021 年 11 月 15 日 - VMware (NYSE: VMW) は本日、ベッシー・ユアン...

ウェブサイトのスムーズな立ち上げを確実にするために、繰り返しはしないでください

ウェブサイトのコンテンツがインターネット上のコンテンツとあまりにも類似しています。ウェブサイトのコン...

Dogyun:「香港-KC」データセンターの「Alibaba Cloud」ラインVPSの簡単なレビュー

ご存知のとおり、Alibaba Cloud 香港回線の VPS は、中国本土に直接接続する 3 つの...

SEO 最適化の究極の基準は何ですか?

武漢の一部の SEO 専門家の間では、「検索エンジンのルール」と「検索エンジンのアルゴリズム」という...

US クラウド サーバー\US VPS 推奨「トップ」販売業者「hostwinds」

どの米国のクラウド サーバーまたは米国の VPS プロバイダーが最も安価で、最高のサービスを提供して...

Terraform を使用して Azure 仮想マシンを作成する

以前、Terraform を使用して Proxmox 仮想マシンをデプロイする方法についての記事を書...

百度の大型アップデートが6つの業界に与える影響を推測する

今回、Baiduの6.22と6.28のアップデートと調整(まだ停止していない)は、中小規模のウェブマ...

チェン・クイ、Citrix グローバル副社長兼中国本土担当ゼネラルマネージャー: 目に見えない生産性の可能性を引き出す

現在、企業は競争力があり、柔軟性があり、市場の期待を上回る労働力構造の構築に取り組んでいます。そのた...

ランキングを最適化する方法

Google は、ウェブサイト自体とユーザーの所在地に基づいて、異なる検索結果を表示することがよくあ...