アリババは、NvidiaやGoogleと比較してコンピューティング電力消費を80%削減する1兆パラメータのAIモデルM6をリリースしました。

アリババは、NvidiaやGoogleと比較してコンピューティング電力消費を80%削減する1兆パラメータのAIモデルM6をリリースしました。

6月25日、アリババDAMOアカデミーは巨大モデルM6の「低炭素バージョン」をリリースしました。これは、兆パラメータの超大規模モデルのトレーニングにおけるエネルギー消費を大幅に削減した世界初の製品です。 DAMOアカデミーチームは一連の画期的な技術革新を通じて、わずか480枚のGPUカードを使用して、人間のニューロンの10倍の大きさである1兆個のパラメータを持つM6マルチモーダル大規模モデルをトレーニングしました。 NVIDIAやGoogleなど海外企業が達成した兆パラメータ規模と比較すると、エネルギー消費量は80%以上削減され、効率は11倍近く向上した。

AI コミュニティでは、ビッグモデルが次世代の人工知能インフラストラクチャになるというコンセンサスが形成されています。生物のニューロンの数が多いほど賢くなる傾向があるのと同様に、パラメータスケールが大きい AI モデルは知能の上限が高くなる傾向があります。大規模なモデルをトレーニングすることで、人間は汎用的な人工知能の探求をさらに一歩進めることができるようになるかもしれません。しかし、大規模モデルの計算コストも非常に高く、学界や産業界が大規模モデルの可能性について詳細な研究を行うことを大いに妨げています。

この問題に対処するため、DAMO アカデミーと Alibaba Cloud のチームは MOE (Mixture-of-Experts) フレームワークを改良し、エキスパート並列戦略を創造的に使用して、単一モデルの収容力を大幅に拡大しました。同時に、DAMO アカデミー チームは、線形代数、混合精度トレーニング、半精度通信などの最適化テクノロジーを加速することで、兆モデルのトレーニング速度を大幅に向上させ、必要なコンピューティング リソースを効果的に削減しながら、ほぼロスレスの結果を達成しました。

Nvidia が 3072 個の A100 GPU を使用して 1 兆個のパラメータを実現し、Google が 2048 個の TPU を使用して 1.6 兆個のパラメータの大規模モデルを実現したのに比べ、DAMO Academy は今回、480 個の V100 32G GPU のみを使用して 1 兆個のモデル M6 を実現し、コンピューティング パワー リソースを 80% 以上節約し、トレーニング効率を 11 倍近く向上させました。

同時に、DAMOアカデミーが発表したM6巨大模型は、中国で初めて商品化されたマルチモーダル大型模型となった。 M6 は従来の AI を超える認知能力と創造力を備えています。絵を描くこと、書くこと、質疑応答が得意です。電子商取引、製造、文学、芸術など、多くの分野で幅広い応用が期待されています。

M6は一定期間の試験期間を経て、アリババの新しい製造プラットフォーム「Rhino Intelligent Manufacturing」のAIアシスタントデザイナーとして正式に活躍する予定だ。ファッショントレンドを迅速にデザインし、フィッティング効果のシミュレーションを行うことで、新しいファストファッション衣料のデザインサイクルを大幅に短縮することが期待されます。 M6はAlipayやTaobaoなどのプラットフォームにも適用され、クロスモーダル検索、コピーライティング、イメージデザインなどのタスクに参加しています。

DAMOアカデミーの上級アルゴリズム専門家であるヤン・ホンシア氏は、「今後、M6チームは低炭素AIの完成に努め、さらなる応用を推進し、一般的な大規模モデルに関する理論研究を探求していく」と述べた。

今年初め以来、アリババは超大規模事前トレーニングモデルの分野で多くの成果を達成してきました。アリババDAMOアカデミーは、マルチモーダル巨大モデルM6のリリースに加え、最近、中国語コミュニティをリードする言語巨大モデルPLUGをリリースし、AI巨大モデルの基礎技術とアプリケーションの詳細なレイアウトを実現しました。

<<:  分散トランザクションのための 6 つのソリューション。非常によく書かれています。

>>:  Netty を使用して高性能な分散サービス フレームワークを作成する方法は?

推薦する

中国インターネット広告市場調査レポート

この記事では、iResearch が発表した「中国のインターネット広告市場に関する年次調査レポート」...

bacloud: リトアニア サーバー、最低 53 ユーロ、2*2650v2、64G メモリ、50T トラフィック

有名なリトアニアのホスティング会社 bacloud が、専用サーバーの特別なプロモーション バージョ...

主流の人気のインターネット製品を活用して、自社製品の価値を探る

ほぼすべての伝統的な企業が「オンライン化」を開始しており、これは長い間の傾向です。その理由は単純です...

アプリのプロモーション: 低コストの ASO 最適化によりアプリ ストアの評価が向上します。

アプリを宣伝するときには、その評価やレビューをどのように改善するかという状況に直面することがよくあり...

オラクルとRunlian Technologyが戦略的提携を締結

オラクル・コーポレーションは、2019 Oracle Cloud Conferenceにおいて、深セ...

2019年の中国のインターネット予測!

「 」と「庚子」が絡み合って魔法の年を形成します。 100年に一度の疫病、株価高騰、プラットフォーム...

ブログやマイクロブログのマーケティングの焦点は何ですか?

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスブログが誕生した当初は、...

中国電信の新ドメイン名の歴史の逆転はあなた次第

最近、中国電信はオンラインビジネスホールの新しいドメイン名を導入する移行作業を開始しました。このドメ...

360 Dianjing 検索プロモーション ゴールド ポートフォリオ アカウント分析

Baidu プロモーションを使用したことがある人なら、部分一致 (広範囲に網を張る) + 検索語レポ...

7月4日、ウルフレインは再びKになった。上海奇商月居SEOのホームページの見解

朝起きて最初にしたことは、BaiduのSEOにおけるLangyu SEOフォーラムのランキングに注目...

仮想化技術を使用してインフラストラクチャクラウドを構築することの利点と欠点の分析

サーバー仮想化テクノロジーを使用してインフラストラクチャ クラウドを構築することには、利点と欠点の両...

VSphere 7 Kubernetesの機能により、最新のアプリケーションへの移行が容易になります

VMware は、vSphere の新しいバージョンにより、Project Pacific の約束の...

大規模なスナップショットのロールバックはKステーションの前兆である

スナップショット ロールバックという用語は、多くの人が知っていると思います。初心者の Web マスタ...