アリババは、NvidiaやGoogleと比較してコンピューティング電力消費を80%削減する1兆パラメータのAIモデルM6をリリースしました。

アリババは、NvidiaやGoogleと比較してコンピューティング電力消費を80%削減する1兆パラメータのAIモデルM6をリリースしました。

6月25日、アリババDAMOアカデミーは巨大モデルM6の「低炭素バージョン」をリリースしました。これは、兆パラメータの超大規模モデルのトレーニングにおけるエネルギー消費を大幅に削減した世界初の製品です。 DAMOアカデミーチームは一連の画期的な技術革新を通じて、わずか480枚のGPUカードを使用して、人間のニューロンの10倍の大きさである1兆個のパラメータを持つM6マルチモーダル大規模モデルをトレーニングしました。 NVIDIAやGoogleなど海外企業が達成した兆パラメータ規模と比較すると、エネルギー消費量は80%以上削減され、効率は11倍近く向上した。

AI コミュニティでは、ビッグモデルが次世代の人工知能インフラストラクチャになるというコンセンサスが形成されています。生物のニューロンの数が多いほど賢くなる傾向があるのと同様に、パラメータスケールが大きい AI モデルは知能の上限が高くなる傾向があります。大規模なモデルをトレーニングすることで、人間は汎用的な人工知能の探求をさらに一歩進めることができるようになるかもしれません。しかし、大規模モデルの計算コストも非常に高く、学界や産業界が大規模モデルの可能性について詳細な研究を行うことを大いに妨げています。

この問題に対処するため、DAMO アカデミーと Alibaba Cloud のチームは MOE (Mixture-of-Experts) フレームワークを改良し、エキスパート並列戦略を創造的に使用して、単一モデルの収容力を大幅に拡大しました。同時に、DAMO アカデミー チームは、線形代数、混合精度トレーニング、半精度通信などの最適化テクノロジーを加速することで、兆モデルのトレーニング速度を大幅に向上させ、必要なコンピューティング リソースを効果的に削減しながら、ほぼロスレスの結果を達成しました。

Nvidia が 3072 個の A100 GPU を使用して 1 兆個のパラメータを実現し、Google が 2048 個の TPU を使用して 1.6 兆個のパラメータの大規模モデルを実現したのに比べ、DAMO Academy は今回、480 個の V100 32G GPU のみを使用して 1 兆個のモデル M6 を実現し、コンピューティング パワー リソースを 80% 以上節約し、トレーニング効率を 11 倍近く向上させました。

同時に、DAMOアカデミーが発表したM6巨大模型は、中国で初めて商品化されたマルチモーダル大型模型となった。 M6 は従来の AI を超える認知能力と創造力を備えています。絵を描くこと、書くこと、質疑応答が得意です。電子商取引、製造、文学、芸術など、多くの分野で幅広い応用が期待されています。

M6は一定期間の試験期間を経て、アリババの新しい製造プラットフォーム「Rhino Intelligent Manufacturing」のAIアシスタントデザイナーとして正式に活躍する予定だ。ファッショントレンドを迅速にデザインし、フィッティング効果のシミュレーションを行うことで、新しいファストファッション衣料のデザインサイクルを大幅に短縮することが期待されます。 M6はAlipayやTaobaoなどのプラットフォームにも適用され、クロスモーダル検索、コピーライティング、イメージデザインなどのタスクに参加しています。

DAMOアカデミーの上級アルゴリズム専門家であるヤン・ホンシア氏は、「今後、M6チームは低炭素AIの完成に努め、さらなる応用を推進し、一般的な大規模モデルに関する理論研究を探求していく」と述べた。

今年初め以来、アリババは超大規模事前トレーニングモデルの分野で多くの成果を達成してきました。アリババDAMOアカデミーは、マルチモーダル巨大モデルM6のリリースに加え、最近、中国語コミュニティをリードする言語巨大モデルPLUGをリリースし、AI巨大モデルの基礎技術とアプリケーションの詳細なレイアウトを実現しました。

<<:  分散トランザクションのための 6 つのソリューション。非常によく書かれています。

>>:  Netty を使用して高性能な分散サービス フレームワークを作成する方法は?

推薦する

ケーススタディ: テンセントの再設計は美しい始まり

情報環境の変化により、テンセントはポータル、ブログ、ビデオ、モバイルを接続する設計を改訂し、自社の高...

クラウドインフラ開発の動向

2020年、専門家は今後10年間のクラウドの発展方向について多くの予測を立てましたが、デジタル変革と...

SEO担当者は、共有し感謝する心を持つべきだ

筆者も80年代以降の人間ですが、今の若者は物事に対して衝動的になっていると感じています。実は、これは...

digitaloceanは5ドルと1か月の無料VPSを提供します

Digital Ocean から、ニューヨークに 2 番目のデータセンターを開設したというメールを受...

政府がWeChatを統制、違法な公共アカウントマーケティングアカウントの時代は終了

【IT Times 週刊深層観察】WeChatはこれまで悲惨な運命を辿ってきた。サービス開始直後から...

budgetvm: 日本製サーバー、$99/e3-1230v3/16g メモリ/120gSSD+2T SATA/1Gbps 帯域幅

おそらくほとんどの人はbudgetvmを知っていると思いますが、これは古いブランドです。アメリカのe...

SEOガイドラインの5つの要素

検索エンジン最適化のプロセスにおいて、一部の Web サイトは検索エンジンで非常に高いランクを獲得す...

クラウド サービスはインターネットの次の大きなバブルです。この勢いはすでに明らかである

【クラウドコンピューティングはIT業界の第4次革命です。クラウドアプリケーションとクラウドサービスが...

朗報:Linodeが新たな戦場を開拓 - シンガポールとドイツのデータセンター

linode.com からの最新ニュース: Linode の日本データセンターは大きな成功を収めまし...

モバイル着信音サイトのキーワード最適化戦略の分析例

最新の携帯電話アプリが好きな友人は、専門的なアプリダウンロードウェブサイトを好みます。中国でより有名...

Windows 10 エクスペリエンス

今日、試用のために 2 台のコンピューターを Windows 10 にアップグレードしました。1 台...

2019年のアプリプロモーションにおけるASOトレンド!

春節祭に向けた百度と今日頭条のプロモーション戦争が終わったばかりだ。 2018 年の初めに予測したと...

Kubernetes ゲートウェイ API ポリシーに基づくトラフィック管理

Kubernetes Gateway API は、複雑さを抽象化し、ルーティングとトラフィック ポリ...

これらを実行すればクラウド移行の準備は完了です

デジタル経済の活発な発展は、デジタル変革と切り離せないものです。現在、90% 以上の企業がクラウドへ...