アリ・ジア・ヤンチン:ビッグデータとAI機能を通じて企業にアップグレードの力を提供する

アリ・ジア・ヤンチン:ビッグデータとAI機能を通じて企業にアップグレードの力を提供する

[51CTO.com からのオリジナル記事]企業がビジネスを革新し、効率性を向上させたい場合、データをうまく管理して使用するだけでは不十分で、AI 技術のサポートも必要です。 「ビッグデータとAIは切り離せない。この2つが融合してこそ、企業はデジタル時代の不確実性に冷静に対処できる」とアリババの副社長でアリババクラウド・コンピューティング・プラットフォームの責任者である賈陽青氏は述べた。

しかし、多くの企業が AI 分野に参入すると、アルゴリズムやその他のテクノロジーがもはや主要な問題点ではなくなることに気付くでしょう。 AIエンジニアリングの実装シナリオとAIエンジニアリング技術ソリューションの急速な構築は、克服できないギャップです。

Jia Yangqing 氏は、AI エンジニアリングとは何か、AI エンジニアリングをどのように実装するか、Alibaba Cloud がユーザーの AI エンジニアリングをどのようにサポートするかについて詳しく紹介しました。

供給の観点から見ると、AI エンジニアリングはデータとコンピューティング能力のクラウドネイティブな性質です。

ご存知のとおり、AI はデータと計算能力によって駆動されます。コンピュータービジョン、自然言語処理、その他の AI システムであっても、データの量と切り離すことはできません。

しかし、ムーアの法則によれば、単一の CPU コアの計算能力は 18 か月ごとに 2 倍になります。しかし、2008年頃からムーアの法則は崩れ始め、コンピューティング能力の成長率は徐々に鈍化し始めました。

同時に、データの量が増えるにつれて、モデルの精度はますます高まります。 AI のニーズをサポートするには、データ面でもコンピューティング面でも、より大規模で大容量の基盤が必要です。

最近、アリババと清華大学は共同で、超大規模中国マルチモーダル事前トレーニング済み1000億パラメータモデルM6をリリースしました。そのデータセットには1.9TB以上の画像と292GBのテキストが含まれており、パラメータ規模は1000億に達します。製品説明の生成、視覚的な質疑応答、質疑応答、漢詩の生成などのクロスモーダルタスクを完了できます。

コアテクノロジーの観点から見ると、AI エンジニアリングはスケジューリングとプログラミングのパラダイムのスケーリングです。

大規模で巨大な基地を建設する場合、コストの問題に直面することがよくあります。まず、大規模なモデルをトレーニングするには、大規模なコンピューティング用の GPU が必要です。たとえば、Nvidia の DGX2 の価格は 1 台あたり 20 万ドルです。トレーニング モデルには 64 台のマシンと 512 個の GPU が必要です。大規模なトレーニング専用のクラスターを構築する場合、費用は1億元程度かかる可能性があります。

Alibaba Cloudは、M6モデルをトレーニングする際に、生産マシンの明らかな「潮汐効果」を利用しました。日中はオンラインサービスのボリュームが多く、マシンの使用率が高く、夜間はトラフィックが少なく、コンピューティングボリュームも低くなります。 AI コンピューティング タスクを小さな部分に分割し、アイドル リソースのあるマシンに展開します。このように、M6 モデルをトレーニングする場合、新しいマシンを購入する必要はありません。代わりに、既存の運用クラスターで Tidal 機能を使用して、コンピューティング能力を高めることができます。

2つ目は人的コストです。 AI には比較的明確な目標指向のフレームワークがなく、簡単に複製することもできません。 AI プログラムは、マシンとリソース間でデータをスケジュールし、アルゴリズムをパラメータ サーバーに配置し、さまざまなマシンに指示を発行する必要があります。そのため、AIエンジニアは多くの複雑なコードを書く必要があります。

リソースのスケジュールと割り当てをより適切に実装する方法、そしてエンジニアが分散プログラミング パラダイムをより簡単に記述できるようにする方法、特にスケーリングする方法も、明らかに必要なことです。

[[402369]]


Alibaba Cloud は、比較的シンプルでクリーンなプログラミング フレームワークである Whale を設計しました。これにより、開発者は単一マシン プログラミング パラダイムから分散プログラミング パラダイムに簡単に移行できるようになります。たとえば、モデルを 4 つのステージに分割するように Whale に指示するだけで、Whale は計算のためにこれらのステージを異なるマシンに自動的に配置します。

需要や輸出の観点から見ると、AIエンジニアリングは開発とサービスの標準化と普及です。

AI には多くの興味深いモデルがあり、これらのモデルを実際のシナリオにさらに適用できるようにするには、多くの作業を行う必要があります。しかし、AI がどのようにモデル化され、トレーニングされ、展開されるかを学ぶ時間を持つ人は誰もいません。

そこで、Alibaba Cloud は、開発者が高度な AI 技術をより簡単に利用できるようにするためにはどうすればよいかを考えてきました。

Alibaba Cloud Machine Learning Platform PAI チームは、モデルの作成からモデルのトレーニング、モデルの展開まで、Alibaba Cloud IaaS 製品に基づいてクラウド上に完全な AI 開発ライフサイクル管理システムを構築しました。

Alibaba Cloud の機械学習プラットフォーム PAI は、クラウド コンピューティングを利用してストレージとコンピューティングのコストを削減します。同時に、アルゴリズムをより速く進化させるためには、アルゴリズム エンジニアがシステムのコンピューティング機能とデータ機能を簡単に利用できるように、多くのツールを提供する必要があります。その中で、Studio プラットフォームはビジュアルモデリングを提供し、DLC プラットフォーム (Deep Learning Container) はクラウドネイティブのワンストップディープラーニングトレーニングを提供し、DSW プラットフォーム (Data Science Workshop) はインタラクティブモデリングを提供し、EAS プラットフォーム (Elastic Algorithm Service) はよりシンプルで安心なモデル推論サービスを提供します。

[[402370]]


これまで、アリババクラウドはビッグデータとAIプラットフォームを通じて、宝鋼、三一集団、四川農村信用協同組合、太平洋保険、小紅書、VIPKID、斗魚など、各界の顧客にサービスを提供してきました。アリババクラウドは、ビッグデータとAI機能を通じて、企業にアップグレードの推進力を提供したいと考えています。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  Alibaba Cloudは、コミュニティとクラウドネイティブデータベースエコシステムを構築するためにPolarDBのオープンソースリリースを発表

>>:  Docker ネットワークの基礎 |仮想ネットワークデバイスペア(Veth)の原理

推薦する

Alibaba Cloud Security Xiao Li: RSA2019 から学ぶセキュリティ技術開発の 10 の機会

国際的に有名な情報セキュリティサミットRSA2019が終了しました。サミットには世界中から700以上...

企業はどのようにしてクラウド移行のコストを効果的に削減できるでしょうか?

[51CTO.com からのオリジナル記事] 今日、クラウド コンピューティングは企業にとってトレン...

bluevm 新年特別シリーズ 1Gkvm 6ドル/月

bluevmは新年に向けて特別に用意された新マシンのようです。状況から判断すると、シリーズ全体から1...

Alexaの評判値に基づいてPR価値を予測する

PRとは:PR値の正式名称はPageRank(ページランク)で、2001年9月に米国特許を取得しまし...

ID とアクセス管理の問題がハイブリッドおよびマルチクラウドの導入を妨げているのでしょうか?

[[392873]]クラウド プラットフォームにおける ID およびアクセス管理に関する懸念により、...

ディストリビューション - $15/年/768M メモリ/10g ハードドライブ/無制限トラフィック/カナダ/OVH

DediStation.com は HWL の元所有者によって開設されたという人もいます。今のところ...

ブラインドボックス経済が「火を噴く」

現在、ショートビデオプラットフォームには、文房具ブラインドボックス、航空券ブラインドボックス、手作り...

360 Search、入札システム「360 Dianjing Marketing Platform」を開始

360 Search がひっそりとリリースされた 8 月 16 日には、業界で大きな話題となりました...

インテリジェント製造のトレンドにおけるエッジコンピューティングの応用シナリオの探究

概要インダストリー4.0の導入により、世界中のますます多くの製造企業が、クラウドコンピューティング、...

パブリッククラウド?プライベートクラウド?ハイブリッドクラウド?所により曇り?業界クラウド?違いが分からない

[[432390]]みなさんこんにちは、ミン兄弟です!クラウド コンピューティング関連の概念について...

レノボはクラウドMSP市場に参入し、企業のクラウド移行の架け橋となる

[[231065]]企業がクラウドに移行すると、最も遠い距離が手の届く範囲になります。インターネット...

OpenStack がインテリジェントなオープンソース インフラストラクチャの自動化を実現する Ussuri バージョンをリリース

[51CTO.comより引用] 2020年、新型コロナウイルスの突発的な流行により、人々の仕事や生活...

SEOにおけるウェブサイトのホーム画面デザインの5つの重要な側面に関する実用的な情報を共有します

ウェブサイトのユーザー エクスペリエンスは、アート、デザイン、プログラミング、戦略、フィードバックを...

キーワードランキングを決定する3つの主要な要素を実践的に共有

ウェブマスターは皆、Baidu のアルゴリズムが最近頻繁に変更されていることを知っていますが、私たち...

SaaS の長所と短所について知っておくべきこと...

[[208634]]クラウド サービスはパッケージ化されたソフトウェアに少し似ています。 SaaS ...