アリババが自社開発したAI推論チップがリリース、Hanguang 800は他のチップより10倍強力

アリババが自社開発したAI推論チップがリリース、Hanguang 800は他のチップより10倍強力

[51CTO.comよりオリジナル記事] 9月25日、DAMOアカデミーの張建鋒学長は杭州雲奇カンファレンスでHanguang 800 AI推論チップのテープアウトを実演しました。業界標準のResNet-50テストでは、Hanguang 800は78,563 IPSの推論性能を達成しました。これは、現在の業界最高のAIチップの4倍に相当します。エネルギー効率比は500 IPS/Wで、2位のチップの3.3倍です。 「Hanguang 800は、アリババのチップ分野における長い行進の第一歩です。」

[[277873]] [[277874]]


Pingtou Geは昨年のYunqiカンファレンスで発表されて以来、過去1年間にXuantie 910およびWujian SoCプラットフォームをリリースし、本日Hanguang 800チップをリリースしました。この一連の新製品の発売は、アリババの平頭閣製品ラインが形を整えたことを意味し、現在はプロセッサIP、ワンストップチップ設計プラットフォーム、AIチップをカバーし、チップ設計チェーンの完全なカバレッジを実現しています。

Hanguang 800とは何ですか?

Hanguang 800は推論に重点を置いたAIチップです。人工知能チップの差別化された設計は主にハードウェアアーキテクチャとソフトウェアアルゴリズムに反映されるため、チップの価値を最大化するには、この2つを高度に適応させる必要があります。現時点では、従来の CPU と GPU は、ディープラーニングの推論タスクにおいてハードウェア機能を十分に活用できていません。たとえば、GPU アーキテクチャは主に画像処理用に設計されており、ハードウェア構造とソフトウェア エコシステムがほぼ固定化されているため、AI タスクを深く最適化することは困難です。

パフォーマンスはどうですか?

Hanguang 800 のチップ アーキテクチャに関しては、革新的なアーキテクチャを採用しています。ディープラーニングで使用される大量の重みパラメータやテンソルデータに対して、スパース圧縮や量子化処理をサポートし、独自に設計されたデータアクセスとパイプライン処理技術を使用することで、I/O要件とデータ移動を大幅に削減します。 NPU は、畳み込み、行列乗算、ベクトル計算、およびさまざまな活性化関数も徹底的に最適化します。非常に効率的なハードウェア リソース スケジューリングと完全に並列化されたデータ ストリーム処理により、AI コンピューティングのパフォーマンスとエネルギー効率が最高レベルに引き上げられます。 Hanguang 800 のパフォーマンスの飛躍的向上は、ソフトウェアとハ​​ードウェアの共同イノベーションによるものです。

アルゴリズムの面では、アリババDAMOアカデミーの機械知能研究所は過去2年間で音声知能、言語技術、機械視覚、意思決定知能などの分野を網羅した完全なアルゴリズムシステムを構築し、多くの高レベルの成果を達成しました。ハードウェアに関しては、アリババはサーバー、FPGA、ストレージの分野で長年の研究開発経験を持っています。さらに、Pingtou Ge の技術チームは、アーキテクチャ、コンパイル技術などの分野で深い技術的蓄積を持っています。

1 つの Hanguang 800 チップ = 10 個の GPU


Hanguang 800 のデータパフォーマンスは非常に優れています。現地基調講演のデータによると、Hanguang 800 1 個あたりの性能は GPU の約 10 倍で、エネルギー効率比は 500IPS/W に達します。製造プロセスも12nmを採用しており、トランジスタの数は170億個にも達します。編集者は、同様のAIチップと比較した結果、Pingtou GeのHanguang 800チップも業界で比較的主導的な立場にあると結論付けました。

[[277875]]


漢光800理論性能データチャート

実際のパフォーマンス

Hanguang 800は現在、アリババのコアビジネスで使用されています。雲斉会議での現地デモンストレーションによると、杭州市主要都市の都市脳における交通ビデオのリアルタイム処理には、従来は300msのレイテンシを持つGPUが40個必要だったが、Hanguang 800を使用するとGPUが4個しか必要なくなり、レイテンシは150msに短縮された。また、皆さんがよく使っている Pailitao 製品が高速なのも Hanguang 800 の性能によるものです。 Pailitao 製品ライブラリには毎日 10 億枚の製品画像が追加されており、従来の GPU コンピューティング能力では認識に 1 時間かかりますが、Hanguang 800 を使用すると 5 分に短縮できます。

まとめ:
Hanguang 800の価格はまだ発表されていませんが、この高性能チップはコストパフォーマンスに優れた製品になると信じています。また、Pingtou Ge による一連のチップのリリースは、国産チップにとって大きな進歩を意味します。編集者は近い将来、よりコスト効率の高い国産チップの登場を期待しています。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

[編集者:張斌 TEL:(010)68476606]

<<:  Huawei Cloud、クラウドネイティブ技術の商用化を加速する新しいコンテナソリューションをリリース

>>:  天一クラウドの5G時代の中核競争力は10年間の努力を経て際立っている

推薦する

共同購入ウェブサイトは統合を加速させ、業界トップ10が市場シェアの80%を占めている。

利用者の苦情、レイオフ、事業ラインの縮小、上級役員の辞任など、数々の混乱を経験した後、共同購入業界は...

ユーザー中心のウェブサイト最適化手法の分析

現在、多くのウェブサイト最適化担当者は、Baiduのアルゴリズムが絶えず変化していることにどう対処し...

クラウド移行はトレンドになりつつあるが、依然として4つの大きな課題に直面している。

デジタルトランスフォーメーションの台頭により、クラウドコンピューティングは企業にとって新たなトレンド...

越境電子商取引でSEOを効果的に行うにはどうすればいいでしょうか?

この記事では、越境ECにおけるSEO戦略についてお話しします。 4つの側面から説明してください。 E...

クラウドネイティブアプリケーションセキュリティへのアプローチ

クラウド ネイティブ アプリケーションを保護するには、マイクロサービスによってさまざまな消費者に公開...

個人ウェブサイトはどうすればBaiduへの依存から抜け出せるのでしょうか?

数日前、1,000 を超える IP アドレスを持つ私の小さな Web サイトの 1 つが、不明な理由...

ウェブデザインに手​​描きスタイルを使用すると、ウェブサイトのユーザーエクスペリエンスが向上します。

[コアヒント] 手描き風のスタイルをウェブページに適用してウェブサイトのユーザーエクスペリエンスを向...

Robots.txt プロトコル標準の概要

最近、多くのウェブマスターから「robots.txt」ファイルを正しく設定する方法について質問を受け...

O2O を採用した場合、従来の Witkey ウェブサイトの解決策は何でしょうか?

数日前、北京の顧客がウィットキーのウェブサイトについて私に相談してきました。私たちはウィットキーのウ...

24 クーポンが事業を停止し、利益相反の陰謀に巻き込まれる: 創業者と投資家が宮殿の陰謀を演じる

[国内の共同購入業界の現状から見ると、24quanがIPO段階を維持することは難しく、普通株は裁定機...

ガートナー:ハイブリッドクラウドは主流のアプリケーショントレンドに

世界的な流行と経済減速の影響を受け、中国企業はデジタルビジネス変革を支援するためにクラウド移行のペー...

アプリダウンロード数増加のための3大無料新メディアチャネルの概要と比較!

APP 向けの新しいメディアの最終的な目標は、APP へのダウンロードを促進することです。新しいメデ...

検索エンジンはインターネット上のプライバシーの露出についてどの程度知っているのでしょうか?

Google や Baidu の検索ボックスに検索内容を入力すると、検索エンジンが検索タスクを実行し...

SAP Concur、中国に研究開発センターを設立、インテリジェントな経費管理で中国企業の海外進出を支援

出張・経費管理ソリューションの世界的マーケットリーダーであるSAP Concurは、中国の顧客向けに...

GAを使用してSEOパフォーマンスを監視する

書き出しの書き方がわからず、とにかく少し混乱しています。今日は、私自身のヒントをいくつか共有したいと...