アリババDAMOアカデミーが中国コミュニティ向けに最大の事前学習済み言語モデルPLUGをリリースし、CLUEカテゴリーリストで新記録を樹立

アリババDAMOアカデミーが中国コミュニティ向けに最大の事前学習済み言語モデルPLUGをリリースし、CLUEカテゴリーリストで新記録を樹立

4月19日、アリババDAMOアカデミーは、中国コミュニティ向け最大規模の事前トレーニング済み言語モデルであるPLUG(言語理解と生成のための事前トレーニング)をリリースしました。このモデルはパラメータスケールが 270 億で、言語理解と生成機能を兼ね備えています。小説の執筆、詩の生成、インテリジェントな質疑応答などの長いテキスト生成分野で優れたパフォーマンスを発揮します。その目標は、超大規模モデルの機能を通じてさまざまな中国語 NLP タスクのパフォーマンスを大幅に向上させ、人間のパフォーマンスを超えるパフォーマンスを実現することです。 PLUG は発売後、中国語理解力評価ベンチマークの CLUE 分類リストで新記録を樹立しました。

OpenAIが昨年、超大規模事前学習済み言語モデルGPT-3をリリースし、世界的な議論を巻き起こして以来、中国分野における同様のモデルの学習進捗は大きな注目を集めている。 GPT-3と同様に、アリババ・ダモ・アカデミーがリリースしたPLUGは、テキスト生成の分野で広く使用され、「ユニバーサルライティングツール」になることが期待されています。さらに重要なのは、このような超大規模モデルは汎用性が極めて高く、AI時代の新たなインフラの一つになると考えられていることです。

GPT-3 に対する改善点は、PLUG が DAMO アカデミーによって開発された言語理解と言語生成のデュアル モデルを統合する簡潔なモデル フレームワークを設計し、入力テキストの双方向理解機能を構築することで出力テキストの関連性を大幅に向上させたことです。言語理解タスクでは、PLUG は 80.614 ポイントで CLUE 分類リストの記録を更新しました。言語生成タスクでは、PLUG の複数のアプリケーション データは、業界最高レベルと比較して 8% 以上向上しました。

(注:4月19日、PLUGはCLUEカテゴリーリストで「Human」に次ぐ第2位という新記録を樹立しました)

PLUG は、ニュース、小説、詩、質疑応答など、幅広い種類と分野をカバーする 1TB を超える高品質の中国語テキストトレーニングデータを使用していると理解されています。モデルのトレーニングには、Alibaba Cloud の EFLOPS 高性能 AI コンピューティング クラスターを活用しています。今後、PLUGはパラメータスケールを2000億に拡張し、テキスト生成の品質をさらに向上させます。超大規模事前学習モデルの分野では、中国発のPLUGのリリースに加え、アリババDAMOアカデミーとアリババクラウドコンピューティングプラットフォームチームは、アリババAI研究所、清華大学と共同で、認知向けの新たな超大規模事前学習モデル「Wenhui」をリリースしたほか、清華大学と共同で超大規模マルチモーダル事前学習モデル「M6」をリリースした。

DAMO Academyは、PLUGのリリースと並行して、近い将来にアリババの深層言語モデルシステムの重要なモデルのほとんどをオープンソース化すると発表した。アリババDAMOアカデミー言語技術研究所所長Si Luo氏は、「DAMOアカデミーのNLPチームは、自然言語処理の分野における科学的研究の課題にさらに取り組み、中国語と言語間の人工知能インフラを改善し、AIを理解可能にし、汎用人工知能への道を模索していきます」と語った。


<<:  九江にJDシティデジタル経済産業パークが設立され、デジタルインテリジェンスで長江経済ベルトの変革とアップグレードを推進しています。

>>:  クラウドでデジタルコアを構築する方法

推薦する

2013年のSEO市場における顧客とネットワーク企業の調和のとれた発展をどのように調整するか

時代の発展に伴い、私たちは変化のスピードに遅れずについていく必要があります。過去 1 年間の Bai...

権限がダウングレードされた後の原因究明と対処方法の事例分析

今朝早く、QQグループで誰かが自分のウェブサイトがダウングレードされたと苦情を言い、何が問題で、どう...

子供向けオンラインコミュニティの台頭とロックキングダムの総合エンターテインメント展開の加速

現在、中国ではさまざまなコンセプトの株が低迷しているが、文化産業を主要事業の一つとするテンセントが発...

ウェブサイト構築の 6 つのステップ: 新しいウェブサイトの重量を改善するのは夢ではありません (パート 1)

Baiduの検査期間の到来に伴い、ますます多くの新規ウェブサイトがウェブサイト構築の谷に向かっていま...

Oracle: オープンソースデータ戦略の台頭

Oracle は業界最大の単一データベースベンダーであり、クラウドコンピューティングとオープンソース...

Baiduに2度禁止され、2度回復した私の個人的な経験

昨年11月、当社は「合肥レンタカー」をメインキーワードとするサイトを引き継ぎました。このサイトを分析...

企業は14のクラウド関連職種を募集中

パンデミック中にクラウドの導入が大幅に増加した後、企業はクラウド インフラストラクチャのセキュリティ...

第三級都市の電子商取引サンプル: 2013 年に規模を競う企業

文:王潔崇本稿では、第三級都市における電子商取引の発展の現状を説明し、これをサンプルとして使用して、...

edgenat の「ロサンゼルス CUVIP」の簡単なレビュー - 米国 Unicom AS4837 ネットワーク シリーズ VPS

Edgenat は、米国ロサンゼルスの Cera データセンターで高帯域幅の VPS を提供していま...

OVHはどうですか?カナダ ボーハルノワ (BHS) データセンター レビュー

ovhはどうですか?カナダではどうですか?カナダはフランス以外で常にOVHのコアデータセンターの一つ...

Red Hat が Microsoft Azure 向けのマネージド Ansible 自動化を提供

オープンソース ソリューションの世界的な大手プロバイダーである Red Hat は本日、業界をリード...

#中秋プロモーション# racknerd: 米国に 5 つの新しいデータセンター、最低 $11/年、KVM/1G メモリ/1 コア/20gSSD/2T トラフィック

Racknerd は、米国にサンノゼ (西海岸)、シカゴ、ダラス、ニュージャージー、アトランタの 5...

企業のウェブサイト最適化では、運用効率を高めるためにマーケティングの双方向モデルを忘れない

多くの企業ウェブサイトのコンテンツは比較的少なく、これは明らかにウェブサイトの最適化における本質的な...

Travel Frog、Jump Jump、これらのゲームがなぜこんなに人気があるのでしょうか?

近頃、日本のゲーム「旅蛙」が中国人の社交界を席巻している。本を読み、食べ、眠り、旅をするカエルの話で...

外国貿易関係者は外国貿易マーケティング文化を知る必要がある

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています1. 貿易...