アリババDAMOアカデミーが中国コミュニティ向けに最大の事前学習済み言語モデルPLUGをリリースし、CLUEカテゴリーリストで新記録を樹立

アリババDAMOアカデミーが中国コミュニティ向けに最大の事前学習済み言語モデルPLUGをリリースし、CLUEカテゴリーリストで新記録を樹立

4月19日、アリババDAMOアカデミーは、中国コミュニティ向け最大規模の事前トレーニング済み言語モデルであるPLUG(言語理解と生成のための事前トレーニング)をリリースしました。このモデルはパラメータスケールが 270 億で、言語理解と生成機能を兼ね備えています。小説の執筆、詩の生成、インテリジェントな質疑応答などの長いテキスト生成分野で優れたパフォーマンスを発揮します。その目標は、超大規模モデルの機能を通じてさまざまな中国語 NLP タスクのパフォーマンスを大幅に向上させ、人間のパフォーマンスを超えるパフォーマンスを実現することです。 PLUG は発売後、中国語理解力評価ベンチマークの CLUE 分類リストで新記録を樹立しました。

OpenAIが昨年、超大規模事前学習済み言語モデルGPT-3をリリースし、世界的な議論を巻き起こして以来、中国分野における同様のモデルの学習進捗は大きな注目を集めている。 GPT-3と同様に、アリババ・ダモ・アカデミーがリリースしたPLUGは、テキスト生成の分野で広く使用され、「ユニバーサルライティングツール」になることが期待されています。さらに重要なのは、このような超大規模モデルは汎用性が極めて高く、AI時代の新たなインフラの一つになると考えられていることです。

GPT-3 に対する改善点は、PLUG が DAMO アカデミーによって開発された言語理解と言語生成のデュアル モデルを統合する簡潔なモデル フレームワークを設計し、入力テキストの双方向理解機能を構築することで出力テキストの関連性を大幅に向上させたことです。言語理解タスクでは、PLUG は 80.614 ポイントで CLUE 分類リストの記録を更新しました。言語生成タスクでは、PLUG の複数のアプリケーション データは、業界最高レベルと比較して 8% 以上向上しました。

(注:4月19日、PLUGはCLUEカテゴリーリストで「Human」に次ぐ第2位という新記録を樹立しました)

PLUG は、ニュース、小説、詩、質疑応答など、幅広い種類と分野をカバーする 1TB を超える高品質の中国語テキストトレーニングデータを使用していると理解されています。モデルのトレーニングには、Alibaba Cloud の EFLOPS 高性能 AI コンピューティング クラスターを活用しています。今後、PLUGはパラメータスケールを2000億に拡張し、テキスト生成の品質をさらに向上させます。超大規模事前学習モデルの分野では、中国発のPLUGのリリースに加え、アリババDAMOアカデミーとアリババクラウドコンピューティングプラットフォームチームは、アリババAI研究所、清華大学と共同で、認知向けの新たな超大規模事前学習モデル「Wenhui」をリリースしたほか、清華大学と共同で超大規模マルチモーダル事前学習モデル「M6」をリリースした。

DAMO Academyは、PLUGのリリースと並行して、近い将来にアリババの深層言語モデルシステムの重要なモデルのほとんどをオープンソース化すると発表した。アリババDAMOアカデミー言語技術研究所所長Si Luo氏は、「DAMOアカデミーのNLPチームは、自然言語処理の分野における科学的研究の課題にさらに取り組み、中国語と言語間の人工知能インフラを改善し、AIを理解可能にし、汎用人工知能への道を模索していきます」と語った。


<<:  九江にJDシティデジタル経済産業パークが設立され、デジタルインテリジェンスで長江経済ベルトの変革とアップグレードを推進しています。

>>:  クラウドでデジタルコアを構築する方法

推薦する

ソーシャルメディアマーケティング評価のための100の参考指標

ソーシャル メディア マーケティング評価の主なパラメーターには、ネットワーク トラフィック、オンライ...

Yunbase、ロサンゼルスのCN2GIA、国内外の高防御サーバー、最大500GのDDoS防御、CC攻撃を無視

Yunjiは2009年に設立され、現在は主に国内外で高防御の独立サーバーを提供しており、安定した高防...

SEO最適化の結果を検出し、SEO最適化への近道を見つける方法を学びます

現在、ウェブサイトのSEO最適化を行う際には、通常、ユーザーエクスペリエンスを向上させながら、高品質...

tragicservers-半額/$3.5/4コア/1gメモリ/65gハードディスク/2Tトラフィック/アジア最適化

tragicserversさん、私はいつもこの名前はひどいといつでも言っていますが、最近、グループの...

クラウドコンピューティングへの投資を最適化する方法

多くの組織は、業務をクラウドに移行することで、クラウド コンピューティングの拡張性、柔軟性、アクセシ...

百度の提携で勝利するのはどの医療・健康ウェブサイトでしょうか?

インターネットの発展に伴い、10年以上の蓄積を経て、ほとんどのウェブサイトは草の根時代の急成長を経験...

「中国版YouTube」の歴史

少し前に、私は友人の輪の中で次のような質問を投稿しました。この質問は非常に興味深いです。この瞬間、あ...

Baidu でウェブサイトを復元した私の体験

多くのウェブマスターのトラフィックの大部分は検索エンジンから来ていると思います。もちろん、一部のウェ...

ウェブサイトの降格の兆候と、この現象の根本的な原因について話す

SEOERがサイトを運営していると、必ず「痛い」ことに遭遇します。それは「解放前の時代に戻った」状況...

ウェブサイトを運営するウェブマスターはテレビを無視してはならない

多くの人が、Baidu Hot List や Google Hot List を使用してキーワードの...

クラウドに移行する前に実行すべき 6 つのステップ

[[276793]] [51CTO.com クイック翻訳] あなたのビジネスはクラウドに移行する準備...

Linodeはどうですか?オランダのアムステルダム データ センターのクラウド サーバーのレビュー

Linodeは、ヨーロッパの重要なデータハブであるオランダのアムステルダムにデータセンターを開設し、...

簡単な分析: 成功したSEO担当者がウェブサイトの掲載をスピードアップする方法

Baidu のウェブサイトのインデックス作成速度は、多くの草の根ウェブマスターを常に悩ませてきました...

eurobyte: 31元から、ロシア/オランダ、無制限のトラフィックKVM仮想VPS、//中国人はもっと少なくすべき

Eurobyte は 2010 年に設立されたロシアのホスティング会社です。同社の事業は仮想ホスティ...

RBAC を使用して Kubernetes リソースへのアクセスを制限する

この記事では、Kubernetes RBAC 認証モデルを最初から再作成する方法と、Roles、Cl...