アリババDAMOアカデミーが中国コミュニティ向けに最大の事前学習済み言語モデルPLUGをリリースし、CLUEカテゴリーリストで新記録を樹立

アリババDAMOアカデミーが中国コミュニティ向けに最大の事前学習済み言語モデルPLUGをリリースし、CLUEカテゴリーリストで新記録を樹立

4月19日、アリババDAMOアカデミーは、中国コミュニティ向け最大規模の事前トレーニング済み言語モデルであるPLUG(言語理解と生成のための事前トレーニング)をリリースしました。このモデルはパラメータスケールが 270 億で、言語理解と生成機能を兼ね備えています。小説の執筆、詩の生成、インテリジェントな質疑応答などの長いテキスト生成分野で優れたパフォーマンスを発揮します。その目標は、超大規模モデルの機能を通じてさまざまな中国語 NLP タスクのパフォーマンスを大幅に向上させ、人間のパフォーマンスを超えるパフォーマンスを実現することです。 PLUG は発売後、中国語理解力評価ベンチマークの CLUE 分類リストで新記録を樹立しました。

OpenAIが昨年、超大規模事前学習済み言語モデルGPT-3をリリースし、世界的な議論を巻き起こして以来、中国分野における同様のモデルの学習進捗は大きな注目を集めている。 GPT-3と同様に、アリババ・ダモ・アカデミーがリリースしたPLUGは、テキスト生成の分野で広く使用され、「ユニバーサルライティングツール」になることが期待されています。さらに重要なのは、このような超大規模モデルは汎用性が極めて高く、AI時代の新たなインフラの一つになると考えられていることです。

GPT-3 に対する改善点は、PLUG が DAMO アカデミーによって開発された言語理解と言語生成のデュアル モデルを統合する簡潔なモデル フレームワークを設計し、入力テキストの双方向理解機能を構築することで出力テキストの関連性を大幅に向上させたことです。言語理解タスクでは、PLUG は 80.614 ポイントで CLUE 分類リストの記録を更新しました。言語生成タスクでは、PLUG の複数のアプリケーション データは、業界最高レベルと比較して 8% 以上向上しました。

(注:4月19日、PLUGはCLUEカテゴリーリストで「Human」に次ぐ第2位という新記録を樹立しました)

PLUG は、ニュース、小説、詩、質疑応答など、幅広い種類と分野をカバーする 1TB を超える高品質の中国語テキストトレーニングデータを使用していると理解されています。モデルのトレーニングには、Alibaba Cloud の EFLOPS 高性能 AI コンピューティング クラスターを活用しています。今後、PLUGはパラメータスケールを2000億に拡張し、テキスト生成の品質をさらに向上させます。超大規模事前学習モデルの分野では、中国発のPLUGのリリースに加え、アリババDAMOアカデミーとアリババクラウドコンピューティングプラットフォームチームは、アリババAI研究所、清華大学と共同で、認知向けの新たな超大規模事前学習モデル「Wenhui」をリリースしたほか、清華大学と共同で超大規模マルチモーダル事前学習モデル「M6」をリリースした。

DAMO Academyは、PLUGのリリースと並行して、近い将来にアリババの深層言語モデルシステムの重要なモデルのほとんどをオープンソース化すると発表した。アリババDAMOアカデミー言語技術研究所所長Si Luo氏は、「DAMOアカデミーのNLPチームは、自然言語処理の分野における科学的研究の課題にさらに取り組み、中国語と言語間の人工知能インフラを改善し、AIを理解可能にし、汎用人工知能への道を模索していきます」と語った。


<<:  九江にJDシティデジタル経済産業パークが設立され、デジタルインテリジェンスで長江経済ベルトの変革とアップグレードを推進しています。

>>:  クラウドでデジタルコアを構築する方法

推薦する

VMware 仮想ディスク構成の管理方法

[[246488]]仮想ハード ドライブ ファイルは、物理ハード ドライブのように動作するコンテナー...

グーグルの中国への復帰にはウェブ検索も含まれると情報筋が語る

同紙によると、グーグルは中国から撤退してから5年後、上海自由貿易区を橋頭保として「正式に復帰」する予...

SEO担当者の戦略的ビジョンと思考は、ネットワークマーケティング全体にまで及ぶ必要がある

今年の百度の「狂気」は、これまで例を見ないほどだ。アルゴリズムのアップグレードと変更のスピード、そし...

ユーザーエクスペリエンスとSEOの観点からウェブサイトの説明について語る

ウェブサイトの説明は、ウェブサイトのキーワードやタイトルと同様に、ウェブサイトが検索エンジンと通信す...

タオバオのマーケティング戦略のヒント: ブルーオーシャンのニッチ市場

先日、あるネットユーザーが、彼らのTmall店舗は2009年にオープンし、2010年にトップ20に入...

#オランダ VPS# lunarvps-$3.5/KVM/1G メモリ/75g SSD/3T トラフィック/オランダ

LunarVPS は大きなプレッシャーにさらされていると推定されており、プレッシャーを軽減するために...

口コミマーケティングを活用して検索エンジンマーケティング広告の無駄を減らす方法

検索エンジンが登場する前は、企業がオンラインマーケティング活動を行う際に、ポータルを通じてトラフィッ...

間違いなく見落としがちなウェブサイト最適化の詳細

みなさんこんにちは、Junseoerです。前回公開した記事がホームページに推薦されてとても嬉しいです...

ワールドカップ期間中、東球地の1日あたりのアクティブユーザー数は1,000万人を超えた。 UCloudは「クラウドアシスト」の役割を果たした

先日終了した2018年ワールドカップは、夏の間中、数え切れないほどの人々の熱狂を解き放ちました。ファ...

8つの視点から語る:ユーザージャーニーに基づいたチャネル配信方法

ユーザー ジャーニーとは、最初のコンタクトから支払いの完了、製品やサービスの享受に至るまで、ユーザー...

yyyhostはどうですか?ロサンゼルスのハイエンド最適化ラインサーバーの簡単なレビュー

yyyhost(~)は、主に中国本土向けに最適化されたロサンゼルス、香港、韓国ソウルのデータセンター...

ウェブマスターはスパムコンテンツを削除する勇気を持つべきです。

昨年6月28日のビッグKステーション以降の継続的な検索エンジンアルゴリズムのアップグレードを振り返る...

中国と海外の登録ドメイン名の比較

ドメイン名の登録は管理機関によって異なります。一般的に、ドメイン名管理機関はドメイン名ポリシーを策定...

ミニプログラムを開始した後、どのように運用し、宣伝すればよいでしょうか?

月収10万元の起業の夢を実現するミニプログラム起業支援プランインターネットやモバイル インターネット...

2018 年にウェブサイトのランキングが低下した理由は何ですか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますSEOにお...