AWS上海AI研究所が開発したDGLグラフニューラルネットワークフレームワークがAmazon SageMakerでリリースされました

AWS上海AI研究所が開発したDGLグラフニューラルネットワークフレームワークがAmazon SageMakerでリリースされました

 

ディープラーニングは近年、自由形式のテキスト、画像、ビデオなどの複雑なデータから複雑なパターンを抽出できる驚異的な能力により、世界中で大きな注目を集めています。ただし、多くのデータセットはこれらのカテゴリに当てはまらず、グラフやネットワークで表現する方が適切です。当然のことながら、畳み込みニューラル ネットワークや再帰型ニューラル ネットワークなどの従来のニューラル ネットワーク アーキテクチャはこのようなデータセットには適しておらず、新しいアプローチが必要であることがわかります。

グラフニューラルネットワーク入門

グラフ ニューラル ネットワーク (GNN) は、今日の機械学習における最もエキサイティングな進歩の 1 つであり、次の参考論文は始めるのに役立ちます。

GNN は、次のデータセットの予測モデルをトレーニングするために使用されます。

ソーシャルネットワークは、グラフを使用して関連する人々のつながりを示し、

顧客とアイテムの相互作用を示すグラフを備えたレコメンデーションシステム、

化学分析では、化合物は原子と結合の図として表されます。

ネットワークセキュリティ、送信元と宛先のIPアドレス間の接続を説明する図、

その他にも多数あります!

ほとんどの場合、これらのデータセットは非常に大きく、ラベルが付けられているのはそのうちのごく一部だけです。たとえば、不正行為検出のシナリオでは、特定のユーザーと既知の不正行為者との関係を分析して、彼らが不正行為に関与している可能性を予測します。この問題は、グラフ ノードのごく一部にのみラベル (「詐欺師」または「正当」) が付けられる半教師あり学習タスクとして定式化できます。このようなソリューションは、従来の機械学習アルゴリズムで使用するために、手動でラベル付けされた大規模なデータセットを構築し、それを「線形化」する作業よりも優れたパフォーマンスを発揮します。

これらの問題を解決するには、ドメイン知識 (小売、金融、化学など)、コンピューター サイエンスの知識 (Python、ディープラーニング、オープン ソース ツール)、インフラストラクチャの知識 (トレーニング、展開、モデルのスケーリング) が必要です。しかし、これらすべてのスキルを備えた人はほとんどいないため、DGL グラフニューラルフレームワークや Amazon SageMaker などのツールが必要になります。

DGL グラフ ニューラル フレームワークの紹介

DGL グラフ ニューラル フレームワークは、2018 年 12 月に Github でリリースされました。これは、研究者、データ サイエンティスト、科学者がデータセット上でグラフ ニューラル ネットワークを迅速に構築、トレーニング、評価するのに役立つオープン ソースの Python フレームワークです。


DGL は、PyTorch や Apache MXNet などの一般的なディープラーニング フレームワーク上に構築されています。これらのうち 1 つまたは 2 つ知っていれば、便利であることがわかります。私たちは TensorFlow ファンのことを忘れていません。DGL の次のマイナー バージョンでは TensorFlow の予備サポートが追加され、次のメジャー バージョンでは完全なサポートが期待されています。

どのフレームワークを使用する場合でも、初心者向けの例を使用すれば簡単に始めることができます。また、GTC 2019 ワークショップのスライドとコードも非常に役立ちました。

簡単な例を完了したら、DGL に実装されているさまざまな最先端モデルの探索を開始できます。たとえば、グラフ畳み込みネットワーク (GCN) と CORA データセットを使用してドキュメント分類モデルをトレーニングできます。

  1. $ python3 train.py --dataset cora --gpu 0 --self-loop

すべてのモデルのコードを検査および調整できます。 AWS チームはこれらの実装を慎重に検証し、パフォーマンスを確認し、結果が再現できることを確認しました。

DGL には、簡単にダウンロードして実験できるグラフ データセットのコレクションも含まれています。

もちろん、DGL をローカルにインストールして実行することもできますが、エクスペリエンスをよりシンプルでスムーズにするために、PyTorch および Apache MXNet ディープラーニング コンテナに追加しました。これにより、Amazon SageMaker で DGL を簡単に使用できるようになり、個々のサーバーを管理することなく、モデルの大規模なトレーニングとデプロイが容易になります。

WuXi AppTec は、世界的な医薬品および医療機器サービス企業です。新薬の開発は複雑で費用がかかり、長いプロセスであり、通常は26億ドルの費用がかかり、平均12年かかります。このプロセスをスピードアップするために、WuXi AppTec のコンピューター支援医薬品設計 (CADD) チームは、候補となる薬物分子の薬物特性を予測するニューラル ネットワーク モデルを調査してきました。従来の方法を使用すると、科学者はモデルの構築と検証、およびそれを適用するために必要なコンピューティング リソースの設定に数週間、場合によっては数か月を費やします。 DGL と Amazon SageMaker は、科学者に薬物特性予測モデルを迅速に展開するソリューションを提供し、モデリング時間を 5 分の 1 に短縮して、医薬品開発プロセスを加速します。

Bio-Techne は、世界中の研究者や臨床医にサービスを提供するグローバルなライフサイエンスおよび診断会社です。同社の製品ポートフォリオには、500,000 を超える高品質の試薬、機器、臨床管理、組織および液体生検診断テストが含まれています。幅広い顧客に対して、効率的かつ有意義な方法で製品を整理し、推奨することが重要になります。 Bio-Techne Data Labs は、現在の推奨アルゴリズムを改善するために、AWS と連携してグラフニューラルネットワーク (GNN) の使用を積極的にテストしています。 DGL はシンプルで使いやすい API を通じて実装を簡素化し、開発時間を数か月から数週間に短縮します。 BioTechne の評価結果によると、DGL を使用して実装された GNN ベースの推奨モデルによる上位 10 件の推奨は、非 GNN モデルの推奨よりも 70% 正確です。 Bio-Techne は今後もこれらのモデルを最適化し、DGL と Amazon SageMaker を使用して推奨アルゴリズムを正式に導入していきます。

DGL の開発は、2018 年末に設立された AWS 上海人工知能研究所によって推進され、米国パロアルトの MXNet 科学チームとの緊密な協力により完了しました。

<<:  最適なパフォーマンスを得るために Tomcat と JVM のパラメータを調整するにはどうすればよいでしょうか?

>>:  AWS が AWS Wavelength を開始

推薦する

Shardhost プロモーションモデル 1G メモリ KVM/VPS 簡単評価

昨日、shardhost からプロモーション メールを受け取った後、Hostcat はすぐに「Sha...

UC Yu Yongfu: インターネットの変化の背後にあるロジック: 橋頭保、収益化、規模の効果

「統合」と「同盟」は2013年の中国インターネットのキーワードであり、その背後にはモバイルインターネ...

考察: ヌンチャクの力と SEO 最適化の技術

ちょっとわかりにくいですね。ヌンチャクのスキルと SEO の関係は何でしょうか? 太極拳が SEO ...

毎日の話題:DianpingのEle.meへの投資は、食品配達O2O市場の獲得を狙っているのか?

A5ウェブマスターネットワーク(www.admin5.com)は5月6日、食品配達ウェブサイトEle...

正直に言うと、SEO 業界はどれくらい奥が深いのでしょうか?

SEO は 1997 年に始まり、百度よりも古い 15 年以上の歴史があると一般に認識されています。...

販売効果の高いソフトな記事タイトルの書き方

ソフト記事はオンライン販売の強力なツールです。タイトルはわずか数語ですが、その効果はソフト記事全体の...

CKA 認定の合格率を向上: Kubernetes Ingress 7 層プロキシの完全ガイド!

1. Ingress の紹介Ingress は、外部リクエストをクラスター内のサービスに送信する K...

ウェブ編集者になってどれくらい経ちますか?なぜまだ小さな編集者のままなのでしょうか?

今日、ウェブ編集者の職に就く新しい人が面接に来ました。何気ない会話の中で、私は彼にウェブ編集者の仕事...

Taobao Liveは「分散化」しているのか?

来月には618電子商取引テストが行​​われますが、昨年のヴィヤと李佳琦という2大アンカーの100年に...

Lefeng.comの親会社は、シリーズBの資金調達で4000万ドルを調達したと発表した。

4月26日午後、東方鳳星グループは、Bラウンドで中国国際金融公社(CICC)と中国ブロードバンド基金...

クラウド コンピューティング市場はどれくらいの資金を消費しているのでしょうか? 19のクラウドベンダーが2017年に638億ドルを費やした

ウォールストリート・ジャーナルのウェブサイトによると、2017年に米国の3大クラウドサービスプロバイ...

「コミュニティ3.0」の解釈

Community 3.0 は、スマートフォンで使用されるコミュニティ アプリケーションを指します。...

liquidweb vps-35% 割引コード/完全管理型 VPS/ハイエンドユーザー向け

Liquidweb はブランドとして大きすぎるのでしょうか、それとも価格が高すぎるのでしょうか?主な...

deepnetsolutions-$2/512M メモリ/50G ハードディスク/500G トラフィック/ロサンゼルス/モントリオール

deepnetsolutions には、ロサンゼルス、モントリオール、マイアミの 3 つのデータ セ...