今週の Github の人気プロジェクトの概要: 自然言語処理 Python ライブラリ spaCy が最もホットです!

今週の Github の人気プロジェクトの概要: 自然言語処理 Python ライブラリ spaCy が最もホットです!

先週、Github で最も人気のあるプロジェクトは、最近バージョン 2.0 に更新された自然言語処理 Python ライブラリ spaCy でした。 SpaCy は、自然言語処理の研究に基づいて作成されたオープンソース プロジェクトであり、最終的には実際の製品やソリューションに使用することを目的としています。バージョン 2.0 では、新しいニューラル ネットワーク モデル、より多くの言語のサポート、ドキュメントの改善など、いくつかの新機能が追加されています。

SpaCy の作者である Matthew Honnibal 氏は、リリース ノートで、新しいバージョンでは最先端のディープラーニング技術を使用して spaCy が更新され、スケーラブルなクラウド コンピューティング ワークフローで spaCy を実行しやすくなると書いています。

新しいバージョンには、7 つ以上の言語に対応した 13 のニューラル ネットワーク モデルが含まれています。また、8 つの新しい言語 (英語、ドイツ語、スペイン語、ポルトガル語、フランス語、イタリア語、オランダ語、多言語 NER) のアルファ トークン化サポートも追加されました。小さなテーブルで大きな語彙をサポートするために、ブルーム埋め込み戦略を使用します。コア ニューラル ネットワーク モデルには品詞タグ、依存タグ、名前付きエンティティが含まれ、小規模モデルにはコンテキスト固有のトークン ベクトルのみが含まれ、中規模モデルには単語ベクトルが含まれます。

このバージョンでは、使用ガイド、API ドキュメント、コード例のほとんどが書き直されました。ドキュメントには、カスタム処理パイプライン、視覚化ツール、トレーニング チュートリアル、単語ベクトル、ルールベースのマッチングに関する情報が含まれています。重要な概念の説明と図解、およびライブラリの機能の概要が記載された spaCy 101 ガイドができました。

1 週間前にバージョン 2.0 にアップデートして以来、いくつかのバグを修正し、ビデオの追加、トレーニングのヒントと提案のセクションの更新などによりドキュメントをさらに更新するバージョン 2.0.3 がリリースされました。

先週 Github で最も人気のある他の 5 つのプロジェクト (トレンドランキングに基づく。興味のある方は、Github でプロジェクト名を直接検索して詳細情報を確認できます)。

  • Git フライトルール: Git を使用するためのプログラマー向けガイド。何か問題が発生した場合、開発者はプロジェクトを調べて、何ができるかを確認できます。

  • 機械学習の問題に対する最先端の結果: 名前が示すように、SoTA はすべての機械学習の問題を解決できます。

  • Node のベスト プラクティス: Node.js のベスト プラクティスのリスト

  • JS コードから SVG フローチャート: JS コードを SVG フローチャートに変換するための視覚化ライブラリ。

  • Tensorflow: 機械学習用のオープンソース ソフトウェア ライブラリ。

<<:  第7回中国クラウドコンピューティング標準およびアプリケーション会議が開催されます

>>:  K8sとDockerコンテナ管理プラットフォームをベースにしたMomoのアーキテクチャプラクティス

推薦する

ウェブサイト分析: Google の新しいナビゲーション バーはどんどん大きくなり、使いにくくなっています

RWW ウェブマスターの Jared Smith が Google の新しいナビゲーション バーのス...

9日間で外国貿易の英語ウェブサイトをGoogle第2位に最適化

私は現在大学3年生で、外国貿易会社でインターンとして働き、GoogleのSEO最適化とウェブサイト構...

raksmart: 香港データセンターサーバーの実際の評価データを共有し、raksmartサーバーがいかに優れているかを伝えます

raksmart はアメリカの老舗データセンターなので、raksmart 香港サーバーについて、また...

企業が収益性の高いウェブサイトを構築するための4つの成功の秘訣

収益性の高いウェブサイトは、ウェブサイトのプロモーションから切り離すことはできません。中国のインター...

ページのユーザーフレンドリーなエクスペリエンスを向上させるための小さなデザインの詳細の分析例

ユーザー エクスペリエンスの最適化 (UEO) は頭痛の種です。Web サイトが魅力的でなければ、存...

通信の制限がなく、承認の遅れもない:深セン大学インテリジェンスはファーウェイクラウドWeLink+OAを通じてオフィス業務を加速

浙江神達智能集団は、スマート観光産業チェーン全体に対する製品革新、産業計画、運用サービスの提供に注力...

JVM の 3 色マーキングと読み取り/書き込みバリア

この記事は、Lao Zheng 氏が執筆した WeChat パブリックアカウント「運用と保守の開発ス...

なぜキーワード最適化を行うのでしょうか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますキーワード...

SosoがSogouに合併された後に残ったいくつかの疑問

今年の中国の検索エンジン業界は「一連の異例の現象」と言える。まず、360の自称第三世代検索エンジンが...

ブランドマーケティングプログラム運用マニュアル

私自身の業務経験や情報をもとにまとめたブランドマーケティング運用マニュアルです。ブランド マーケティ...

hosteons: 米国VPS(データセンター5か所)、50%割引、年間13ドルから、無制限のトラフィック、100Gの高防御機能内蔵、Windows

Hosteons はおそらく長い間プロモーションを行っていないでしょう。現在、安価な G ポート帯域...

ユーザーエクスペリエンスの究極的な分析により、コアランキングアルゴリズムが明らかになる

ユーザーエクスペリエンスに関する記事をたくさん読んだことがあるかもしれません。しかし、この記事を注意...

フリーミアムについて知っておくべき6つのこと

編集者注: 過去数か月間、フリーミアムが実行可能かどうかについての議論が続いています。 IVP のパ...

JVMパラメータを学ぶ前に知っておくべきこと

[[323264]] JVM パラメータとは何ですか?通常、写真を撮るには携帯電話で十分ですが、愛好...

2018 Oracle Cloud Conferenceが盛大に開幕

2018 Oracle Cloud Conferenceが昨日上海で盛大に開幕しました。 「未来に向...