先週、Github で最も人気のあるプロジェクトは、最近バージョン 2.0 に更新された自然言語処理 Python ライブラリ spaCy でした。 SpaCy は、自然言語処理の研究に基づいて作成されたオープンソース プロジェクトであり、最終的には実際の製品やソリューションに使用することを目的としています。バージョン 2.0 では、新しいニューラル ネットワーク モデル、より多くの言語のサポート、ドキュメントの改善など、いくつかの新機能が追加されています。 SpaCy の作者である Matthew Honnibal 氏は、リリース ノートで、新しいバージョンでは最先端のディープラーニング技術を使用して spaCy が更新され、スケーラブルなクラウド コンピューティング ワークフローで spaCy を実行しやすくなると書いています。 新しいバージョンには、7 つ以上の言語に対応した 13 のニューラル ネットワーク モデルが含まれています。また、8 つの新しい言語 (英語、ドイツ語、スペイン語、ポルトガル語、フランス語、イタリア語、オランダ語、多言語 NER) のアルファ トークン化サポートも追加されました。小さなテーブルで大きな語彙をサポートするために、ブルーム埋め込み戦略を使用します。コア ニューラル ネットワーク モデルには品詞タグ、依存タグ、名前付きエンティティが含まれ、小規模モデルにはコンテキスト固有のトークン ベクトルのみが含まれ、中規模モデルには単語ベクトルが含まれます。 このバージョンでは、使用ガイド、API ドキュメント、コード例のほとんどが書き直されました。ドキュメントには、カスタム処理パイプライン、視覚化ツール、トレーニング チュートリアル、単語ベクトル、ルールベースのマッチングに関する情報が含まれています。重要な概念の説明と図解、およびライブラリの機能の概要が記載された spaCy 101 ガイドができました。 1 週間前にバージョン 2.0 にアップデートして以来、いくつかのバグを修正し、ビデオの追加、トレーニングのヒントと提案のセクションの更新などによりドキュメントをさらに更新するバージョン 2.0.3 がリリースされました。 先週 Github で最も人気のある他の 5 つのプロジェクト (トレンドランキングに基づく。興味のある方は、Github でプロジェクト名を直接検索して詳細情報を確認できます)。
|
<<: 第7回中国クラウドコンピューティング標準およびアプリケーション会議が開催されます
>>: K8sとDockerコンテナ管理プラットフォームをベースにしたMomoのアーキテクチャプラクティス
3月24日現在、ビットコイン取引所マウントゴックスの破産危機はまだ収まっていないが、最近苦境に陥った...
インターネット時代に中小企業がより発展するためには、インターネットマーケティングを通じて影響力を高め...
先週金曜日、淘宝連盟「武林会議」が杭州で開催されました。会議で、タオバオ・アライアンスは、アリママが...
yesuphost.com を紹介します。カナダに 4,000 平方フィート以上の面積を持つ独自のコ...
「デジタルマーケティングの時代は終わった」とプロクター・アンド・ギャンブルのグローバルマーケティング...
中国版Facebookとして知られるソーシャルネットワーキングサイトRenrenが変革を求めている。...
9月18日、2020年杭州雲旗大会において、アリババクラウドは金融機関のリスク管理、マーケティング、...
2012 年 6 月以来、Baidu はランキング アルゴリズムの更新を止めていません。数え切れない...
ガートナーは、2027 年までに、生成型人工知能 (生成型 AI) を導入する企業の 70% が、持...
早速本題に入り、無意味な話はやめましょう。より大きなローカルウェブサイトとして、ローカル人材ネットワ...
現在、Weibo はソーシャル スペースであるだけでなく、一部の企業にとってはマーケティング プラッ...
Taobao の顧客プロモーションに関しては、多くの人が Baidu Knows を使用して製品や ...
ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス突然の疫病の発生により、...
最近、私の友人が非営利のウェブサイトを売りたいと考えており、交渉中の買い手がいたものの、価格に合意で...
1. 広告をクリックするために特別に設計された自動クリック プログラムまたはアプリケーションを使用す...