先週、Github で最も人気のあるプロジェクトは、最近バージョン 2.0 に更新された自然言語処理 Python ライブラリ spaCy でした。 SpaCy は、自然言語処理の研究に基づいて作成されたオープンソース プロジェクトであり、最終的には実際の製品やソリューションに使用することを目的としています。バージョン 2.0 では、新しいニューラル ネットワーク モデル、より多くの言語のサポート、ドキュメントの改善など、いくつかの新機能が追加されています。 SpaCy の作者である Matthew Honnibal 氏は、リリース ノートで、新しいバージョンでは最先端のディープラーニング技術を使用して spaCy が更新され、スケーラブルなクラウド コンピューティング ワークフローで spaCy を実行しやすくなると書いています。 新しいバージョンには、7 つ以上の言語に対応した 13 のニューラル ネットワーク モデルが含まれています。また、8 つの新しい言語 (英語、ドイツ語、スペイン語、ポルトガル語、フランス語、イタリア語、オランダ語、多言語 NER) のアルファ トークン化サポートも追加されました。小さなテーブルで大きな語彙をサポートするために、ブルーム埋め込み戦略を使用します。コア ニューラル ネットワーク モデルには品詞タグ、依存タグ、名前付きエンティティが含まれ、小規模モデルにはコンテキスト固有のトークン ベクトルのみが含まれ、中規模モデルには単語ベクトルが含まれます。 このバージョンでは、使用ガイド、API ドキュメント、コード例のほとんどが書き直されました。ドキュメントには、カスタム処理パイプライン、視覚化ツール、トレーニング チュートリアル、単語ベクトル、ルールベースのマッチングに関する情報が含まれています。重要な概念の説明と図解、およびライブラリの機能の概要が記載された spaCy 101 ガイドができました。 1 週間前にバージョン 2.0 にアップデートして以来、いくつかのバグを修正し、ビデオの追加、トレーニングのヒントと提案のセクションの更新などによりドキュメントをさらに更新するバージョン 2.0.3 がリリースされました。 先週 Github で最も人気のある他の 5 つのプロジェクト (トレンドランキングに基づく。興味のある方は、Github でプロジェクト名を直接検索して詳細情報を確認できます)。
|
<<: 第7回中国クラウドコンピューティング標準およびアプリケーション会議が開催されます
>>: K8sとDockerコンテナ管理プラットフォームをベースにしたMomoのアーキテクチャプラクティス
cmivpsは、香港のVPSを全面的にアップグレードし、CN2 CIAネットワーク(アウトバウンドル...
ウェブサイトの責任者となると、大変な日々を過ごすことになります。多くのウェブマスターは、最初は初心者...
windowsvps.host は比較的新しい企業で、主に米国ダラスとヨーロッパのドイツのデータセン...
テンセントは、トラフィック量が非常に多いWeChatとQQという2つのサービスを頼りに、知人同士のソ...
ノルマンディー上陸作戦というと、イギリス、フランスなどの連合軍がフランスのノルマンディーに上陸し、第...
みなさん、こんにちは。私は長い間記事を書いていませんでした。私はインターネット企業で 6 年間働いて...
最近、多くの消費者が、航空券代理店のウェブサイトによる詐欺的な販売に遭遇しています。これらの代理店は...
人工知能、クラウドコンピューティング、モノのインターネット、スマート端末、ビッグデータなどの新世代情...
現在、SEOネットワークの最適化を理解する人はますます増えています。このような競争の激しい市場で勝つ...
世界的危機における事業中断による損失を最小限に抑えることを目指す公衆衛生上の緊急事態に直面し、多くの...
Baidu は世界最高の中国の情報検索および配信技術プロバイダーであり、同社は「世界最大の中国の検索...
更新されていない新しいサイトのスナップショットは、確かにウェブマスターにとって最も厄介なことですが、...
最近、国際的に権威のある調査機関であるガートナーは、「2020 年パブリック クラウド インフラスト...
世の中にはさまざまなタイプのウェブサイトがあります。どのようなタイプのウェブサイトであっても、オンサ...
仮想化技術とはコンピュータにおける仮想化とは、サーバ、ネットワーク、メモリ、ストレージなど、コンピュ...