検索エンジンがウェブサイトの不正行為を判断する原理の分析(パート 2)

検索エンジンがウェブサイトの不正行為を判断する原理の分析(パート 2)

検索エンジンがウェブサイトが不正行為をしているかどうかを判断する原理の分析(パート 1)

広州SEOの陳勇氏は、信頼伝播モデル、不信伝播モデル、異常発見モデルという3つの代表的なアルゴリズム(それぞれTrustRankアルゴリズム、BadRankアルゴリズム、SpamRankアルゴリズム)の分析を続けました。

まずTrustRankアルゴリズムを詳しく紹介しましょう

TrustRank アルゴリズムは信頼伝播モデルに属し、基本的に信頼伝播モデルのプロセスに従います。つまり、アルゴリズムのプロセスは次の 2 つのステップで構成されます。

ステップ1: 信頼できるWebページのコレクションを特定する

TrustRank アルゴリズムでは、Web ページを Web ページ コレクションに含めるかどうかを判断するために手動レビューが必要です。手動レビューの作業負荷が大きいことを考慮して、信頼できる Web ページ コレクションを予備的に選択するための 2 つの戦略が提案され、予備コレクションに基づいて手動レビューが実行されます。

*予備選択戦略1:PRスコアの高いWebページ、つまり、PRスコアの高いWebページは信頼できると考えられるため、WebページのPR値を計算した後、少数の高スコアのWebページを予備選択ページセットとして抽出できます。

*予備選択戦略2:逆PR。PR計算プロセスでは、Webページの受信リンクの重みに基づいて計算されます。逆PRはその逆です。Webページの発信リンクの重みに基づいて計算されます。つまり、Webページ間のリンクポイント関係を最初に逆転させ、スコアが高いサブセットを予備選択ページとして選択します。

ステップ2: ホワイトリストに登録されたウェブページから他のウェブページに信頼スコアを特定の方法で広める

このステップでは、TrustRank アルゴリズムの信頼伝播方法は、次の 2 つの仮定に基づいています。

仮定 1: 信頼できる Web ページに近いほど、信頼性が高くなります。ここでの距離は、そのページに到達するために必要なリンクの数を指します。

仮説 2: 高品質の Web ページに含まれるアウトバウンド リンクが少ないほど、その Web ページが指す Web ページが高品質の Web ページである可能性は低くなります。

いわゆる信頼の低下とは、Web ページが信頼できる Web ページから遠く離れているほど、普及を通じて得られる信頼スコアが低くなることを意味します。

いわゆる信頼値均等配分戦略は、Web ページが取得した信頼値を、アウトバウンド リンクの数に応じて均等に配分することです。Web ページに K 個のアウトバウンド リンクがある場合、各アウトバウンド リンクに 1/k の信頼スコアが割り当てられ、そのスコアがアウトバウンド リンクに渡されます。

上記の 2 つの伝播戦略を組み合わせることで、ページ ノード グラフ間で信頼スコアを伝播できます。最終的な計算結果では、信頼スコアが一定レベル以下のページは不正ページとみなされます。

まずはここで分析してみましょう。検索エンジンがウェブサイトが不正行為をしているかどうかを判断する原理分析 (パート 3) では、BadRank アルゴリズムについて説明します。詳細については、私のブログ (http://www.30ly.com) をご覧ください。

この記事はもともと、広州 SEO 陳勇のブログ http://www.30ly.com/?p=205 に掲載されました。

転載の際は転載先を明記してください 

原題: 検索エンジンがウェブサイトの不正を判断する原理の分析(第2部)

キーワード: 検索、エンジン、判断、ウェブサイト、行うかどうか、原則部門、引き受ける、ウェブマスター、ウェブサイトのプロモーション、お金を稼ぐ

<<:  初心者ウェブマスターはSEOの前に自分自身を「最適化」する必要がある

>>:  質の高い記事を書くための3つのポイントについて簡単に説明します

推薦する

Baiduの外部データを分析して対象ウェブサイトのSEOパワーソースを特定する

それは仕事上の職業上の習慣と使命感から来るものであるべきです。Shu Yan が毎日コンピューターの...

VaiCDN: 業界トップクラスの回線(Huawei Hong Kong、3C Premium Network、VPC Premium Network)を備え、速度と防御の両方を考慮した海外の高防御CDN

vaicdn(海外事業者)は主に海外CDN事業を展開しており、業界全体に登録不要の高防御CDNを提供...

vds6 - $2.49/kvm/1g メモリ/10g SSD/1T トラフィック/イタリア/ブルガリア/ウクライナ/オランダ

vds6.net は、それほど昔に設立されたアメリカの企業です。運用サーバーは、オランダのアムステル...

分類情報ウェブサイトを最適化するための3つのヒント

機密情報ネットワークはGanji.comや58.comなどの超大規模ウェブサイトによって独占されてい...

tmthosting: as4837 のシアトル VPS、月払いで 20% オフ、年払いで 30% オフ、40G 防御無料

tmthosting は、Hostcat で初めて紹介されました。現在、tmthosting は春の...

Baidu は検索結果に基づいてページをどのように並べ替えますか?

ご存知のとおり、ウェブサイトの最適化プロセスでは、多くのウェブマスターがウェブサイトのキーワードラン...

統計チャートを使用して業務を支援する方法を教えます

データは、開発者が製品やユーザーをより深く理解するのに役立つ最も直感的な方法です。また、アプリの動作...

外部リンク判定について語るリーさん、まだ冷静ですか?

外部リンクの構築は、常に SEO 担当者の仕事の焦点でした。不正な外部リンクとスパム外部リンクは、B...

事例分析:2つの小さな機能が新たなマーケティングをもたらす

黄家朗著WeChat は多くの小さな機能を備えたソーシャル ツールです。実際、これらの小さな機能をう...

クラウドコンピューティングの価格割引システムを調整することで、Amazon はどれだけの古い顧客を維持できるでしょうか?

[[281968]]海外メディアは、アマゾンのクラウドコンピューティング部門が最近価格割引システムを...

ウェブサイトの構築と運営では、ユーザーのプライバシー保護に注意を払う必要があります

少し前に、ホテルの宿泊客の宿泊予約情報が漏洩し、大きな騒動となりました。それがシステムやウェブサイト...

グリーンクラウドはいかがでしょうか? greencloudvpsはどうですか?ベトナムVPSの簡単なレビュー

Green Cloud のアジア データ センターは、すでに HostCat で香港、シンガポール、...

Armorshark openvz 20% オフ/kvm 50% オフ + SSD/G ポート

Armorshark は 2010 年に設立され、"unspeakable" プ...

「ピンドゥオドゥオ」のグループが「ジャック・マー」と市場を争っている

近年、「エンドゲーム思考」は起業家、投資家、メディアの間で広く使われる頻出語となっている。 「エンド...

5時間で800のマイクロサービスをクラウドに移行しました

9 月 16 日の夕方、FINN の運用環境をローカル データ センターから Google Clou...