百度のハリケーンアルゴリズムが登場。アルゴリズムのヒット範囲を独占公開

百度のハリケーンアルゴリズムが登場。アルゴリズムのヒット範囲を独占公開

最近、百度は悪質なまとめサイトを取り締まるためにハリケーンアルゴリズムを導入しました。残念ながら多くのサイトが影響を受け、一夜にしてトラフィックは解放前のレベルに戻りました。私はBaiduとGoogleのドキュメントを研究し、アルゴリズムのヒット範囲を詳細に特定しました。

百度の発表

まず、Baidu の公式発表を見てみましょう。次のようになります。

百度検索は最近、ハリケーンアルゴリズムを導入しました。これは、悪質なコレクションを主なコンテンツソースとするウェブサイトを取り締まることを目的としています。同時に、百度検索はインデックスライブラリから悪質なコレクションリンクを完全に削除し、高品質のオリジナルコンテンツにさらに多くの表示機会を提供し、検索エコシステムの健全な発展を促進します。
ハリケーン アルゴリズムは定期的にペナルティ データを生成し、状況に応じていつでも調整および反復されます。これは、Baidu Search の不正な収集に対するゼロ トレランスの姿勢を反映しています。高品質のオリジナル サイトでは、サイト インデックス ボリュームが大幅に減少し、トラフィックが大幅に減少していることに気付いた場合は、フィードバック センターでフィードバックを提供できます。

ハリケーンアルゴリズムの分析

公式文書によると、ハリケーンアルゴリズムは Web ページではなくサイトを対象としています

不良コンテンツを含むすべてのサイトではなく、不良コレクションを主なコンテンツソースとして使用している Web サイトを主にターゲットとします (少量の不良コレクションコンテンツはヒットしません)。

悪いコレクションとみなされるものは何ですか?

適切に収集されていないコンテンツとは、通常、必要な時間、労力、専門知識、または専門技術を手動で統合していないコンテンツ、またはユーザーに付加価値を提供しないコンテンツを指します。

この部分には次の種類のコンテンツが含まれます。

  1. 他のサイトから収集したコンテンツ。これには、収集されるページ コンテンツ全体、収集される主題コンテンツ、または収集された複数の記事からまとめられたコンテンツが含まれます。このタイプのコンテンツは簡単に識別できます。
  2. 収集後に軽く加工したコンテンツです。これには、一部の単語の修正、一部の文の修正、または単語の一括置換(一部の疑似オリジナル ツール)の使用が含まれます。このタイプの識別は少し難しいです。
  3. いくつかの動的サイトから収集されたコンテンツ。他の検索エンジン(Huoduan 検索)からの検索結果の収集やニュース フィード ストリームの収集など。

メインコンテンツ悪いコレクション、付加価値など、いくつかの重要なポイントに注意してください。

悪意のあるコレクションとはみなされないコンテンツは何ですか?

グループ内の友人の中には、doc.comやLangなどの一部のウェブサイトが影響を受けなかったのはなぜかと尋ねる人もいました。実際、ある一定のポイントが達成されていれば、それは悪いコレクションとはみなされず、そのポイントとは、ユーザーに付加価値をもたらすことです。

付加価値には、サイトゲインコンテンツゲインの2種類があります。ここで、Baidu Search Technology Blog の「インターネット ページの価値に関する簡単な説明」から引用します。

誰かがニュースイベントに関するオリジナルのブログ投稿を公開し、それが Sina のニュースチャンネルに再投稿されました。これは、説明されている内容の繰り返しです。しかし、この繰り返しはメインコンテンツの繰り返しに過ぎません。一方で、その再掲載はアクセス速度、安定性などの面でメリットをもたらし、その後の検索ユーザーも「ニュースイベント+Sina」を使用してこのニュースを検索する可能性があります。これをサイトゲインと呼ぶことができます。一方、転載の過程でページのタイトルが変わることもあり、読者によっては転載ページにさらに価値の高いコメントや返信が寄せられたり、他の関連イベントへのニュースリンクが掲載されたりすることもあります。これらはコンテンツゲインと呼ぶことができます。そのため、主題の内容に変更がなくても、Sina の再版は依然として価値があり、希少性も比較的高いです。
一方で、同様に転載先のウェブサイトがあまり知られていない場合は、サイトの知名度・安定性・速度の向上は期待できません。さらに悪いことに、転載後に大量の広告がページに追加されて読みにくくなったり、コンテンツの不完全な部分だけが転載されたりします。このような転載、つまりコレクションは、単なる繰り返しであり、コレクションソースと比較して検索価値がありません。
まとめると、メインコンテンツが重複しているページについては、サイトゲインとコンテンツゲインがあるかどうかを評価する必要があります。ゲインがまったくない重複ページが大量にある場合にのみ、そのページの希少性が低いと見なす必要があります。

ここでの重要なポイントは、ページの価値利益です。

したがって、サイトの利益、コンテンツの利益、およびユーザーに付加価値をもたらすことができる限り、この Web ページには独自の価値があり、ハリケーン アルゴリズムの影響を受けないことを意味します。

やっと

Baidu の友人が、ハリケーン アルゴリズムは主に価値のないデータを収集するために使用され、一度攻撃を受けると解決策がないと明かしました。高品質なオリジナル作品を誤って破損してしまった場合は、フィードバック センターを通じて異議を申し立てることができます。ハリケーン アルゴリズムによる被害を回避する方法。 (これについては次の記事でお話しします。)

Baidu は最近、コンテンツ エコシステムの構築を最優先に戦略を調整しました。悪質なコンテンツを取り締まることも不可欠です。

コレクションの取り締まりと独創性のサポートがBaiduの検索コンテンツ部門の主要テーマとなり、ハリケーンアルゴリズムは今後も更新され続けると予測します。

次の記事では、ハリケーン アルゴリズムの影響を受けないようにする方法を説明しますので、お楽しみに。

なお、ハリケーン アルゴリズムは繰り返し更新されており、現在ヒットしていないウェブサイトも次回ヒットしない可能性があります。

参考文献

  • インターネット ページの価値に関する簡単な説明 > Google の検索品質評価ガイドライン 2017 年版 (中国語版はまだありません)
  • 百度公式発表: 百度、悪意あるデータ収集を取り締まるハリケーンアルゴリズムを導入

    原題:百度のハリケーンアルゴリズムが登場、アルゴリズムのヒット範囲を独占公開

    キーワード: 百度

<<:  [百度ハリケーンが来る] 百度ハリケーンアルゴリズムによってウェブサイトがペナルティを受けた場合の対処法

>>:  始めから諦めるまで: SEO をゼロから学ぶ方法

推薦する

実際のクリック数を増やし、ランキングを上げる

Baidu アルゴリズムの継続的な更新により、外部リンクの数はもはやウェブサイトのランキングを決定す...

kvmla-シンガポールVPS、日本VPS、香港VPS、米国VPS、すべて20%オフ

– LLC の kvmla は 9 月に大規模なプロモーションを開始しました。シンガポール VPS、...

あなたと私を救うために何ができるでしょうか?

戦争に直面したとき、SEO が惨めに失敗したら、どうすれば救えるでしょうか? キーワードをどのように...

タイトルとキーワードを設定するための効果的な方法

早速本題に入りましょう。ウェブサイトのタイトルとキーワードをどのように設定するかです。タイトルとは、...

分散機械学習フレームワークRay

[[422916]] Python 中国語コミュニティ (ID: python-china) 1. ...

強みと弱み:個人ウェブサイトが生き残る道

ほとんどの SEO 担当者は、ビジネスを始める目的でこの業界に参入します。オンラインでビジネスを始め...

MetWeb: ウェブサイトをオープンソース化するとはどういう意味ですか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますソース コ...

WordPressのリンク管理の削除からSEOの今後の動向がわかる

12月12日にWordPressがメジャーアップグレードされ、バージョン3.5「Elvin」にアップ...

美団が実店舗共同購入サイト「Mengmai.com」を買収、商品共同購入に回復のチャンス

原題: Meituan が実店舗グループ購入サイト Mengmai.com を買収北京ビジネスデイリ...

私の国のエッジコンピューティング業界の動向:IoTとデータトラフィックが急速な市場拡大を促進

[[352588]]エッジ コンピューティングとは、ネットワーク、コンピューティング、ストレージ、ア...

銀行間引き出しの失敗が分散取引に関する考えを引き起こした

シナリオ皆さんはこんな状況に遭遇したことがあるでしょうか。たとえば、ATM でお金を引き出すとき、1...

共同ブランディングマーケティングのガイド!

短くて太い黄色い体、平たい口、交互に踊る手…。かつて世界中で人気を博したポケモンのモンスター「コダッ...

Vue2.x の仮想 DOM 差分原理の詳細な理解

1. はじめにVue の核となるのは双方向バインディングと仮想 DOM (以下、vdom と呼びます...

CCTV 3.15ガラで暴露されたWeChat詐欺は根絶が困難、根本的な原因は「双方向の閉鎖」

先週末に終了したCCTV 3.15ガラでは、寸劇を使って3種類の詐欺を再現した。1つ目は通常の電話詐...

tmhhost: 15% オフ プロモーション、ロサンゼルス cera データ センター、KVM 仮想 VPS、月額 30 元から

新規加盟店のtmhhostは現在、米国のceraデータセンターでライン163を使用してKVM仮想化に...