Baidu 8.25 アップデートへの対処方法: 記事の内容

Baidu 8.25 アップデートへの対処方法: 記事の内容

Baiduが新たなアップデートを開始し、多くのサイトに影響を与えています。前回の大規模なKサイト削除から2か月が経ちました。今回の大きな特徴は、多くのオリジナルサイトが影響を受け、影響の範囲が前回よりもさらに大きいことです。残念ながら、私のブログもこの影響でホームページからK削除されました。多くのウェブマスターは、独創性が尊重されるのに、なぜ私のオリジナルサイトが処罰されるのか、そしてそれらのゴミサイトは大丈夫なのかと疑問に思わずにはいられません。趙氏は最近、私の手にあるいくつかのサイトと私の友人のサイトの反応を観察し、ここでいくつかの推測と分析を行っています。

私の意見を述べる前に、私は決して Baidu の代理人ではないことを述べておきたいと思います。私のブログは完全にオリジナルであり、私の経験と努力を体現したものですが、それでもホームページから削除されました。私の前回の記事「6.28 Baidu KステーションからBaidu SEOの今後の動向を見る」がさまざまなサイトに転載された後、興奮したウェブマスターの一部が私のブログを訪れ、不満をぶちまけました。しかし、あなたがどれだけ不満をぶちまけたり、私に怒りをぶつけたりしても、Baiduは更新する必要があるものを更新し続け、今また更新しています。私たち SEO 担当者がしなければならないのは、Baidu の変化に適応することです。

それでは、このアップデートの前後で Baidu がどのような変更を加えたかを思い出してみましょう。

1. 8月に入ってから、医療業界やSEO業界を中心に、多数のサイトのホームページのスナップショットが更新されませんでした。

2. Lee は 8.22 にアップデートのアナウンスをリリースしました。このアップデートでは、ランダム コレクションとハイパーリンクの不正行為に対する新しいペナルティ ルールが導入されます [この記事では主にコンテンツ部分の新しく導入されたルールについて説明しており、ハイパーリンクについては取り上げていません。ハイパーリンク部分については、今後のブログ投稿で説明します]。同時に、ロビン氏は、検証後、新しいルールはまだ発効しておらず、まずは発表のみが行われたと述べた。

3. 8月25日、多くのウェブマスターが新しいルールによる変化を感じ、多くのサイトが罰せられ、降格され、ランキングが消えました。その中には、百度が取り締まりたいと考えているコレクションサイトもありますが、私のブログのように、影響を受ける純粋にオリジナルなサイトもあります。同時に、いくつかのキーワードの検索結果ページは大きな変化を遂げました。これは主に医療と一部のブランドワードに焦点を当てています。

では、Baidu が行った変更はこれだけでしょうか?

実は、それだけではありません。注意していないと見逃してしまうかもしれない別の変更点があります。今回、Baiduのサイトに対する姿勢は6月のアップデートとは異なります。

趙さんは医療業界に携わっているので、医療関連のサイトをいくつか持っています。以下にスクリーンショットを掲載します。

(図1)

上の図1は私が所有する医療ウェブサイトです。このウェブサイトは5月に急遽立ち上げられ、ある病気の単語に焦点を当てていました。私が最適化した後、6月にはその病気の単語の関連語がBaiduのホームページに掲載されました(病気の単語のホームページ自体は明らかにBaiduが管理しており、すべてサードパーティのプラットフォームウェブサイトのコンテンツページです)。しかし、急いで立ち上げた理由は、テンプレートがまったく作成されず、いつも使用していた Dreamweaver のホームページが十分に美しくなく、ユーザーエクスペリエンスが悪かったためです。 7月2日、Baiduから追い出され、Baiduウェブマスターツールのバックグラウンドで、インデックスボリュームが0に落ちたのが誰もが目にしました。

この間、私はこのサイトを観察してきました。その後、ユーザーエクスペリエンスの良いテンプレートに置き換えられましたが、まだ回復の兆しはありません。当サイトの記事はすべて擬似オリジナルですが、慎重に擬似オリジナル化されており、ユーザーにとって役立ちます。しかし、まだ復旧されていないため、6月に導入されたペナルティメカニズムによって、ユーザーにとって役に立たない記事として特定されるのは当然です。そこで、私はずっとプログラムの観点から、記事がユーザーにとって有益かどうかをどうやって判断できるのかを考えてきました。そこで、可能性を推測してみましたが、そうすることにはデメリットが多すぎると感じました。しかし、8月に百度が発表したルールは私の考えを裏付けており、百度よ、あなたはあまりにも残酷だと言わざるを得ません。

(図2)

上の図 2 は、Baidu Webmaster Tools の背景に表示された私のブログのスクリーンショットです。ここで URL を入力したのは、広告のためではなく、後で分析するために特定の URL が必要になったためです。

私のブログ記事はすべて完全にオリジナルであり、Baidu が大量に見つけることができるジャンク記事ではなく、私の仕事経験に基づいて私が書いた技術記事です。それらは間違いなくユーザーにとって大きな助けになります。私の外部リンクはすべて、他のサイトが私の記事を転載する際の著作権リンクと、他の人の質問に答える際の私の署名の紹介から来ています。質問や回答に対する私の回答はすべて非常に有意義で、人々が実際の SEO 問題を解決するのに役立ちます。それらは seowhy に投稿され、専任のモデレーターによってレビューされます。私の回答の採用率は非常に高くなっています。それらは、署名を残すためだけに私が作成する、ジャンクな返信ではありません。フレンドリーリンクは、私の記事を気に入っている友人たちによって交換されています。私のホームページがブロックされた後も、多くの友人がリンクを削除しないことを主張し続けたことから、このことがわかります。私のブログは検索エンジンを混乱させるようなことは一度もしていないと言えます。

規則を完全に遵守していたこのブログは、8月25日にトップページから排除され、サイト価値の50%以上を失いました。

(図3)

上の画像から、私のブログがこのアルゴリズムのアップデートによって大きな影響を受けていることがわかると思います。しかし、私は文句を言っているのではありません。1点に注目して、図1と図2の違いを比較して欲しいのです。6月にサイトがK化されたとき、それに応じてインデックスボリュームも0に低下していることがわかります。8月に更新されたとき、インデックスボリュームはサイト価値の動向に伴って変化しませんでした。つまり、データは Baidu データベースに残っていますが、ランキング付けされておらず、ランキングが選択されるキャッシュ領域にも含まれていません。

これは皆さんに思い出していただきたいことです。これは、Baidu 自体がアルゴリズムの更新に自信がないことを示しています。今回被害を受けた医療サイトのほとんどは、私のブログよりも良い結果が出ました。ホームページは生き残りましたが、ランキングはすべて失われました。考えてみてください。Baidu が自社のアルゴリズムに十分自信を持っているのであれば、LEE 氏が言うように、悪いユーザー エクスペリエンスを提供する不正サイトを取り締まるはずです。不正サイトは、引き続きデータを保存してランキングを調整するのではなく、6 月と同じ方法で排除されるべきではないでしょうか。

では、なぜこのようなことをするのでしょうか? 今回のアルゴリズムでは何が問題になったのでしょうか?

趙氏は、サイトの方向性としては主に2つの言葉で表現されており、この2つの言葉が独創的であると考えています。手作業で確認しても、記事がオリジナルかリライトかを判断するのは難しい場合があります。そのため、検索エンジンは、たとえ膨大な量のデータを基にしていたとしても、プログラムがオリジナルの記事を識別できるように支援する機能を 1 つ以上備えている必要があります。 「検索エンジンの動作の基本プロセスと原則」という記事では、検索エンジンがファイルを保存する方法について説明しました。ここでもう一度繰り返します。

検索エンジンは、この Web ページのキーワードを取得すると、独自の単語分割システムを使用してテキストを単語分割リストに分割し、データベースに保存して、テキストの URL と 1 対 1 で照合します。スパイダーがクロールしたページの URL が http://www.seozhao.com/2.html であり、このページで上記の操作を行った後に検索エンジンが抽出したキーワード セットが p であり、p がキーワード p1、p2、...、pn で構成されている場合、Baidu データベースでは、それらの関係は 1 対 1 になります (下図を参照)。

(図4)

そして、検索エンジンが記事がオリジナルかどうかを判断するとき、処理対象は単語分割後の記事のキーワードセット p でなければなりません。それでは、検索エンジンが求める決定的な特徴について推測してみましょう。

中国語の文構造には、主語、述語、目的語、形容詞、副詞、補語しかありません。品詞的には、内容語と機能語の2つのカテゴリがあります。そのうち、内容語は名詞、形容詞、数量詞、代名詞です。機能語には、副詞、接続詞、前置詞、助動詞、感動詞、擬音語などがあります。ここまで書いてきて、経験豊富な SEO 担当者なら、以前疑似オリジナリティを実行していたときは、基本的にコンテンツ ワードをターゲットにしていたことを知っているはずだと私は思います。機能語を使った疑似オリジナリティは基本的にあまり効果的ではないからです。疑似オリジナリティの鍵は「疑似」という言葉にあります。私たちは百度を騙し、非オリジナルコンテンツをオリジナルだと誤解させ、それを疑似と呼んでいます。今回、百度は疑似コンテンツを特定しました。

(図5)

図5は、百度の偽オリジナリティに対する公式回答です。ご覧のとおり、百度はこれに対処しませんでした。百度が態度で対処しなかったのではなく、技術的に対処できなかったのです。会話を通じて、百度にとって、偽オリジナリティは、コレクションなどの他の非オリジナルコンテンツと戦略上何ら変わらないことが皆さんに理解できたと思います。

考えてみましょう。Baidu が擬似識別を識別したい場合、いくつかの SEO 操作に基づいて正確な元の特徴をさらに固定する必要があるため、以前のようにすべての名詞を判断するのではなく、一部の名詞を判断するように変更する必要があります。では、名詞、形容詞、副詞、数量詞、代名詞の中からどれを選択すればよいのでしょうか?

代名詞自体は多くないので、識別のための特徴として使うことはできません。

量指定子についてはどうでしょうか? 下のスクリーンショットをご覧ください。

(図6)

図 6 は、Baidu からの公式回答です。Baidu では、業種ごとに単語分割の結果を異なる方法で処理しており、数量詞に重点を置いていることがわかります。数量詞は百度の独創性を認める特徴の一つであることがわかります。

では、残りの内容語はどうでしょうか。名詞は文の主語となることが多く、具体的なものなので、独創性を判断する基準として当然使われるはずです。形容詞は物事を修飾するために使われ、異なる形容詞で表現すると文章の意味が変わることが多い。これは独創性を判断する特徴の一つであるはずだが、趙氏は今回のアップデートで形容詞から独創性を判断する特徴が剥奪されたり、その影響力が急激に低下したりしていることに気づいた。これは偶発的な怪我の主な原因でもあります。

まとめると、趙氏は、百度が今回コンテンツを変更するために使用したアルゴリズムの1つは、スパイダーがページをクロールした後、ノイズを除去してテキストを取得することだと考えています。テキスト内の単語を分割する際には、文の主語、述語、目的語を個別に抽出し、量詞を使用して他のページと比較します。

例えば、「シャオミンは喜んで醤油を取りに行きました」と「シャオミンは退屈だったので醤油を取りに行きました」は、以前は2つの文として認識されていましたが、現在Baiduはこれを1つの文として認識します。類似性を比較すると、すべて「シャオミン」+「醤油を取りに行きました」に分割されるためです。

検索エンジンから抜け出して、自分の視点で考えてみましょう。自分で書いた記事がユーザーにとって役立つ有意義な記事であれば、主語、述語、目的語の形式に従って記事全体を抽出した後、インターネット上で同じものを見つけることは絶対にできません。

ただ、このように運用するだけでは、大規模な事故は起きません。しかし、割合が加われば、結果は出てきます。比率を追加することは、複数の記事を使用して 1 つの記事を作成しているかどうかを Baidu が識別する方法でもあります。 Baidu はパーセンテージを設定します。テキスト内の主語、述語、目的語が切り取られた後に一定の割合で繰り返されると、オリジナルではないと判断され、その結果が現在の Baidu の検索結果になります。

しかし、この設計自体が必然的に偶発的な怪我につながることになります。先ほども述べたように、形容詞は文の意味を決定する場合があり、形容詞を完全に削除すると、ユーザー エクスペリエンスに合わないことは間違いありません。同時に、知識ベースのウェブサイトの場合、知識ポイント自体は重複していますが、知識ポイントから結論を推論すると、記事によって結論が異なります。多くの結論の導出プロセスは、修飾語、副詞、補足語の部分によって完了するため、ユーザーエクスペリエンスが優れたこれらの知識ベースの記事は、Baidu によって誤って削除されてしまいます。

逆に、スパムサイトの中には、疑似オリジナル時に主語・述語・目的語の構造を誤って変更したためにアルゴリズムの更新を逃れたサイトもあり、その結果、一部のサイトがBaiduのホームページに押し込まれてしまった。

これに対して、百度が講じた予防措置は、私が「6.28百度Kステーションから百度SEOの今後の動向を見る」という記事で書いた通りで、ドメイン名の古さを最後の手段にして、一部のサイトに対して対策を講じた。

しかし、これは一部の本当のオリジナル記事にダメージを与えることになります。下の写真はBaiduの公式声明です。

(図7)

図7は、オリジナルコンテンツの転載問題に対する百度の公式回答です。これは、オリジナルコンテンツに対する百度の姿勢が絶対的な優位性ではなく、有名サイトの転載記事よりも劣っていることが多いことを示しています。

すると、この設計の欠陥が自然に明らかになり、それほど古くなく、オリジナルの記事を提供しているいくつかの小さなドメイン名が、このポリシー更新後に偶然影響を受けることになります。

さて、ここで、上で述べた百度の変化を振り返ってみましょう。その一つがプレビューです。皆さんにお聞きしたいのですが、Baidu はこれまでアップデートの前に何らかの事前通知を行ったことがありますか? Baidu は 1 回や 2 回ではなく大規模なサイトを K 化したことがありますが、今回はなぜ発表があるのでしょうか?ここで趙氏は、スパマーを麻痺させるGoogleの特許を思い出さずにはいられない。もちろん、これはBaiduがスパマーを麻痺させるためにこの方法を採用しているという意味ではなく、検索エンジンのアルゴリズムが、TVBのハーレムドラマのように、陰謀論や策略に従事し始めたということだ。

まず、今回のアップデートの主な業界として、医療とSEOを選択しました。医療自体は百度にとって最大の収入源です。この機会を利用して、自社の収入を拡大することができます。同時に、医療への悪影響を心配する必要はありません。それぞれの上司から給料をもらっている医療SEOチームがあり、このアップデートによりこの分野で人工的に作成されたデータの量が減少することを心配する必要はありません。 SEO 業界に関しては、あまり言う必要はないと思います。

その後、プレビューをお見せし、その後アルゴリズムがオンラインになります。 Baidu は、このアルゴリズムのアップグレードには固有の欠陥があることを認識しており、これらの欠陥を補う唯一の方法は、ルールの導入後にフィードバック データを収集して改善することです。 「6.28百度Kステーションから百度SEOの今後の動向を見る」という記事で、6月に百度のKステーションが安定した後も、数時間ごとに順位が変わる単語がまだいくつかあると指摘したことを思い出してください。当時、百度は実際に次のアップデートに備えてデータを収集していました。今回は、データ収集作業の範囲が広く、個々の単語だけでなく、業界全体に及んでいました。

最後に、Baidu はこのアップデートに固有の問題があることを十分に認識しています。私のブログがその一例です。上記にブログの URL を掲載したので、読者が私の記事がオリジナルでユーザーにとって役立つものかどうか、外部リンクが不正なものかどうかをチェックするのではないかと心配することはありません。まず、このアップデートは私のオリジナル記事に影響を及ぼしました。同時に、私のサイトの多くの記事が大手サイトに転載され、その結果、私のサイトは降格され、ホームページから追い出されました。私のように余暇を利用して真剣に記事を書き、共有する人こそが、百度が引き留めたいコンテンツクリエイターです。そのため、百度は今回、事前に通知し、処罰対象を正確に指摘することで、私たちが誤って被害を受けたことを明確にしました。同時に、百度は6月にインデックスを直接0に戻したのとは異なり、インデックスデータを保留しました。これは、その後のアルゴリズム修復の基盤を築くためです。

ホームページは削除されなかったが、ランキングがトップ 100 から外れただけのサイトは、私が推測した状況とより一致しています。サイトに対するペナルティなので、重複と判断されたコンテンツは削除すべきだとお考えでしょうが、ホームページのスナップショットは残っており、サイトが明らかに削除されたわけではありません。したがって、ペナルティと言うよりは、Baiduデータ結果テストでサイトのパフォーマンスが悪かったと言った方が適切でしょう。あなたのサイトが実際にペナルティ対象サイトとして特定されるかどうかは、おそらく Baidu がデータを収集して再度対応するまで待たなければならないでしょう。

では、Baidu は今後コンテンツをどのように変えていくのでしょうか?

Baidu は、さまざまな品詞のどの単語を独創性を判断する特徴として使用すべきか、またどの単語を独創性を判断する特徴として使用すべきでないかについて、徐々に改善していくと考えています。結局のところ、中国語の単語やフレーズは数千しかありません。何年もかけて、Baiduは対応するデータベースを構築し、予備的な分析を行うべきでした。現在欠けているのは、データのフィードバックだけです。

このアップデートが百度による即興のパフォーマンスだったのか、それとも長い間計画されていたものだったのかについては、百度関係者が2010年に述べた内容をご覧ください。

2010年にLEE氏が述べたように、この問題を解決するには抜本的な対策が必要であり、今年は百度が抜本的な対策を講じなければならない年となるだろう。 Baidu はすでにこれを認識しているので、ウェブマスターは他の幻想を抱く必要はありません。

しかし、SEO はどうでしょうか?

プログラムがある限り、抜け穴は存在する。これまで、人々の擬似オリジナリティは、Baidu の以前の単語分割の態度に基づいていました。Baidu の一連のルールが安定した後、新しい単語分割の態度に基づいて、対応する擬似オリジナリティの方法がすぐに出現すると信じています。Baidu が重視する単語に対して操作するだけで済みます。しかし、趙氏はウェブマスター全員に、これを行う価値はあるかと尋ねずにはいられません。

6月28日の記事で、私はグレーハットを批判し、すべてのウェブマスターにSEOチームの時代が到来したと伝えました。多くのウェブマスターがさまざまなチャネルを通じて私に、まだ幻想を抱いていると伝えました。これはまた別の打撃です。Baiduの決意を理解する必要があると思います。

Baidu がこの一連のデータ収集を終え、オリジナル記事の識別が完璧になると、Baidu Webmaster Tools のバックグラウンドで、一部のサイトのインデックス ボリュームが劇的に変化し始めると思います。すべての Web マスターがこれを乗り越えられることを願っています。

この記事は趙氏のブログに最初に掲載されました。元のアドレスは http://www.seozhao.com/326.html です。転載する場合は出典を明記してください。

原題: Baidu 8.25 アップデートへの対処方法: 記事の内容

キーワード: 8.25、Baidu、大きなアップデート、新しい外観、SEO、方法、記事、コンテンツ、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  いくつかのKステーションはSEO実践者の「未熟さ」を検出しました

>>:  草の根ウェブマスターがテンセントWeiboへの外部リンクの作成が可能かどうかに回答

推薦する

Baiduは外部リンクの新しいチャネルを知っている:入札プロモーションリンク

まず、この記事のタイトルについて説明させてください。私は百度の宣伝や広告をしているわけではありません...

GPU仮想化技術の詳しい説明

GPU の英語名は Graphic Processing Unit で、中国語での正式名称は com...

underhost: オランダのサーバー、防弾ホスト、著作権侵害の申し立てを無視、コンテンツ制限なし

Underhost のオランダのデータセンターには、2 つの特別なサーバー、「防弾サーバー」がありま...

「職人技」が細部までこだわったメールマーケティングをより効果的にする

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています企業がマー...

上海のインターネット企業64,000社が営業許可情報を公開

消費者が饅頭を購入し、詐欺の疑いがある場合、現行の消費者保護法によれば、消費者は1対1の払い戻しで2...

分散アーキテクチャでは、従来のデータベースの運用と保守はどのような変化に直面するでしょうか?

[[319472]]分散アーキテクチャは近年最もホットなトピックかもしれません。この記事では、集中型...

海外のVPSレンタル業者が推奨する、あなた自身のVPSレンタル体験をまとめ、共有する

海外VPS(海外VPSレンタル、海外VPSレンタル)をレンタルする場合、(1)国内市場と比較した速度...

エッジコンピューティングはクラウドコンピューティングに取って代わるでしょうか?

クラウドコンピューティング、モバイルネットワーク、ビッグデータ、SDN の継続的な導入により、インタ...

DockerコンテナにおけるUIDとGIDの仕組みを理解する

コンテナ内で実行されているプロセスとホスト システム間のユーザー名、グループ名、ユーザー ID (U...

2016 SEO トレンド分析

序文振り返ってみると、私はSEOを6、7年やってきましたが、ランキングやトラフィックに支配されること...

ウェブサイトの構造は最適化の結果に影響しますか?

現在、主流のウェブサイトフレームワーク構造は DIV + CSS であり、これは最も標準的で W3C...

2013年に内部リンクを構築する方法

SEOの基本的な作業には、外部リンク構築とサイト内編集に加えて、内部リンク構築も含まれます。当初はオ...

小紅書における美容業界のマーケティング動向の分析

小紅書の公式報告によると、2019年5月時点で、小紅書の登録ユーザー数は2億5000万人を突破した。...

マイクロソフトは、クラウドサービスは以前は高価すぎたが、よりコスト効率の高いAzure VMが利用可能になったと述べている

Microsoft は、大規模なコンピューティング集約型ワークロードに対して顧客により多くのオプシ...

おすすめ: Hawkhost - VPS 70% オフ / Alipay / Softlayer データセンター / シンガポール / ダラス / ワシントン

Hawkhost は、12 年間運営されている中小企業であり、高品質のアフターサービスと安定したマシ...