偽のBaidu Spider? CDNと仮想ホストのユーザーは、

偽のBaidu Spider? CDNと仮想ホストのユーザーは、

SEO 担当者やウェブマスターは、本物の Baidu スパイダーと偽物の Baidu スパイダーを区別する明確な手段をすでに持っていると思います。 Baidu は、Baidu Spider を装ったクローラーを識別する方法も公式に発表しました。詳細については、こちらの記事を参照してください: http://www.baidu.com/search/spider.htm

偽のスパイダーは、次のような重大な損害を当社の Web サイトにもたらす可能性があります。

ウェブサイトの帯域幅を占有し、ウェブサイトのトラフィックとオーバーヘッドの増加をもたらします。帯域幅が限られているという前提の下で、通常のスパイダーのクローリングを妨げ、ウェブサイトでSEO作業を行う際に私たちの考えを誤解させます。偽のスパイダーを装った一部の収集ツールは、私たちの作業を盗用しています。インターネット上で多くの人が偽のスパイダーを「捕まえる」方法に関する記事を共有しているのを見てきましたが、これらの記事は偽のスパイダーを「捕まえる」プロセスと操作方法を定型的に説明しているだけです。しかし、クモが本物かどうかを実際に判断する方法を教えてくれる人は誰もいませんでした。

筆者自身も最近、電子商取引サイトの SEO 最適化を行っていたときに、このようなケースに遭遇し、本物のスパイダーを偽物のスパイダーと間違えそうになったことがあります。

1. 「偽の蜘蛛」を発見

SEO 最適化を実現するには多くの分析とデータが必要ですが、その中でもログ分析は最優先事項です。ログでは、通常の統計ツールでは確認できない多くのデータと事実を確認できます。

毎週水曜日に、電子商取引サイトの週次ログを分析して、前週の最適化効果をカウントしています。今週のウェブサイトログを分析して確認したところ、図に示すように、知らなかった「スパイダーIP」がいくつか見つかりました。

Baidu スパイダーは、一般的に 202.181.108.* と 123.125.71.* の 2 つの IP セグメントから来ることが分かっています (ちなみに、これら 2 つの IP セグメントには、いわゆる高重み付けの Baidu スパイダーと低重み付けの Baidu スパイダーは存在しません)。明らかに、「常識」によれば、これら 3 つの IP は、Baidu Spider が属する IP セグメントに属していません。 Baidu スパイダーが誤って終了されないようにするために、作成者は nslookup ip コマンドを使用して IP を逆順にし、次の情報を取得しました。

この時点で、IP は Baidu Spider の IP セグメントに属しておらず、「偽のスパイダー」であることが基本的に判断できます。占有されている帯域幅を解放するには、IP をブロックする必要があります。

2. 「偽のクモ」に対する誤解

上記の 3 つの IP をブロックしようとしていたとき、先週、この電子商取引 Web サイトから Anquanbao サービスを使用する予定であり、DNS を Anquanbao サーバーに解決する必要があると通知されたことを突然思い出しました。Anquanbao は、ユーザーのアクセス状況に基づいて、CDN アクセラレーションに最も近いノードを選択します。

前回の定期的な SEO チェックで、ウェブサイトの IP が陝西省の IP に解決され、このウェブサイトの IP が、今回ウェブサイトのログから見つけた 3 つの「偽のスパイダー」IP と同じ IP セグメントに属していることが分かりました。この推測を検証するために、ウェブサイトのログをもう一度注意深く確認したところ、Google スパイダーと Sogou スパイダーも以前の 3 つの IP から来ていることが分かりました (ウェブサイトが Baidu の SEO を行っていたため、以前にウェブサイトのログを分割し、Baidu の状況のみを確認していました)。

今では、これらの IP に属するスパイダーは偽のスパイダーではなく、本物の Baidu スパイダー、Google スパイダー、および他の検索エンジンのスパイダーであることがようやく明らかになりました。ただ、CDN ノードを一度通過しただけなので、送信元 IP アドレスは同じです。

3. 仮想ホストはどのようにして「偽のスパイダー」を生成するのか

これをきっかけに、以前関連記事を読んでいたときに、XX コンピュータ ルーム (コンピュータ ルームは 1 つか 2 つしかありません) から偽のスパイダーが見つかったとウェブマスターが不満を漏らしているのをよく目にしたことを思い出しました。

これはとても不思議なことです。この機械室で採取道具や偽の蜘蛛が作られたのでしょうか?もちろん事実はそうではありませんが、

偽のスパイダーを発見したウェブマスターの多くは、ホスティングプロバイダーが提供するクラスターホスト、または同様の性質の仮想ホストを使用しています。原理はCDNと同じで、顧客のスペースとサイト情報を同じグループ内のすべてのサーバーに同期します。スパイダーのソースは異なります。サイトに直接アクセスするものもあれば、外部リンクを介してサイトにアクセスするものもあります。外部リンク経由でサイトにアクセスするスパイダーは、近くのCDNノードにアクセスします。CDNノードは各社によって異なりますが、大まかに地域(省ではない)と通信・ネットコムに分かれています。CDNノード経由でウェブサイトにアクセスするスパイダーのソースIPは、当然北京本社から出発するときのIPではありません。

結局、問題はうまく解決され、最適化されて以来、eコマース ウェブサイトのパフォーマンスは良好です。CDN が使用されていましたが、CDN は検索エンジンに何の障害にもならず、むしろウェブサイトの速度とユーザー エクスペリエンスの向上に役立ったことが判明しました。

この SEO の事例は、オンライン SEO チュートリアルが時代遅れになることも示しています。インターネットの進歩に伴い、私たち SEO 担当者もチュートリアルや共有を合理的に扱い、疑問を持ち、実践する勇気を持つとともに、インターネットの基本的な技術知識をある程度理解する必要があります。

この記事はもともと、蘭州 SEO-Eastern Huifan Optimization Team の AimarYang によって執筆されました。転載の際はリンクをそのままにしてください: http://www.easthv.cc/blog/lanzhouseo/fake-baiduspider-cdn/

原題: 偽百度蜘蛛? CDNと仮想ホストのユーザーは、

キーワード: Baidu、スパイダー、CDN、仮想、ホスト、ユーザー、注意が必要、区別、真偽、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  Baidu の「Web 検索ランキングの投票モデルに関する簡単な説明」を読んだ感想

>>:  Baidu Webmaster Community が登録を開始、SEO が軌道に戻る可能性がある

推薦する

ZooKeeper 分散ロック キュレーター ソース コード 1: 再入可能ロック

序文一般的な作業でよく使用される分散ロックは、Redis と ZooKeeper に基づいています。...

ネット有名人「秦火火」は一審で懲役3年の判決を受けた

中国中央テレビの報道によると、ネットプロモーターの秦志輝(ネット名:秦火火)が名誉毀損と騒乱挑発の疑...

中小企業がネットワークマーケティングブランドを実現するための2つの勝利のポイント

中小企業がネットワークマーケティングブランドを実現するための2つの勝利のポイントはじめに: 企業が究...

nixcom-1g メモリ KVM/70g ハードディスク/2t トラフィック/月額 9.99 ドル

Nixcom は、2007 年から商業運営を行っているホスティング プロバイダーです。年末に、ブラン...

#整活儿# vdsina: 1回払い、破産するまで使用可能、ロシア/オランダのデータセンター、20,000ルーブルから

2009年に設立されたロシアのサーバー販売業者vdsina(主な事業はクラウドサーバー、独立サーバー...

SEOのコアコンピタンス

中核競争力とは、企業(競争に参加する人材、国、個人)が長期的な競争優位性を獲得する能力です。それは、...

酔っぱらいの意図は飲まないこと、百度の意図は何なのか

シャオスーは仕事が忙しいため、最近A5に行っていません。今日はようやく時間ができたので、皆さんが書い...

リバースホスト - 128MB RAM/10GB SSD/500GB 帯域幅/サンディエゴ/年間 18 ドル

Reversehosts は年末に設立されました。Hostcat は今年 3 月からこの VPS を...

ワールドカップが「ハッキング」このページは違法に改ざんされた可能性があります!

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますワールドカ...

Goを使用してXA分散トランザクションを簡単に完了する、ナニーレベルのチュートリアル

[[423848]]取引一部のビジネス要件では、一連の操作の一部ではなく、すべてを実行する必要があり...

Yinke がウェブサイトの最適化について語り、SEO 最適化を簡単にします (I)

私はウェブサイトの最適化に1年近く携わり、この間多くのSEOの依頼を引き受けてきました。残念ながら、...

より大きな成功を収めるためには、各ウェブサイトは複数のトラフィックエントリページを作成する必要があります。

毎日トラフィック統計をチェックする習慣があるかどうかはわかりませんが、ウェブサイトのデータの変化を観...

#おすすめ# shockhosting: $7.49、大容量ハードディスクVPS、KVM、1Gメモリ、1Tハードディスク、Alipay/WeChat

shockhosting は、大容量ハードドライブ VPS、ハードドライブ RAID10、KVM 仮...

Tik Tokマーケティングの9つの原則

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス世界は、最初に主導権を握...