Baidu ウェブマスター プラットフォーム: Baiduspider を識別して、Web サイトが正常にクロールされていることを確認する方法

Baidu ウェブマスター プラットフォーム: Baiduspider を識別して、Web サイトが正常にクロールされていることを確認する方法

A5 Webmaster Network (www.admin5.com) は4月24日、多くのウェブサイトが誤って Baiduspider をブロックし、ウェブサイトの掲載に影響が出ていると報告した。一部のウェブサイトでは、Baidu スパイダーが異常な動作をし、頻繁に訪問していると報告されています。最近、Baidu Webmaster Platform は、Baiduspider によるサイトのクロールには異常はないと述べ、Web マスターが Baiduspider を識別してホワイトリストに追加できるようにするためのチュートリアルを公開しました。

先週、Baidu Webmaster Platform は、あるウェブマスターから、Baiduspider の IP を誤ってブロックしてしまったため、Baiduspider のすべての IP を取得してホワイトリストに登録し、誤って再度ブロックされないようにする方法があるかどうかという助けを求める電話を受けました。 Baiduspider の IP プールは絶えず変化しており、完全な IP セットを提供することはできないことをすべてのウェブマスターにお知らせします。

さらに、一部のウェブマスターは、Baiduspider のアクセス頻度が高すぎてサーバーの容量を超えていると疑問を呈しています。しかし、Baidu Webmaster Platform は、Baiduspider によるサイトのクロールには異常がなく、スパイダーは偽物である可能性が高いことを発見しました。

では、ウェブマスターはどのようにして IP を使用して、このスパイダーが Baidu 検索エンジンからのものであるかどうかを判断できるのでしょうか?

この問題は、DNS 逆引き検索を使用することで解決できます。検証方法はプラットフォームによって異なります。例えば、Linux、Windows、OS の検証方法は次のとおりです。

1. Linux プラットフォームでは、host ip コマンドを使用して IP を逆にし、Baiduspider によってキャプチャされているかどうかを確認できます。 Baiduspider のホスト名は *.baidu.com または *.baidu.jp の形式です。 *.baidu.com または *.baidu.jp 以外のものはすべて偽装です。

2. Windows または IBM OS/2 プラットフォームでは、nslookup ip コマンドを使用して IP アドレスを逆にし、Baiduspider によってキャプチャされているかどうかを確認できます。コマンドプロセッサを開き、nslookup xxx.xxx.xxx.xxx (IP アドレス) と入力して IP を解決し、Baiduspider によってキャプチャされているかどうかを判断します。Baiduspider のホスト名は、*.baidu.com または *.baidu.jp の形式で命名されています。*.baidu.com または *.baidu.jp でない場合は、なりすましです。

3. Mac OS では、dig コマンドを使用して IP アドレスを逆にし、Baiduspider によってキャプチャされているかどうかを確認できます。コマンドプロセッサを開き、dig xxx.xxx.xxx.xxx (IP アドレス) と入力して IP を解析し、Baiduspider によってキャプチャされたかどうかを判断します。Baiduspider のホスト名は、*.baidu.com または *.baidu.jp の形式で命名されています。*.baidu.com または *.baidu.jp でない場合は、なりすましです。


原題: Baidu Webmaster Platform: ウェブサイトが正常にクロールされていることを確認するために Baiduspider を識別する方法

キーワード: Baiduspider、検索エンジン

<<:  広州のQunar.comは北京のQunar.comに25万元を支払う必要がある

>>:  日刊トピック:Ku6は監督が3回交代し、人事も常に混迷を極めている。今後はどうなるのか?

推薦する

MyServerPlanet - $6.47/KVM/ロサンゼルス/4G メモリ/4 コア/50G ハードディスク/2IP/3T トラフィック

MyServerPlanet (設立年、Hostcat に 8 回登場、登録会社、会社番号 0915...

Linodeの10ドル割引コードの説明

過去 2 日間、Linode はホスティング業界で最もホットな話題となりました。11 年の歴史を持つ...

Python BeautifulSoup4のインストールと簡単なアプリケーション

BeautifulSoupはPythonを学習する際にWebページをクロールするために使用するライブ...

adminvps: 25元/ロシアVPS/KVM/1gメモリ/10gSS/1Tトラフィック

adminvps.ru はロシアの商人で、ドメイン名、SSL 証明書、仮想ホスト、VPS、独立サーバ...

バイラルマーケティングを簡単にマスターする方法

Xiang Yancong は、バイラル マーケティングについて話すとき、誰もが私と同じように興奮す...

AI+フォーカス:インフォアが自動車業界のデジタル変革を支援

[51CTO.comより引用] 自動車業界の競争が激化する中、コスト管理と効率改善が最優先課題となっ...

ユーザー運営:コミュニティ運営の3つの柱

1 年間のコミュニティ運営に基づいて、私はコミュニティ運営において最も重要な 3 つの要素を「三頭の...

クラウドテクノロジーの最も包括的な説明

みなさんこんにちは。私はマイクチェンです。クラウド テクノロジーは将来のテクノロジーにおける新しいト...

企業のクラウド戦略が加速、「クラウド」から「クラウドの制御」へ移行するための 7 つの戦略

クラウド コンピューティングはデジタル変革の推奨モデルとなり、CIO はアプリケーションをパブリック...

クラウドコンピューティングがビジネスの成功に不可欠な理由

あなたのビジネスは重要であり、可能な限り最善の方法で運営するためにあらゆる手段を講じる必要があります...

華雲データと瑞傑ネットワークスは産業クラウドに重点を置く戦略的提携を締結

6月8日、北京 - Huayun Dataは本日、Ruijie Networksと戦略的提携を締結し...

クラウド コンピューティング リソースはどれくらいあれば十分でしょうか?

組織は、業務の特定の領域でクラウド コンピューティングを導入し始める場合があります。おそらく、新しい...

Manzuo.comアカウントのお金は頻繁に盗まれており、ユーザーはそれが危険すぎると感じている

「とても悲しいです。私の口座のお金が盗まれました。二度とManzuo.comには行きません」と消費者...

中国聯通:コアシステムの全面的なクラウド再構築が完了

6月9日、中国聯通IT研究開発センター総経理、党委員会書記、聯通ソフトウェア研究所所長の耿祥東氏は、...

Dockerボリュームについて知っておくべきこと

データボリュームとはDocker コンテナを使用すると、一連のデータ ファイルが生成されます。これら...