Baidu ウェブマスター プラットフォーム: Baiduspider を識別して、Web サイトが正常にクロールされていることを確認する方法

Baidu ウェブマスター プラットフォーム: Baiduspider を識別して、Web サイトが正常にクロールされていることを確認する方法

A5 Webmaster Network (www.admin5.com) は4月24日、多くのウェブサイトが誤って Baiduspider をブロックし、ウェブサイトの掲載に影響が出ていると報告した。一部のウェブサイトでは、Baidu スパイダーが異常な動作をし、頻繁に訪問していると報告されています。最近、Baidu Webmaster Platform は、Baiduspider によるサイトのクロールには異常はないと述べ、Web マスターが Baiduspider を識別してホワイトリストに追加できるようにするためのチュートリアルを公開しました。

先週、Baidu Webmaster Platform は、あるウェブマスターから、Baiduspider の IP を誤ってブロックしてしまったため、Baiduspider のすべての IP を取得してホワイトリストに登録し、誤って再度ブロックされないようにする方法があるかどうかという助けを求める電話を受けました。 Baiduspider の IP プールは絶えず変化しており、完全な IP セットを提供することはできないことをすべてのウェブマスターにお知らせします。

さらに、一部のウェブマスターは、Baiduspider のアクセス頻度が高すぎてサーバーの容量を超えていると疑問を呈しています。しかし、Baidu Webmaster Platform は、Baiduspider によるサイトのクロールには異常がなく、スパイダーは偽物である可能性が高いことを発見しました。

では、ウェブマスターはどのようにして IP を使用して、このスパイダーが Baidu 検索エンジンからのものであるかどうかを判断できるのでしょうか?

この問題は、DNS 逆引き検索を使用することで解決できます。検証方法はプラットフォームによって異なります。例えば、Linux、Windows、OS の検証方法は次のとおりです。

1. Linux プラットフォームでは、host ip コマンドを使用して IP を逆にし、Baiduspider によってキャプチャされているかどうかを確認できます。 Baiduspider のホスト名は *.baidu.com または *.baidu.jp の形式です。 *.baidu.com または *.baidu.jp 以外のものはすべて偽装です。

2. Windows または IBM OS/2 プラットフォームでは、nslookup ip コマンドを使用して IP アドレスを逆にし、Baiduspider によってキャプチャされているかどうかを確認できます。コマンドプロセッサを開き、nslookup xxx.xxx.xxx.xxx (IP アドレス) と入力して IP を解決し、Baiduspider によってキャプチャされているかどうかを判断します。Baiduspider のホスト名は、*.baidu.com または *.baidu.jp の形式で命名されています。*.baidu.com または *.baidu.jp でない場合は、なりすましです。

3. Mac OS では、dig コマンドを使用して IP アドレスを逆にし、Baiduspider によってキャプチャされているかどうかを確認できます。コマンドプロセッサを開き、dig xxx.xxx.xxx.xxx (IP アドレス) と入力して IP を解析し、Baiduspider によってキャプチャされたかどうかを判断します。Baiduspider のホスト名は、*.baidu.com または *.baidu.jp の形式で命名されています。*.baidu.com または *.baidu.jp でない場合は、なりすましです。


原題: Baidu Webmaster Platform: ウェブサイトが正常にクロールされていることを確認するために Baiduspider を識別する方法

キーワード: Baiduspider、検索エンジン

<<:  広州のQunar.comは北京のQunar.comに25万元を支払う必要がある

>>:  日刊トピック:Ku6は監督が3回交代し、人事も常に混迷を極めている。今後はどうなるのか?

推薦する

servarica-512m メモリ XEN 3.8ドル / 1Gメモリ Windows 月額支払い 7ドル

Servarica は 2010 年に設立されたカナダの会社 (Rica Web Services)...

ARがオフラインスーパーマーケットを強化、NetEase InsightsとCapitaLandが共同でワールドカップマーケティングを創出

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています2018年...

gandi-.at ドメイン登録/初年度 6.25 USD

Gandi は .at ドメイン名のプロモーションを開始し、現在は元の価格から 25% 割引を提供し...

#クリスマス# ftpit: 50% 割引コード、512M メモリ VPS、たったの $1.49、ロサンゼルス + ニューヨーク

ftpit の最新の電子メール プロモーション: クリスマス プロモーションが早めに開始、OVZ モ...

FIT2CLOUDがシリーズCおよびC+の資金調達を完了し、中国のマルチクラウド管理市場をリードし続けます

2020年4月16日、中国のマルチクラウド管理プラットフォームソフトウェアおよびサービスプロバイダー...

Vestacpパネルの詳細

vestacp は、ロシア人が開発したオープンソースのホスティングパネルです。現在、RHEL 5、R...

IDC: 世界のエッジコンピューティング市場は2024年に2,506億ドルに達する

業界データ:ガートナーは今年2月に世界中の政府機関を対象に調査とインタビューを実施した。調査対象とな...

「制御可能」原則を使用して、Webサイトの外部リンクが合理性を取り戻すようにします

多くのウェブサイトの外部リンクは毎日変化しています。外部リンクの安定性は、ウェブサイト全体の重みの不...

1日10分、小さな進歩 - AWS Innovation Studio 第2号メジャーアップデート!

AWS Innovation Studio 第 2 号メジャーアップデート! 最近では、AWS を通...

kvchosting 無料ホスティング

HostCat は以前にも kvchosting を紹介しましたが (参照)、今日は同社の無料ホステ...

#BlackFriday# losangelesvps: 年間 25 ドル、1Gbps の帯域幅、無制限のトラフィック、無料の IP 変更

losangelesvps の公式ブラックフライデー プロモーションが始まりました。ロサンゼルスの ...

越境EC担当者が学ぶべきGAウェブサイト分析の16の高度なセグメント

GA を使用して Web サイトを分析することは、金鉱を掘るようなものです。 GA の操作に慣れてい...

謝文:インターネットは涙を信じません。伝統的なメディアは3〜5年以内に急速に変化するはずです。

3年前、私は伝統的なメディア界に新しいメディアを紹介するよう何度か依頼されました。彼は厳しい口調と期...

クラウド コンピューティングのコストを管理するための 6 つのヒント

現在、多くの企業のクラウド コンピューティング費用は予算を超えているため、クラウド コンピューティン...