Robots.txt ルールの誤解と Baidu および Google ロボット ツールの使用に関する分析

Robots.txt ルールの誤解と Baidu および Google ロボット ツールの使用に関する分析

以前、robots.txt ファイルの書き方について記事を書きましたが、実際に観察してみると、一部の友人はまだ robots.txt ファイルのルールについて誤解しているようです。

たとえば、多くの人が次のように書いています。

ユーザーエージェント: *
許可する: /
禁止: /mulu/

このルールが実際には効果がないということに気付いたかどうかはわかりません。最初の文 Allow: / はスパイダーがすべてのコンテンツをクロールすることを許可することを意味し、2 番目の文 Disallow: /mulu/ は /mulu/ の下にあるすべてのコンテンツを禁止することを意味します。

表面的には、このルールの目的は、スパイダーが /mulu/ を除く Web サイトのすべてのページをクロールできるようにすることです。

ただし、検索エンジンのスパイダーはルールを上から下に実行するため、2 番目のコマンドは無効になります。

正しいルールは次のようになります。

ユーザーエージェント: *
禁止: /mulu/
許可する: /

つまり、まず禁止コマンドを実行し、その後に許可コマンドを実行することで無効にならないようにします。

さらに、Baidu スパイダーが犯すもう 1 つの一般的な間違いは、Disallow コマンドと Allow コマンドがスラッシュ / で始まる必要があるため、次のように記述する人がいることです: Disallow: *.html これは Baidu スパイダーでは間違っており、次のように記述する必要があります: Disallow: /*.html 。

こうしたルールを記述するときに、気づかない問題が発生することがあります。Baidu Webmaster Tools (zhanzhang.baidu.com) と Google Webmaster Tools を使って、これらのルールをテストできるようになりました。

比較的言えば、Baidu Webmaster Tools のロボット ツールは比較的シンプルです。

Baidu Robots ツールは、各コマンド行が文法規則に準拠しているかどうかを検出することしかできず、実際の効果やクロール ロジック ルールは検出できません。

比較すると、図に示すように、Google の Robots ツールの方がはるかに使いやすいです。

Google ウェブマスター ツールではクローラ権限と呼ばれ、Google がサイトのページをクロールするときにブロックされる URL の数を報告します。

Robots の変更の効果をオンラインでテストすることもできます。もちろん、ここでの変更はテスト用です。問題がなければ、robots.txt ファイルを生成するか、コマンド コードを robots.txt テキスト ドキュメントにコピーして、Web サイトのルート ディレクトリにアップロードすることができます。

Google のテストは Baidu のテストとは大きく異なります。1 つ以上の URL を入力して、Google スパイダーがこれらの URL をクロールできるかどうかをテストできます。

テスト結果は、Google スパイダーによるこれらの URL のクロール状況です。このテストは、Robots ファイルのルールが特定の URL に対して有効かどうかを確認するためのものです。

もちろん、2 つのツールを組み合わせる方がよいでしょう。これで、ロボットの書き方を完全に理解できたはずです。

転載の際は、小夜ブログの記事であることを明記してください。この記事のアドレスは、http://liboseo.com/1170.html です。

特に指定がない限り、Xiaoyao Blog のすべての記事はオリジナルです。転載する場合は出典とリンクを明記してください。

元のタイトル: Robots.txt ルールの誤解と Baidu および Google ロボット ツールの使用に関する分析

キーワード: 分析、Robots.txt、誤解、Baidu、Googlerobo、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  1か月でウェブサイトのキーワードをランク​​付けする方法

>>:  SEOは最も基本的なマーケティング手法です

推薦する

2018 年にウェブサイトのランキングが低下した理由は何ですか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますSEOにお...

企業におけるマルチクラウド導入の秘訣

クラウド コンピューティングの採用が拡大するにつれ、企業がすべてのアプリケーションとデータを単一のク...

ブランドのパーソナライゼーションがトレンドに、NetEase Chunfengは新しいマーケティングを簡単に活用

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています「洛吉思維...

Webmaster.com の今週のホットなニュースのレビュー

1. 共同購入サイトの数は3月に357件減少しました。年末までに、一流の共同購入サイトは3~5件しか...

zgovpsはどうですか?ロサンゼルスグローバルVPSシリーズVPS実テストデータ共有!

昨日、zgovps はロサンゼルス データ センターを拠点とする純粋に国際的な VPS シリーズ「ロ...

推奨: iozoom-7 USD/KVM/2 GB RAM/20 GB SSD/2 TB トラフィック/無料 DDOS 保護

iozoom.com からの最新ニュース: 構成のアップグレード、価格の変更なし、メモリの「説明でき...

この記事ではPythonの分散プロセスインターフェースを紹介します

[[399138]] 1. はじめにスレッドとプロセスの間では、プロセスの方が安定しており、複数のマ...

Google リンク 外部リンク リソースに関するもう 1 つの秘密のヒント

「外部リンクは王様」という言葉は、誰もが何度も耳にしたことがあるでしょう。この言葉がある程度正確であ...

張小龍がユーザーエクスペリエンスについて語る: ユーザーエクスペリエンスの目標は「自然」にすること

張小龍すべてのプロダクト マネージャーとユーザー エクスペリエンス デザイナーに推奨: 言葉で説明す...

検索結果の多様化がウェブサイトのコンテンツ体験に与える影響

最近の観察から、Baidu の検索結果はますます多様化しており、ある程度のインテリジェントな思考を備...

ウェブサイトの最適化担当者にとって、Baiduの新しい状況最適化には、

ウェブサイトの最適化担当者にとって、Baidu の新しい状況最適化にはいくつかの犠牲が伴います。 2...

アプリ推奨サイトの春が来るのか? AppleによるChompの買収から始まる

アプリを推奨するウェブサイト、無料アプリに関する情報を提供するウェブサイト、ストア内にアプリストアを...

神話の打破: 産業用 IoT (IIOT) におけるクラウドとエッジ

多くの人にとって、クラウドは産業用モノのインターネット (IIoT) のバックボーンとなっています。...

年間モバイルアプリ購入に関するホワイトペーパー

「年間モバイルアプリ購入量白書」が発表され、2019年のモバイルアプリ購入量の市場動向と変化を詳細に...

高品質な広告チャネルを選択するにはどうすればよいでしょうか?

今日はブランド広告のロジックについてお話しします。 1. ユーザーの購入決定プロセスの簡単な分析1....