ロボットのルールに関するよくある誤解と、Google と Baidu のロボット ツールの使い方

ロボットのルールに関するよくある誤解と、Google と Baidu のロボット ツールの使い方

誰もがウェブサイト上の robots.txt ファイルの役割を知っていますが、観察してみると、一部の友人が robots.txt ファイルのルールについてまだ誤解していることがわかります。

たとえば、多くの人が次のように書いています。

ユーザーエージェント: *

許可する: /

禁止: /mulu/

このルールが実際には効果がないということに気付いたかどうかはわかりません。最初の文 Allow: / はスパイダーがすべてのコンテンツをクロールすることを許可することを意味し、2 番目の文 Disallow: /mulu/ は /mulu/ の下にあるすべてのコンテンツを禁止することを意味します。

表面的には、このルールの目的は、スパイダーが /mulu/ を除く Web サイトのすべてのページをクロールできるようにすることです。ただし、検索エンジンのスパイダーはルールを上から下に実行するため、2 番目のコマンドは無効になります。

正しいルールは次のようになります。

ユーザーエージェント: *

禁止: /mulu/

許可する: /

つまり、まず禁止コマンドを実行し、その後に許可コマンドを実行することで無効にならないようにします。さらに、Baidu スパイダーが犯すもう 1 つの一般的な間違いは、Disallow コマンドと Allow コマンドがスラッシュ / で始まる必要があるため、次のように記述する人がいることです: Disallow: *.html これは Baidu スパイダーでは間違っており、次のように記述する必要があります: Disallow: /*.html 。

こうしたルールを記述するときに、気づかない問題が発生することがあります。Baidu Webmaster Tools (zhanzhang.baidu.com) と Google Webmaster Tools を使って、これらのルールをテストできるようになりました。比較的言えば、Baidu Webmaster Tools のロボット ツールは比較的シンプルです。

Baidu Robots ツールは、各コマンド行が文法規則に準拠しているかどうかを検出することしかできず、実際の効果やクロール ロジック ルールは検出できません。

比較すると、図に示すように、Google の Robots ツールの方がはるかに使いやすいです。

Google ウェブマスター ツールではクローラ権限と呼ばれ、Google がサイトのページをクロールするときにブロックされる URL の数を報告します。

Robots の変更の効果をオンラインでテストすることもできます。もちろん、ここでの変更はテスト用です。問題がなければ、robots.txt ファイルを生成するか、コマンド コードを robots.txt テキスト ドキュメントにコピーして、Web サイトのルート ディレクトリにアップロードすることができます。

Google のテストは Baidu のテストとは大きく異なります。1 つ以上の URL を入力して、Google スパイダーがこれらの URL をクロールできるかどうかをテストできます。

テスト結果は、Google スパイダーによるこれらの URL のクロール状況です。このテストは、Robots ファイルのルールが特定の URL に対して有効かどうかを確認するためのものです。もちろん、2 つのツールを組み合わせる方がよいでしょう。これで、ロボットの書き方を完全に理解できたはずです。

転載の際は、Xiaoyao Blogからの転載であることを明記してください。この記事のアドレスは、http://liboseo.com/1170.htmlです。転載の際は、出典とリンクを明記してください。

元のタイトル: ロボットのルールと Google および Baidu ロボット ツールの使用に関するよくある誤解

キーワード: ロボット、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  高品質なコンテンツと外部リンクを構築するときに注意すべき点

>>:  内部 SEO で独創性と独自性を強化するためのパーソナライズされた方法

推薦する

Vagrant をインストールして設定するにはどうすればいいですか?

Vagrant は仮想マシン用の強力なツールです。ここでは、Ubuntu 上で Virtualbox...

BandwagonHostのすべてのテストIP + VPS評価、BandwagonHostの選択方法を教えます

BandwagonHost のどのコンピュータ ルームが自分に適していて、どのコンピュータ ルームの...

中小企業向けブランド構築の迅速化のための実践ガイド

インターネット企業にとって、ブランドの役割は特に重要です。ブランドは無形資産として、企業のビジネス価...

WordPressのSEOに関するヒント

SEO はウェブマスターの間で常に話題になっています。適切な SEO はウェブサイトに大量のトラフィ...

質の高い友好的なリンク交換スキルについてどれだけ知っていますか

私は長年 SEO 業務に携わっており、検索エンジン最適化についてある程度理解しています。私は主に機械...

なぜ「プラットフォーム+産業エコロジー」が企業の不可逆的な未来なのか?

2020年の風向きは予測できません。誰もが、現在の霧を通して未来を垣間見て、美しいジェダイの反撃を開...

推奨: クアドラネット - $5.81/KVM/512m メモリ/15g SSD/1T トラフィック

クアドラネットの価格は常に法外なものでした。非常に高価です。なぜ突然クアドラネットから撤退し、民間の...

クラウド コンピューティングのサービス レベル契約を交渉する方法

企業にとって、クラウド プロバイダーがサービスとパフォーマンスに関するエンタープライズ レベルの約束...

ドリームワークスデータセンター:クラウドと仮想化は20%未満

ドリームワークスのさまざまなスタジオが制作したコンピューター特殊効果を見ると、そのデータセンターはク...

raksmart: 韓国独立サーバー、月額 76 ドル、2*e5-2630/32g メモリ/1T ハードディスク/10M 帯域幅/3IP

流行病のせいか、みんな金儲けを考えている。Raksmartの韓国製格安サーバー(物理マシン)2台が前...

消えゆくウェブ:情報の衰退がいかに私たちの歴史を蝕んでいるか

概要: Facebook や Twitter などのソーシャル ネットワーキング サイトの普及により...

メールマーケティングとSEOの関係について

ウェブマスターにとって、電子メール マーケティングはトラフィックを引き付けるためによく使用される手段...

皆さん、あなたのウェブサイトはユーザー向けに構築されていますか?

「ウェブマスターツール」はウェブマスターやSEO担当者にとって非常に馴染み深いものです。国内の有名な...

タオバオ村が特許戦争に直面:競争により近隣関係が緊張

李喬沙麟鎮は遂寧県東部、江蘇省、安徽省、山東省の境界に位置し、総面積66平方キロメートル、行政村17...

Hostdare ロサンゼルス C3 データセンター KVM 仮想 VPS レビュー

Hostdare は、一昨日、zenlayer (c3 コンピュータ ルーム) の KVM シリーズ...