誰もがウェブサイト上の robots.txt ファイルの役割を知っていますが、観察してみると、一部の友人が robots.txt ファイルのルールについてまだ誤解していることがわかります。 たとえば、多くの人が次のように書いています。 ユーザーエージェント: * 許可する: / 禁止: /mulu/ このルールが実際には効果がないということに気付いたかどうかはわかりません。最初の文 Allow: / はスパイダーがすべてのコンテンツをクロールすることを許可することを意味し、2 番目の文 Disallow: /mulu/ は /mulu/ の下にあるすべてのコンテンツを禁止することを意味します。 表面的には、このルールの目的は、スパイダーが /mulu/ を除く Web サイトのすべてのページをクロールできるようにすることです。ただし、検索エンジンのスパイダーはルールを上から下に実行するため、2 番目のコマンドは無効になります。 正しいルールは次のようになります。 ユーザーエージェント: * 禁止: /mulu/ 許可する: / つまり、まず禁止コマンドを実行し、その後に許可コマンドを実行することで無効にならないようにします。さらに、Baidu スパイダーが犯すもう 1 つの一般的な間違いは、Disallow コマンドと Allow コマンドがスラッシュ / で始まる必要があるため、次のように記述する人がいることです: Disallow: *.html これは Baidu スパイダーでは間違っており、次のように記述する必要があります: Disallow: /*.html 。 こうしたルールを記述するときに、気づかない問題が発生することがあります。Baidu Webmaster Tools (zhanzhang.baidu.com) と Google Webmaster Tools を使って、これらのルールをテストできるようになりました。比較的言えば、Baidu Webmaster Tools のロボット ツールは比較的シンプルです。 Baidu Robots ツールは、各コマンド行が文法規則に準拠しているかどうかを検出することしかできず、実際の効果やクロール ロジック ルールは検出できません。 比較すると、図に示すように、Google の Robots ツールの方がはるかに使いやすいです。 Google ウェブマスター ツールではクローラ権限と呼ばれ、Google がサイトのページをクロールするときにブロックされる URL の数を報告します。 Robots の変更の効果をオンラインでテストすることもできます。もちろん、ここでの変更はテスト用です。問題がなければ、robots.txt ファイルを生成するか、コマンド コードを robots.txt テキスト ドキュメントにコピーして、Web サイトのルート ディレクトリにアップロードすることができます。 Google のテストは Baidu のテストとは大きく異なります。1 つ以上の URL を入力して、Google スパイダーがこれらの URL をクロールできるかどうかをテストできます。 テスト結果は、Google スパイダーによるこれらの URL のクロール状況です。このテストは、Robots ファイルのルールが特定の URL に対して有効かどうかを確認するためのものです。もちろん、2 つのツールを組み合わせる方がよいでしょう。これで、ロボットの書き方を完全に理解できたはずです。 転載の際は、Xiaoyao Blogからの転載であることを明記してください。この記事のアドレスは、http://liboseo.com/1170.htmlです。転載の際は、出典とリンクを明記してください。 元のタイトル: ロボットのルールと Google および Baidu ロボット ツールの使用に関するよくある誤解 キーワード: ロボット、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化 |
<<: 高品質なコンテンツと外部リンクを構築するときに注意すべき点
>>: 内部 SEO で独創性と独自性を強化するためのパーソナライズされた方法
Vagrant は仮想マシン用の強力なツールです。ここでは、Ubuntu 上で Virtualbox...
BandwagonHost のどのコンピュータ ルームが自分に適していて、どのコンピュータ ルームの...
インターネット企業にとって、ブランドの役割は特に重要です。ブランドは無形資産として、企業のビジネス価...
SEO はウェブマスターの間で常に話題になっています。適切な SEO はウェブサイトに大量のトラフィ...
私は長年 SEO 業務に携わっており、検索エンジン最適化についてある程度理解しています。私は主に機械...
2020年の風向きは予測できません。誰もが、現在の霧を通して未来を垣間見て、美しいジェダイの反撃を開...
クアドラネットの価格は常に法外なものでした。非常に高価です。なぜ突然クアドラネットから撤退し、民間の...
企業にとって、クラウド プロバイダーがサービスとパフォーマンスに関するエンタープライズ レベルの約束...
ドリームワークスのさまざまなスタジオが制作したコンピューター特殊効果を見ると、そのデータセンターはク...
流行病のせいか、みんな金儲けを考えている。Raksmartの韓国製格安サーバー(物理マシン)2台が前...
概要: Facebook や Twitter などのソーシャル ネットワーキング サイトの普及により...
ウェブマスターにとって、電子メール マーケティングはトラフィックを引き付けるためによく使用される手段...
「ウェブマスターツール」はウェブマスターやSEO担当者にとって非常に馴染み深いものです。国内の有名な...
李喬沙麟鎮は遂寧県東部、江蘇省、安徽省、山東省の境界に位置し、総面積66平方キロメートル、行政村17...
Hostdare は、一昨日、zenlayer (c3 コンピュータ ルーム) の KVM シリーズ...