以前、robots.txt ファイルの書き方について記事を書きましたが、実際に観察してみると、一部の友人はまだ robots.txt ファイルのルールについて誤解しているようです。 たとえば、多くの人が次のように書いています。
このルールが実際には効果がないということに気付いたかどうかはわかりません。最初の文 Allow: / はスパイダーがすべてのコンテンツをクロールすることを許可することを意味し、2 番目の文 Disallow: /mulu/ は /mulu/ の下にあるすべてのコンテンツを禁止することを意味します。 表面的には、このルールの目的は、スパイダーが /mulu/ を除く Web サイトのすべてのページをクロールできるようにすることです。 ただし、検索エンジンのスパイダーはルールを上から下に実行するため、2 番目のコマンドは無効になります。 正しいルールは次のようになります。
つまり、まず禁止コマンドを実行し、その後に許可コマンドを実行することで無効にならないようにします。 さらに、Baidu スパイダーが犯すもう 1 つの一般的な間違いは、Disallow コマンドと Allow コマンドがスラッシュ / で始まる必要があるため、次のように記述する人がいることです: Disallow: *.html これは Baidu スパイダーでは間違っており、次のように記述する必要があります: Disallow: /*.html 。 こうしたルールを記述するときに、気づかない問題が発生することがあります。Baidu Webmaster Tools (zhanzhang.baidu.com) と Google Webmaster Tools を使って、これらのルールをテストできるようになりました。 比較的言えば、Baidu Webmaster Tools のロボット ツールは比較的シンプルです。 Baidu Robots ツールは、各コマンド行が文法規則に準拠しているかどうかを検出することしかできず、実際の効果やクロール ロジック ルールは検出できません。 比較すると、図に示すように、Google の Robots ツールの方がはるかに使いやすいです。 Google ウェブマスター ツールではクローラ権限と呼ばれ、Google がサイトのページをクロールするときにブロックされる URL の数を報告します。 Robots の変更の効果をオンラインでテストすることもできます。もちろん、ここでの変更はテスト用です。問題がなければ、robots.txt ファイルを生成するか、コマンド コードを robots.txt テキスト ドキュメントにコピーして、Web サイトのルート ディレクトリにアップロードすることができます。 Google のテストは Baidu のテストとは大きく異なります。1 つ以上の URL を入力して、Google スパイダーがこれらの URL をクロールできるかどうかをテストできます。 テスト結果は、Google スパイダーによるこれらの URL のクロール状況です。このテストは、Robots ファイルのルールが特定の URL に対して有効かどうかを確認するためのものです。 もちろん、2 つのツールを組み合わせる方がよいでしょう。これで、ロボットの書き方を完全に理解できたはずです。 転載の際は、小夜ブログの記事であることを明記してください。この記事のアドレスは、http://liboseo.com/1170.html です。 特に指定がない限り、Xiaoyao Blog のすべての記事はオリジナルです。転載する場合は出典とリンクを明記してください。 元のタイトル: Robots.txt ルールの誤解と Baidu および Google ロボット ツールの使用に関する分析 キーワード: 分析、Robots.txt、誤解、Baidu、Googlerobo、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化 |
<<: 1か月でウェブサイトのキーワードをランク付けする方法
2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますSEOにお...
クラウド コンピューティングの採用が拡大するにつれ、企業がすべてのアプリケーションとデータを単一のク...
2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています「洛吉思維...
1. 共同購入サイトの数は3月に357件減少しました。年末までに、一流の共同購入サイトは3~5件しか...
昨日、zgovps はロサンゼルス データ センターを拠点とする純粋に国際的な VPS シリーズ「ロ...
iozoom.com からの最新ニュース: 構成のアップグレード、価格の変更なし、メモリの「説明でき...
[[399138]] 1. はじめにスレッドとプロセスの間では、プロセスの方が安定しており、複数のマ...
「外部リンクは王様」という言葉は、誰もが何度も耳にしたことがあるでしょう。この言葉がある程度正確であ...
張小龍すべてのプロダクト マネージャーとユーザー エクスペリエンス デザイナーに推奨: 言葉で説明す...
最近の観察から、Baidu の検索結果はますます多様化しており、ある程度のインテリジェントな思考を備...
ウェブサイトの最適化担当者にとって、Baidu の新しい状況最適化にはいくつかの犠牲が伴います。 2...
アプリを推奨するウェブサイト、無料アプリに関する情報を提供するウェブサイト、ストア内にアプリストアを...
多くの人にとって、クラウドは産業用モノのインターネット (IIoT) のバックボーンとなっています。...
「年間モバイルアプリ購入量白書」が発表され、2019年のモバイルアプリ購入量の市場動向と変化を詳細に...
今日はブランド広告のロジックについてお話しします。 1. ユーザーの購入決定プロセスの簡単な分析1....