ロボットのルールに関するよくある誤解と、Google と Baidu のロボット ツールの使い方

ロボットのルールに関するよくある誤解と、Google と Baidu のロボット ツールの使い方

誰もがウェブサイト上の robots.txt ファイルの役割を知っていますが、観察してみると、一部の友人が robots.txt ファイルのルールについてまだ誤解していることがわかります。

たとえば、多くの人が次のように書いています。

ユーザーエージェント: *

許可する: /

禁止: /mulu/

このルールが実際には効果がないということに気付いたかどうかはわかりません。最初の文 Allow: / はスパイダーがすべてのコンテンツをクロールすることを許可することを意味し、2 番目の文 Disallow: /mulu/ は /mulu/ の下にあるすべてのコンテンツを禁止することを意味します。

表面的には、このルールの目的は、スパイダーが /mulu/ を除く Web サイトのすべてのページをクロールできるようにすることです。ただし、検索エンジンのスパイダーはルールを上から下に実行するため、2 番目のコマンドは無効になります。

正しいルールは次のようになります。

ユーザーエージェント: *

禁止: /mulu/

許可する: /

つまり、まず禁止コマンドを実行し、その後に許可コマンドを実行することで無効にならないようにします。さらに、Baidu スパイダーが犯すもう 1 つの一般的な間違いは、Disallow コマンドと Allow コマンドがスラッシュ / で始まる必要があるため、次のように記述する人がいることです: Disallow: *.html これは Baidu スパイダーでは間違っており、次のように記述する必要があります: Disallow: /*.html 。

こうしたルールを記述するときに、気づかない問題が発生することがあります。Baidu Webmaster Tools (zhanzhang.baidu.com) と Google Webmaster Tools を使って、これらのルールをテストできるようになりました。比較的言えば、Baidu Webmaster Tools のロボット ツールは比較的シンプルです。

Baidu Robots ツールは、各コマンド行が文法規則に準拠しているかどうかを検出することしかできず、実際の効果やクロール ロジック ルールは検出できません。

比較すると、図に示すように、Google の Robots ツールの方がはるかに使いやすいです。

Google ウェブマスター ツールではクローラ権限と呼ばれ、Google がサイトのページをクロールするときにブロックされる URL の数を報告します。

Robots の変更の効果をオンラインでテストすることもできます。もちろん、ここでの変更はテスト用です。問題がなければ、robots.txt ファイルを生成するか、コマンド コードを robots.txt テキスト ドキュメントにコピーして、Web サイトのルート ディレクトリにアップロードすることができます。

Google のテストは Baidu のテストとは大きく異なります。1 つ以上の URL を入力して、Google スパイダーがこれらの URL をクロールできるかどうかをテストできます。

テスト結果は、Google スパイダーによるこれらの URL のクロール状況です。このテストは、Robots ファイルのルールが特定の URL に対して有効かどうかを確認するためのものです。もちろん、2 つのツールを組み合わせる方がよいでしょう。これで、ロボットの書き方を完全に理解できたはずです。

転載の際は、Xiaoyao Blogからの転載であることを明記してください。この記事のアドレスは、http://liboseo.com/1170.htmlです。転載の際は、出典とリンクを明記してください。

元のタイトル: ロボットのルールと Google および Baidu ロボット ツールの使用に関するよくある誤解

キーワード: ロボット、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  高品質なコンテンツと外部リンクを構築するときに注意すべき点

>>:  内部 SEO で独創性と独自性を強化するためのパーソナライズされた方法

推薦する

デリミタ-24.9USD/E3-1225v3/8GB RAM/1TB HDD/10TB フロー/5IP/1Gbps

delimiter.com は、もともと中古の低価格サーバーのホスティングとレンタルを専門とする企業...

最近は風が強くて、トリックもいっぱいです。初心者は落ち着いてください!

年末には、基本的に同じやり方で、驚くほど安い価格を提示し、OpenVZ を使って損切りなしで過剰販売...

ホスティングは歴史と関連するトレンドの舞台から正式に消えた

hostigation.netは本日をもって正式に歴史の舞台から退き、存在しなくなりました。ドメイン...

SEO トレーニング: SEO で最も重要なことは何ですか?

多くの人が SEO について誤解しています。 SEO を神話にする。実際のところ、SEO は単なる補...

クラウドコンピューティングは頂点に一歩近づいた

小説では、頂点から一歩手前の修行段階を「頂点まで半歩」と呼ぶことが多い。 1946年、アメリカで世界...

ブログ開発はどんな困難に直面しますか?ボトルネック期間を突破するには?

インターネット上では、Zac の個人ブログ「SEO Post Every Day」、Lu Songs...

Bilibiliはどのようにして損益分岐点を達成できるのでしょうか?

ビリビリは3月3日、第4四半期および通期の業績発表を行った。第4四半期のMAUは2億7,170万人に...

コンバージョン率の低さへの反撃:心を掴む営業戦略

ウェブサイトにとって最も頭の痛い問題は何でしょうか。それはウェブサイトのトラフィックが全くないことで...

5G、エッジコンピューティング、IoTが従来の企業を近代化する方法

過去 2 年間、世界的なパンデミックとロックダウンによりデジタル化が促進され、数え切れないほどの従来...

最適化のためにキーワードの複数のバリエーションを使用する方法

キーワードはウェブサイトの最適化において重要な役割を果たします。そのため、さまざまな方法を使用して、...

この冬季オリンピックのブラックテクノロジーは毛細血管にまで届くほど精巧だ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

信じられない!何十億ものデータを ES に同期するのはとても簡単です。

1 これは背景です最近、複数の条件を任意に組み合わせて注文データを照会する機能を提供してほしいという...

米国で中国人男性が著作権侵害で懲役12年の判決を受ける:関与企業は200社近く

北京ニュース(記者 趙家尼)外国メディアの報道によると、米国の裁判所は現地時間の火曜日、中国の李翔(...