ウェブサイトでの robots.txt の使用に関するよくある誤解

ウェブサイトでの robots.txt の使用に関するよくある誤解

数日前、robots.txt のルールに関する誤解について書き、Baidu と Google のロボット ツールの使用を紹介しました。robots.txt ファイルのルールに関する誤解をいくつか紹介しましたが、実際にはそれ以上に、誰もが気づいていない誤解がたくさんあることがわかりました。

今日は、robots.txt の実際の使用に関するよくある誤解を再度リストアップしてみましょう。

誤解 1: Allow は Disallow よりも広い範囲をカバーし、Disallow の前に配置されます。

たとえば、多くの人が次のように書いています。

ユーザーエージェント: *

許可する: /

禁止: /mulu/

すべてのスパイダーが /mulu/ の下の URL を除くこのサイトのすべてのページをクロールし、/mulu/ の下のすべての URL のクロールを禁止するようにします。

検索エンジンのスパイダーはルールを上から下へ実行するため、2 番目のコマンドは失敗します。これは、/mulu/ ディレクトリのクロール禁止ルールが無効であることを意味します。正しくは、Disallow が Allow より上に設定され、有効になるはずです。

誤解 2: Disallow コマンドと Allow コマンドはスラッシュ「/」で始まりません。

これも見落とされやすいです。たとえば、 Disallow: 123.html と書いても効果はありません。スラッシュ「/」は、ルートディレクトリに対するファイルの相対的な場所を示します。これがないと、どの URL であるかを判別できないため、これは誤りです。

正解は Disallow: /123.html です。これにより、/123.html ファイルがブロックされ、このルールが有効になります。

誤解 3: ブロックされたディレクトリの後にスラッシュ「/」がありません。

たとえば、/mulu/ ディレクトリのクロールをブロックしたい場合、Disallow: /mulu と記述する人もいます。それでこれは正しいのでしょうか?

まず、このように記述すると (Disallow: /mulu)、確かに /mulu/ の下にあるすべての URL をブロックできますが、/mulu123.html などの /mulu で始まるすべてのページもブロックされ、Disallow: /mulu* と同じ効果があります。

ディレクトリのみをブロックしたい場合は、最後にスラッシュ「/」を付けるのが正しい方法です。

転載の際は、Xiaoyao Blogの記事であることを明記してください。この記事のアドレスは、http://liboseo.com/1193.htmlです。

転載の際は出典とリンクを明記してください!

元のタイトル: ウェブサイトでの robots.txt の使用に関するよくある誤解

キーワード: ロボット、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  大規模なウェブサイトを構築できない場合は、SEO に重点を置く必要があります。

>>:  Google リンク 外部リンク リソースに関するもう 1 つの秘密のヒント

推薦する

SEO最適化のワークフローの詳細説明パート2:実装

先ほど「SEO最適化作業トラフィックの準備」についてお話しましたが、今日は実装を開始する方法について...

VPC をマスターするための 4 つのヒント

インターネット上のさまざまなソフトウェア、アプリケーション、モバイル アプリが、人々の生活に毎日溢れ...

2018 年の企業 IT 部門向け 3 つのクラウド ソリューション

多くの人は新年を迎えると、通常、来年の個人的な目標を設定しますが、企業の IT 部門もクラウド コン...

データに基づいてチャネルの不正行為や不正行為を判断する方法を段階的に教えます(実際の例)

多くの場合、自分を奮い立たせなければ、物事を台無しにする能力がまだ残っていることに気づきません。 最...

AWS が新しい Amazon Sumerian サービスを発表

シアトル — 2017 年 11 月 27 日深夜、AWS re:Invent Night Laun...

Bitronic - 512M メモリ (xen)/10GSSD/512G 月間トラフィック/5.09 USD/月

2007 年に設立されたと主張する Bitronictech は、ドメイン名、SSL 証明書、仮想ホ...

簡単な分析: ウェブサイトをオンラインにする前にどのような準備が必要か

鄧小平はかつて「教育は幼少期から始めるべきだ」という有名な言葉を残した。ウェブサイトの場合、SEO ...

エッジコンピューティングが企業のITをどう変えるか

2018 年初頭に発表されたデータによると、エッジ コンピューティング セクターの支出は 2022 ...

企業ウェブサイトの Baidu 最適化にはどのような戦略に従うべきでしょうか?

ご存知のとおり、電子商取引ネットワーク マーケティングの発展に伴い、企業の Web サイトは徐々にイ...

ローカルウェブサイトが模倣から革新へ移行する方法の簡単な分析

地方ウェブサイトは今や限界に達し、一級都市から三級都市、四級都市まで至る所で花開きました。しかし、こ...

クラウドコストを削減する 5 つの方法!

[51CTO.com クイック翻訳] 多くの組織はワークロードをクラウドに配置することでメリットを得...

月額9.9ドル、1Gbpsの帯域幅、KVM仮想化を備えた香港VPS

Bandwagonhostの謎が明らかになりました。Bandwagonhostの香港VPSがついにオ...

Facebook の利用可能な Hosts ファイル

中国に来る多くの外国人にとって、Facebook にアクセスして海外の友人と連絡を取ることは非常に一...