最近、多くのウェブマスターから「robots.txt」ファイルを正しく設定する方法について質問を受けています。ウェブマスターの友人たちの質問に答えるために、「Robots.txt プロトコル標準」を翻訳しました。この翻訳によって、皆さんが「robots.txt」ファイルについてより深く理解できるようになることを願っています。 Robots.txt は、サイトのルート ディレクトリに保存されるプレーン テキスト ファイルです。設定はシンプルですが、効果は強力です。検索エンジン スパイダーが指定されたコンテンツのみをクロールするように指定したり、検索エンジン スパイダーが Web サイトのコンテンツの一部またはすべてをクロールすることを禁止したりできます。 ここではその使い方を詳しく紹介します。 Robots.txt ファイルは、Web サイトのルート ディレクトリに配置し、インターネットからアクセスできるようにする必要があります。 例えば: ウェブサイトのアドレスがhttp://www.yourdomain.com/の場合 次に、ファイルを http://www.yourdomain.com/robots.txt 経由で開き、その内容を確認できる必要があります。 形式: ユーザーエージェント: 検索エンジン スパイダーの名前を記述するために使用されます。「Robots.txt」ファイルに複数の User-agent レコードがある場合、複数の検索エンジン スパイダーがこのプロトコルによって制限されることを意味します。このファイルには、少なくとも 1 つの User-agent レコードが必要です。この項目の値が * に設定されている場合、プロトコルはすべての検索エンジン スパイダーに対して有効です。「Robots.txt」ファイルには、「User-agent:*」などのレコードが 1 つだけ存在できます。 許可しない: アクセスされたくない URL を記述するために使用されます。この URL は完全なパスでも部分的なパスでもかまいません。Disallow で始まる URL は、Robot によってアクセスされません。 例: 例 1: 「Disallow:/help」 つまり、検索エンジンのスパイダーは /help.html と /help/index.html をクロールできません。 例 2: 「Disallow:/help/」 つまり、検索エンジンのスパイダーは /help.html をクロールできますが、/help/index.html はクロールできません。 例3: レコードが空の場合の禁止 これは、Web サイトのすべてのページが検索エンジンによるクロールを許可されており、「/robots.txt」ファイルに少なくとも 1 つの Disallow レコードが存在する必要があることを意味します。 「/robots.txt」が空のファイルの場合、Web サイトはすべての検索エンジン スパイダーによるクローラーに公開されます。 #: 例: 例 1: 「/robots.txt」を使用して、すべての検索エンジン スパイダーが「/bin/cgi/」ディレクトリ、「/tmp/」ディレクトリ、および /foo.html ファイルをクロールすることを禁止します。設定方法は次のとおりです。
例 2: 「/robots.txt」を使用して、1 つの検索エンジンのみのクロールを許可し、他の検索エンジンのクロールを禁止します。 たとえば、「slurp」という名前の検索エンジンスパイダーのみクロールを許可し、他の検索エンジンスパイダーが「/cgi/」ディレクトリ以下のコンテンツをクロールすることを拒否する場合の設定方法は次のとおりです。
元のタイトル: Robots.txt プロトコル標準の概要 キーワード: |
>>: ウェブサイト再構築後にトラフィックが減少した場合の対処方法
有名な海外ホスティング会社 asmallorange.com では、夏のプロモーションを実施していま...
一般的なニュースを広める手段として、Weibo のインタラクティブな形式はネットユーザーの間で人気が...
10月11日、アリババグループ主催の「2017年杭州雲棲カンファレンス」が杭州雲棲鎮で盛大に開催され...
現在、ウェブサイトの最適化を行う人員は絶えず変化しており、Baiduアルゴリズムはどのような方向に進...
ウェブマスターは、ユーザー エクスペリエンスが Web サイトのランキングにどのように影響するかにつ...
ベンダーが示唆するほど簡単に構築および保守できるテクノロジーベースのプロジェクトは多くなく、VDI ...
調査会社MarketsandMarketsによると、モノのインターネットとクラウドコンピューティング...
デジタル世界の発展はハッカーと密接に関係していることを多くの人が知っています。たとえば、マイクロソフ...
Baidu スナップショットに関して言えば、ウェブマスターは皆その重要性を知っています。これは Ba...
stableboxがホストモデムに登場したのは今回で2回目です。2月17日に「stablebox...
[[204001]] Kubernetes はコンテナ オーケストレーションの事実上の標準となり、コ...
聖パトリックデーを記念して、tinykvm は最小限のメモリを搭載した KVM を年間 20 ドルで...
企業向けでもウェブサイトマーケティング向けでも、ソフトテキストマーケティングは欠かせないマーケティン...
コンピュータ仮想技術の継続的な成熟と仮想技術のより現実的な運用により、クラウド教室は広く普及し、小中...
ウェブサイトで優れたユーザー エクスペリエンスを提供することは、検索エンジンの高要件ですが、ウェブサ...