「Google ウェブマスター ツールから URL を削除するか、ロボット ファイルを使用してスパイダーによる特定の種類のリンクのクロールをブロックすると、Google はこれらのコンテンツをインデックス ライブラリから自然に削除します。」私を含め多くの人がそう思っていると思いますが、これは実際には完全に正しいわけではありません。 まず、Google 管理者の URL 削除ツールは、主に 2 種類の URL を削除するために使用されます。1 つは 404 エラー URL であり、もう 1 つはスパイダーがログ ファイルに大量にクロールする無効なアドレス (Web サイトの内部リンク、パラメータを含むリンクなど) です。これら 2 種類のアドレスを削除申請すると、検索結果に表示されなくなる場合があります。ただし、検索エンジンのインデックス ライブラリでは、明確な HTTP 戻りコード 404 Not Found を持つページはインデックス ライブラリに存在しなくなりますが、2 番目のタイプのスパイダーによって大量にクロールされた無効なアドレスは、実際にはインデックス ライブラリにまだ存在します。 次に、ロボット ファイルを使用してスパイダーによる特定の種類のリンクのクロールをブロックすると、Google がこれらのリンクをインデックスするのを防ぐことができます。ただし、ロボット ファイルを使用してブロックするのが Google がこれらのリンクをインデックスする前か、Google がこれらのリンクをインデックスした後かによって異なります。これら 2 つの操作の効果は異なります。最初のタイプでは、Google がこれらのリンクをインデックスする前に、ロボット ファイルを使用してクロールしたくないリンクをブロックします。この場合、これらのリンクはクロールされず、Google インデックス ライブラリに含まれることもありません。2 番目のタイプでは、Google がこれらのリンクをインデックスした後に、ロボット ファイルを使用して特定の種類のリンクをブロックします。この場合、これらの種類のリンクは Google インデックス ライブラリに残りますが、スパイダーはこれらのリンクをクロールしなくなり、検索結果に表示されなくなります。同時に、スパイダーが限られたクロール量内でより意味のあるリンクをクロールできるようにすることもできます。 上記の紹介を通じて、Google のインデックス ライブラリからコンテンツを削除することと、検索結果からコンテンツを削除することは 2 つの異なる概念であることを説明したいと思います。インデックス ライブラリから削除されたコンテンツは、検索結果に表示されなくなりますが、検索結果から削除されたコンテンツはインデックス ライブラリにまだ存在する可能性があり、Web サイトのインデックス ボリュームに関する有効な統計に影響します。 したがって、Google のインデックスからコンテンツを削除する場合は、これらのコンテンツ リンクがスパイダーによってクロール可能であり、これらのコンテンツ リンクがロボット ファイルによってブロックされないようにする必要があります。これを行うには、次の 3 つの方法があります。 (1)メタタグ ページの<head>コードに<meta name="robots" content="noindex,follow">を追加して、ページがインデックスに登録されないようにすることができます。 (2)404点または410点 404 - ファイル、クエリ、または URL が見つかりません 410 - リソースはサーバー上で利用できなくなり、これ以上の参照はありません これら 2 つのタグは一般的に同じものと考えられていますが、微妙な違いがあります。410 タグは通常再クロールを必要としないため、410 でマークされたリンクは 404 でマークされたリンクよりも早く Google のインデックスから削除されます。実際には、両者の微妙な違いは重要ではありませんが、410 マークをうまく使用できる場合は、410 マークが適切な選択となります。 スパイダーが 404/410 エラー リンクにクロールすると、Web サイトのログと管理者ツールのクロール エラー セクションに反映されます。このとき、URL 削除ツールを通じて削除することができ、削除されたコンテンツはインデックス化されません。 (3)301リダイレクトまたはその他の方法 301 リダイレクトは、Google のインデックスからコンテンツを削除し、古いリンクの重みの大部分を新しいリンクに移行するのにも適したオプションです。ただし、このプロセスは比較的長く、古いリンクの重みを新しいリンクに移行するのにどれくらいの時間がかかるのか、移行される重みの割合はどれくらいになるのかなど、Google は明らかにしていません。 上記内容は著者の個人的意見です。間違っている点がありましたら、ご指摘や議論をいただければ幸いです。 元のタイトル: Google のインデックスまたは検索結果からコンテンツを削除することに関する簡単な説明 キーワード: URL の削除、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化 |
<<: テンセント、WeChatパブリックアカウントの再認証プロセスを是正する措置を講じる
>>: ウェブマスターの皆さん、現状に直面しても前進できますか?
1. 電子商取引の価格競争は依然として拡大中:ニューエッグは利益率向上に3億元を投資業界が「史上最大...
SEOの基本作業は、毎日、自社サイトと競合サイトのデータ更新に注意を払うことです。今日、例外なくクエ...
情報セキュリティの専門家は、サイバー侵入を識別して防止するためのサイバー攻撃チェーン フレームワーク...
前回の記事では、UAI-Service が Intel のテクノロジーを活用して、クラウド ホストを...
Hostarmada は設立されてまだ 2 年も経っていない外国のホスティング会社です。効果的なプロ...
まず、コンテンツの継続的な更新は、Web サイトの存続と発展のための最も基本的な条件であることを説明...
今では、IT 業界の誰もが 1 つのことを知っています。クラウド コンピューティングとデータ センタ...
北京時間のこの日の早朝、 Twitter のフロントエンド エンジニアである Angus Crol ...
私はまだ始めたばかりの小さなウェブマスターで、5 つのウェブサイトを持っていました。卒業したばかりだ...
NetApp のチーフ エバンジェリストである Matt Watts 氏は、マルチクラウド導入の進化...
digital-vm は、すべての VPS を対象に 40% 割引のプロモーションを開始しました。す...
5G商用時代の完全な進歩により、エッジコンピューティングは革新的なアプリケーションサービスを促進する...
[[431137]] Red Hat の主席ソフトウェア エンジニアである Bartłomiej P...
tmhhost はフィリピンで独立したサーバー サービスを提供しています。サーバーはフィリピンの P...
今年のメーデーを前に、UC有視とアリババは共同で「神馬」モバイル検索を開始し、「優位」を誇っていた百...