Google のインデックスまたは検索結果からコンテンツを削除することについての簡単な説明

Google のインデックスまたは検索結果からコンテンツを削除することについての簡単な説明

「Google ウェブマスター ツールから URL を削除するか、ロボット ファイルを使用してスパイダーによる特定の種類のリンクのクロールをブロックすると、Google はこれらのコンテンツをインデックス ライブラリから自然に削除します。」私を含め多くの人がそう思っていると思いますが、これは実際には完全に正しいわけではありません。

まず、Google 管理者の URL 削除ツールは、主に 2 種類の URL を削除するために使用されます。1 つは 404 エラー URL であり、もう 1 つはスパイダーがログ ファイルに大量にクロールする無効なアドレス (Web サイトの内部リンク、パラメータを含むリンクなど) です。これら 2 種類のアドレスを削除申請すると、検索結果に表示されなくなる場合があります。ただし、検索エンジンのインデックス ライブラリでは、明確な HTTP 戻りコード 404 Not Found を持つページはインデックス ライブラリに存在しなくなりますが、2 番目のタイプのスパイダーによって大量にクロールされた無効なアドレスは、実際にはインデックス ライブラリにまだ存在します。

次に、ロボット ファイルを使用してスパイダーによる特定の種類のリンクのクロールをブロックすると、Google がこれらのリンクをインデックスするのを防ぐことができます。ただし、ロボット ファイルを使用してブロックするのが Google がこれらのリンクをインデックスする前か、Google がこれらのリンクをインデックスした後かによって異なります。これら 2 つの操作の効果は異なります。最初のタイプでは、Google がこれらのリンクをインデックスする前に、ロボット ファイルを使用してクロールしたくないリンクをブロックします。この場合、これらのリンクはクロールされず、Google インデックス ライブラリに含まれることもありません。2 番目のタイプでは、Google がこれらのリンクをインデックスした後に、ロボット ファイルを使用して特定の種類のリンクをブロックします。この場合、これらの種類のリンクは Google インデックス ライブラリに残りますが、スパイダーはこれらのリンクをクロールしなくなり、検索結果に表示されなくなります。同時に、スパイダーが限られたクロール量内でより意味のあるリンクをクロールできるようにすることもできます。

上記の紹介を通じて、Google のインデックス ライブラリからコンテンツを削除することと、検索結果からコンテンツを削除することは 2 つの異なる概念であることを説明したいと思います。インデックス ライブラリから削除されたコンテンツは、検索結果に表示されなくなりますが、検索結果から削除されたコンテンツはインデックス ライブラリにまだ存在する可能性があり、Web サイトのインデックス ボリュームに関する有効な統計に影響します。

したがって、Google のインデックスからコンテンツを削除する場合は、これらのコンテンツ リンクがスパイダーによってクロール可能であり、これらのコンテンツ リンクがロボット ファイルによってブロックされないようにする必要があります。これを行うには、次の 3 つの方法があります。

(1)メタタグ

ページの<head>コードに<meta name="robots" content="noindex,follow">を追加して、ページがインデックスに登録されないようにすることができます。

(2)404点または410点

404 - ファイル、クエリ、または URL が見つかりません

410 - リソースはサーバー上で利用できなくなり、これ以上の参照はありません

これら 2 つのタグは一般的に同じものと考えられていますが、微妙な違いがあります。410 タグは通常再クロールを必要としないため、410 でマークされたリンクは 404 でマークされたリンクよりも早く Google のインデックスから削除されます。実際には、両者の微妙な違いは重要ではありませんが、410 マークをうまく使用できる場合は、410 マークが適切な選択となります。

スパイダーが 404/410 エラー リンクにクロールすると、Web サイトのログと管理者ツールのクロール エラー セクションに反映されます。このとき、URL 削除ツールを通じて削除することができ、削除されたコンテンツはインデックス化されません。

(3)301リダイレクトまたはその他の方法

301 リダイレクトは、Google のインデックスからコンテンツを削除し、古いリンクの重みの大部分を新しいリンクに移行するのにも適したオプションです。ただし、このプロセスは比較的長く、古いリンクの重みを新しいリンクに移行するのにどれくらいの時間がかかるのか、移行される重みの割合はどれくらいになるのかなど、Google は明らかにしていません。

上記内容は著者の個人的意見です。間違っている点がありましたら、ご指摘や議論をいただければ幸いです。


元のタイトル: Google のインデックスまたは検索結果からコンテンツを削除することに関する簡単な説明

キーワード: URL の削除、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  テンセント、WeChatパブリックアカウントの再認証プロセスを是正する措置を講じる

>>:  ウェブマスターの皆さん、現状に直面しても前進できますか?

推薦する

ウェブマスターネットワークからの毎日のレポート:電子商取引の価格戦争が拡大、ビデオ業界は再び言葉の戦争に巻き込まれる

1. 電子商取引の価格競争は依然として拡大中:ニューエッグは利益率向上に3億元を投資業界が「史上最大...

PRアップデート検索エンジンがメーデーギフトをプレゼント

SEOの基本作業は、毎日、自社サイトと競合サイトのデータ更新に注意を払うことです。今日、例外なくクエ...

クラウドベースのアプリケーションを保護するための攻撃チェーンアプローチの改善

情報セキュリティの専門家は、サイバー侵入を識別して防止するためのサイバー攻撃チェーン フレームワーク...

UCloud 人工知能と Intel の背後にある技術的なストーリーを分析する (パート 2)

前回の記事では、UAI-Service が Intel のテクノロジーを活用して、クラウド ホストを...

コンテンツの更新頻度と検索エンジンの関係

まず、コンテンツの継続的な更新は、Web サイトの存続と発展のための最も基本的な条件であることを説明...

組織がクラウドコンピューティングの利用を最適化するためのいくつかの方法

今では、IT 業界の誰もが 1 つのことを知っています。クラウド コンピューティングとデータ センタ...

JavaScript: ルールを全て破る 間違ったことが役に立つかもしれない

北京時間のこの日の早朝、 Twitter のフロントエンド エンジニアである Angus Crol ...

初心者のウェブサイトの最適化プロセスを共有します

私はまだ始めたばかりの小さなウェブマスターで、5 つのウェブサイトを持っていました。卒業したばかりだ...

2023 年のマルチクラウドに関する 4 つの重要な考慮事項

NetApp のチーフ エバンジェリストである Matt Watts 氏は、マルチクラウド導入の進化...

医療業界におけるマルチアクセスエッジコンピューティングの応用

5G商用時代の完全な進歩により、エッジコンピューティングは革新的なアプリケーションサービスを促進する...

クラウドの可観測性における5つの主要な新たなトレンド

[[431137]] Red Hat の主席ソフトウェア エンジニアである Bartłomiej P...

tmhhost: フィリピンサーバー、1456元/e3-1230v3/8gメモリ/1Tハードディスク/20M帯域幅

tmhhost はフィリピンで独立したサーバー サービスを提供しています。サーバーはフィリピンの P...

神馬検索がBATからドメイン名を奪取中

今年のメーデーを前に、UC有視とアリババは共同で「神馬」モバイル検索を開始し、「優位」を誇っていた百...