検索エンジン スパイダーのクロールのルールを調べる: 外部リンクはタイムリーですか?

検索エンジン スパイダーのクロールのルールを調べる: 外部リンクはタイムリーですか?

「検索エンジン スパイダーのクロール ルールの調査: スパイダーがリンクをクロールする方法」を書き終えてから 20 日以上が経ちました。書き続けたいと思っていましたが、最初の記事を書き終えた後、突然アイデアが尽きてしまいました。今日は、外部リンクの適時性、つまり外部リンクが無効になるかどうかについて友人と話しました。

この記事では理論的な内容については説明しませんが、最初の記事を証明するためにいくつかの例を示し、リンクの適時性についても説明します。

まず、外部リンクがあるページが削除されました。外部リンクは有効ですか?

リンクが配置されているページが削除された場合でも、回答は有効です。証拠は次のとおりです。

BlogChina の私のブログ (おそらく 2006 年に過度のアクセスのため削除されました) はずっと前に削除されましたが、Baidu にはまだスナップショットが残っています。今日確認したところ、ホームページのスナップショットは消えていましたが、記事ページはまだ存在していました。スナップショットの日付を見ると、2006 年またはそれ以前のものであることがわかります。

つまり、ページは 5 年間削除されていますが、Baidu のスナップショットは削除されていません。それでは、スパイダーがその中のリンクをクロールすると思いますか?

クロールされるはずだと思い、Blog.com の私のブログにはドメイン A へのリンクがあります。その時は、ブログのホームページにジャンプするだけにしました。その後、ドメイン名 A を使用してブログを開始したところ、すぐにかなりの注目を集め、記事が数秒で簡単に収集されるようになりました。 5年前のこのつながりが重要な役割を果たしたと信じています。

次に、検索エンジンに外部リンクが配置されているページのスナップショットがない場合、外部リンクは有効でしょうか?

その答えは多くの人を驚かせるかもしれません。外部リンクが配置されているページは、スナップショットがなくても有効な場合があります。その理由は、私が「スパイダーがリンクをクロールする方法」という記事で書いた内容にあります。ページをクロールした後、スパイダーはコンテンツとリンクを分離します。リンク、つまり URL は URL インデックス ライブラリに追加され、スパイダーのクロールはこの URL インデックス ライブラリから開始されます。

まずは証拠を見てみましょう。この証拠は Google ウェブマスター ツールから得たものです。

このスクリーンショットは、Google ウェブマスター ツールのトラブルシューティングの 404 レポートからのものです。以前は元の Web サイトの下に BBS を設定していましたが、もちろん N 年前に削除されました。しかし、Google スパイダーによってキャプチャされたこの存在しないページのソース アドレスも存在しないページです。ただし、Google で検索すると、これらのページのスナップショットは表示されません (以下を参照)。つまり、長い間 404 だったページのアウトバウンド リンクはまだ有効だということですか?

3 番目に、外部リンクは検索エンジンにとってタイムリーなものですか?

明らかに、時間に敏感であるべきです。次に、外部リンクが無効である理由を推測します。外部リンクがあるページが削除されているか、リンクが削除されているかの 2 つの理由が考えられます。

1. 削除されたページの場合、検索エンジンは、一定期間ページが 404 になるまでこのページの外部リンクをクロールし続け、その後、検索エンジンの URL インデックス ライブラリに外部リンクを削除するコマンドを送信します。

2. ページ変更の場合、検索エンジンは外部リンクを含むスナップショットが検索エンジン内で完全に削除されるまで外部リンクもクロールし、URL インデックス ライブラリに外部リンクを削除するコマンドが送信されます。外部リンクのあるページは状況に応じて N 期間のスナップショットを保存するため、異なる単語を検索すると Web ページのスナップショットが異なる場合があります。

つまり、外部リンクには期限がありますが、リンクの変更やページの削除は無効になるわけではありません。もちろん、検索エンジン内部では複雑な計算が行われており、プロセスは私が言ったほど単純ではありません。異なる意見がある場合は、この記事の下にメッセージを残していただき、お互いに議論しましょう。

転載の際は、Xiaoyao Blogの記事であることを明記してください。この記事のアドレスは、http://liboseo.com/1111.htmlです。

著作権を尊重し、転載の際は出典とリンクを明記してください。

関連記事: 検索エンジンスパイダーのクロールルールの探究: スパイダーがリンクをクロールする方法

元のタイトル: 検索エンジン スパイダーのクロールのルールを探る 2: 外部リンクはタイムリーですか?

キーワード: 検索、エンジン、スパイダー、クロール、ルール、探索、外部リンク、適時性、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  ウェブサイトの再設計の分析例: トラフィックが 10,000 以上から 1 桁に減少

>>:  究極のネットワークプロモーション:QQグループのプロモーション方法

推薦する

2019年のインターネット業界に関する10の予想

もう1年も終わりに近づき、例年通り、あらゆる専門・非専門の組織や個人が「2019年の総括」や「新年の...

クラウドベースのアーキテクチャとオープンソースが必ずしも融合しない理由

クラウドベースのアーキテクチャとオープンソースは理想的な組み合わせのはずですが、Kubernetes...

vmiss: 香港 VPS (メガデータセンター/BGP 回線)、月額 4 カナダドル (21 元)、300M 帯域幅、1G メモリ/1 コア/10gSSD/400G トラフィック

Vmissは最近、オリジナルの香港VPS(中国-香港-最適化BGP)をベースにした「中国-香港-最適...

外部リンク構築とウェブサイト最適化の関係

ウェブサイトがかなりのトラフィックと人気を獲得するための最も直接的な方法は、ユーザーにウェブサイトの...

クリック数を最適化するための Google の高度な最適化技術

前回の高度な最適化では、アカウントの品質スコアを最適化する方法について説明しました。品質スコアが保証...

Zunxiang.comの崩壊の暴露:高級品Eコマースのビジネスモデルは疑問視されている

他の人は貪欲だが、私は恐れている。バフェットのこの古典的な投資の引用は、高級電子商取引業界に非常に適...

境界ネットワーク セキュリティの再定義: ハイブリッドが未来

情報がクラウドにさらに流入するにつれて、境界セキュリティの役割は変化し、ネットワーク セキュリティの...

良いランキングを獲得するための重要な要素は、外部リンクではなくユーザーエクスペリエンスです。

SEO は、ランキングを上げるために多数の外部リンクを使用する従来の方法から、ウェブサイトの総合的な...

アリババクラウド河源データセンターが正式にオープン、流行中に2時間で1万台のクラウドサーバーを拡張

2月18日、アリババクラウドは公式サイトで、河源データセンターが正式に外部にサービスを提供開始したと...

ユーザーはマズローの欲求階層理論に何を求めているのか

SEO 業界は本質的にサービス業界です。サービス業は第三次産業であり、利用者に金銭を支払ったり、直接...

古い方法で次世代のデータセンターを保護できるでしょうか?

[51CTO 海外ニュース ヘッドライン 10 月 11 日] 残念ながら、新しい調査によると、多く...

Alibaba、JD.com、Pinduoduo、ソーシャルeコマース企業間の戦いは間違いなく起こるでしょう!

コア読書: 1. Alibaba と JD はソーシャル e コマースにどのようなモデルを選択します...

SEO の誤解: ランキングの低下 = Baidu の権威の低下?

ウェブサイトのランキングに関しては、すべてのウェブマスターが非常に心配しています。多くのウェブマスタ...

layerae: 高性能シンガポール VPS/10Gbps 帯域幅/年間支払い 20 ドルから、512M メモリ/1 コア/10g NVMe/500g トラフィック

layer.ae はシンガポール VPS サービスを追加しました。開始価格は引き続き年間 20 米ド...

タオバオは偽オープンだと非難され、サービスプロバイダーの外部リンクギャラリーを禁止する可能性

タオバオ画像スペース【Ebrun Power Network News】タオバオの強さを徐々に感じて...