ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス SEO を行う際、多くの人はスパイダークローリングの原理やインクルードインデックスの関係を理解していません。この記事では主に、実戦におけるスパイダーとインクルードの関係について説明します。原理についてではなく、乾物と経験についてのみ説明します。 まず、スパイダーというと、次のような IP を思い浮かべるかもしれません。 220.181.108.89 は、ホームページの IP ウェイト セグメントをクロールする専用です。一般的な戻りコードは 304 0 0 で、更新されていないことを意味します。 220.181.108.94 は、ホームページの IP ウェイト セグメントをクロールする専用です。一般的な戻りコードは 304 0 0 で、更新されていないことを意味します。 220.181.108.97 は、ホームページの IP ウェイト セグメントをクロールする専用です。一般的な戻りコードは 304 0 0 で、更新されていないことを意味します。 220.181.108.80 は、ホームページの IP ウェイト セグメントをクロールする専用です。一般的な戻りコードは 304 0 0 で、更新されていないことを意味します。 220.181.108.77 は、ホームページをキャプチャするための専用の IP ウェイト セグメントです。一般的な戻りコードは 304 0 0 で、更新されていないことを意味します。 理解するのは難しいでしょうか?しかし、ネットワークメンテナンスや LAN ネットワークの構築を行ったことがある人なら、各 IP がコンピューターに対応し、各サーバーグループがネットワークセグメントに対応していることを理解できるでしょう。 たとえば、ネットワーク セグメント 220.181.108.x を収集サーバー グループと呼びます。このサーバー グループの下には、コンピューター ABCDE と対応する IP アドレスがあります。各コンピューターには、対応する収集プログラムがインストールされています。 これで分かりましたか? たとえば、Baidu にリンクを送信すると、インデックス サーバー グループのコンピューター C にこのリンクを送信するのと同じになります。 たとえば、リンク 1、2、3 を送信した場合、これら 3 つのリンクは、含まれているサーバー グループ内のコンピューター C、D、E にそれぞれ送信されています。そのため、ログを確認すると、これら 3 つのリンクが異なる IP アドレス、つまり異なるコンピューターに対応していることがわかります。 なぜ 3 つのリンクが 3 台の異なるコンピューターに送信されているのでしょうか。私の推測では、送信されたデータが多すぎて同じコンピューターで処理できないため、分散処理方式が採用されているのではないかと思います。 (これは単なる私の推測であり、研究による証明ではありませんが、おそらくそれに対処するより高度な方法です)。 昨日テストをして、オリジナル記事を 3 つ書きました。公開後、最短時間でスパイダーのクローリング状況を確認しました。この 3 つの記事の IP アドレスは次の通りです。 116.179.32.135 – サーバー 1 220.181.108.122 – サーバー 2 220.181.108.180 – サーバー 3 最初の記事を書き終えると、数分以内にインデックスに含まれました。その後、最初の記事の執筆フレームワークを真似て、2番目の記事を書き続けました。2番目の記事も数分以内にインデックスに含まれました。その後、3番目の記事を書き続けました。残念ながら、3番目の記事は含まれませんでした。 しかし翌日には 3 つの記事がすべて掲載され、3 番目の記事が 1 日おきに掲載されたことになります。 もう一度、IP 116.179.32.135 を確認しました。この IP は、山西省陽泉市の China Unicom に属しています。116.179.32.X ネットワーク セグメントにスパイダーが存在する理由を疑問に思う人は多いでしょう。これで、このネットワーク セグメントが Baidu スパイダーであることが確実になりました。nslookup 検証に加えて、次の点も証拠となります。 蜘蛛があなたの体を這うのは良いニュースですか?蜘蛛が這う原理を理解する時が来ました!収集問題を明らかに! さらに、百度の李社長の出身地も陽泉市なので、検索サーバーの一部も山西省に移されたことを示す証拠がいくつかある。 上記の実際の経験と、以前の収集とクロールのスパイダー分析を組み合わせると、リンクが 116.179.32.135、または 220.181.108.122、220.181.108.180 などに送信されている限り、リンクは確実にインクルードされます。したがって、インクルード パスワードのロックを解除する際の唯一の難しさは、制御リンクがこれらのサーバーに送信されているかどうかです。 220 で始まるのが公式スパイダースで、116 で始まるのが地元のスパイダースだと冗談を言う人もいました。ハハ、大物たちがこの問題を一緒に研究してくれるといいですね。 この記事は最初にZhengjingshuoによって公開されました:zhanzhang/779.html 起業レポートを申請し、優れた起業アイデアを共有しましょう。新しい起業の機会について一緒に話し合うには、ここをクリックしてください。 元のタイトル: 運用上の注意: スパイダークローリングの原理を理解するときが来ました!インクルージョンの謎を解明する キーワード: Baidu スパイダー、検索エンジン スパイダー |
>>: 新しいウェブサイトのキーワードをより最適化するにはどうすればよいでしょうか?
誰もが、大手ソーシャル シェア ボタン プロバイダーの 1 つである Jiathis についてよく知...
鶏が先か卵が先かは未解決の問題のままである。ウェブサイトのプロモーション活動では、外部リンクを構築す...
マルチクラウド モデルは業界で認知度が高まっており、企業は複数のクラウド プロバイダーからさまざまな...
この記事は、外部リンクの総合的な構築を探求することを目的としています。フォームを作成して共有しました...
vmhausは正式にAlipay決済を受け入れると発表し、後日WeChat決済とUnionPay決済...
10gbiz は現在、618 中間セールに備えて香港と米国でサービスの割引を提供しています。専用サー...
「今は電子商取引の冬だ」と言われているが、タオバオ、特に伝統的なブランド企業はTmallでかなり良い...
dominionhosting は 10 年以上の歴史を持つホスティング会社です。前身は newwe...
SEO 担当者の 10 人中 9 人は外部リンクの重要性を認識しており、外部リンクの構築に精力的に取...
私は再び SEO に関する記事を書き始めましたが、SEO は以前と同じくらいシンプルであることがわか...
近年、地域人材ネットワークの人気が高まっています。地域人材ネットワークと包括的な全国人材ネットワーク...
近年、ますます大規模なデータセットを処理するために SaaS (サービスとしてのソフトウェア) モデ...
セルフサービス型ウェブサイト構築ツールのデザインは似すぎているたとえば、Fanke の Web サイ...
XENVZ.co.uk は openitc.co.uk (2008 年に英国で登録された会社なので、...
私自身の業務経験や情報をもとにまとめたブランドマーケティング運用マニュアルです。ブランド マーケティ...