IIS ログから検索エンジン スパイダーの活動の痕跡を見つけることについて議論する

IIS ログから検索エンジン スパイダーの活動の痕跡を見つけることについて議論する

サイト最適化のプロセスでは、サイトの問題をすべてウェブマスター ツールから直接取得できるわけではありません。多くの場合、ウェブマスター ツールから取得できる情報は、サイトで問題が発生した後でのみ検出できます。 SEO 担当者として、サイトの隠された情報についてさらに詳しく知る必要があります。たとえば、過去数日間に作成した外部リンクの結果はどうなっているか。コンテンツのどの側面が検索エンジン スパイダーに好まれる可能性が高いか。検索エンジン スパイダーはどの程度積極的にサイトをクロールしているか。など、これらはサイトのコンテンツ部門に隠された重要な情報です。ウェブマスターツールを通じてこの情報を分析することは困難です。この情報は当サイトの IIS ログで確認できます。

1: サイトの非表示情報を分析する上で IIS ログが重要な理由

1:この日記記録を通じて、スパイダーのクローリングルートやクローリング深度など、ウェブサイト上の検索エンジンスパイダーのクローリング情報をより明確に分析できます。このデータと情報を通じて、最近構築した外部リンクの有効性を分析できます。外部リンクは、クモが這うように導くクモの糸のようなものだということを私たちは知っているからです。外部リンクが適切に構築されていれば、クモは自然に這う頻度が高まり、クモが最も頻繁に入る「入り口」を記録できます。

2:ウェブサイトのコンテンツ更新とスパイダーのクロールには一定の関係があります。一般的に、安定して頻繁に更新する限り、スパイダーはより頻繁にクロールします。この目的のために、ログ内のスパイダー訪問頻度を使用して、Web サイトのコンテンツの更新頻度を微調整できます。

3: ログを通じて、一部のウェブマスター ツールでは検出されない可能性のある、スペース内のいくつかの障害を発見できます。例えば、最近人気のMeicheng Spaceは、技術者の誤操作によりBaidu Spiderをブロックしました。ウェブマスターが事前にスペースのログを分析していれば、このエラーを発見できたかもしれません。

2. ログファイルの取得方法と注意すべき事項

1: ログ ファイルを取得するには、当スペースに IIS ログ機能が必要です。当スペースにこの機能がある場合、ログ ファイルは通常、ウェブログ フォルダに記録されます。このフォルダから当サイトのログ ファイルを直接ダウンロードできます。

2: この機能を使用する場合、ログ生成時間の設定に注意する必要があります。作者の提案では、サイトが小規模な場合は 1 日に 1 回生成できます。大規模なサイトの場合は、生成されるファイルが大きくなりすぎないように、1 時間ごとに更新するようにすることができます。

3. クモの行動を分析し解釈する方法

サイトのログ ファイルをメモ帳で開き、メモ帳の検索機能を使用して、Baidu と Google のスパイダー (それぞれ BaiduSpider と Googlebot) を検索できます。

百度スパイダー

Googleスパイダー

以下のセクションに分けて分析することができます。

2012-04-5 00:47:10 この時点でクモがサイトに侵入したのです

116.255.109.63 このIPは当サイトを参照しています

GET の後に、スパイダーによってクロールされたページが続きます。ここから、どのページが最近クロールされたかを把握できます。 。

220.187.51.144 は IP 検索エンジン スパイダーの IP アドレスです。もちろん、ここには本物のアドレスと偽のアドレスが 2 つある可能性があります。では、このアドレスが本物のスパイダーなのか、偽装されたものなのかをどうやって見分けるのでしょうか。この記事では、著者が独自の小さな方法を紹介します。コマンド ウィンドウを開き、nslookup+ウィンドウ内のいわゆるスパイダーのアドレスを実行します。スパイダーが本物であれば、独自のサーバーを持っているはずですが、そうでなければ情報を見つけることができません。

本物の蜘蛛

偽の蜘蛛

では、なぜログに偽のスパイダーが存在するのでしょうか? その理由は、他のサイトが偽のスパイダーを装ってクロールし、サイトのコンテンツを取得するためです。これらの偽スパイダーが横行すると、サイトのサーバー消費に一定の影響が生じます。この方法を使用して、スパイダーを見つけてブロックすることができます。もちろん、慎重に扱う必要があります。そうしないと、実際のスパイダーを締め出すのに悪影響が出ます。

200 0 0 は、Web ページの通常のステータス コードを表します。もちろん、サーバーのタイムアウトを示す 500 など、異なる値を持つ他のステータス コードもあります。これらのステータス コードを使用して、サイト スペースの最近のパフォーマンスを分析できます。

スパイダーが最も頻繁にアクセスするページのログ ファイルを分析して記録し、スパイダーがそれらのページを好む内部的および外部的な理由を見つけることができます。

ウェブマスターとして、ほとんどの人はトラフィック、インクルージョン、バックリンクなどの直感的なデータの分析には慣れているかもしれませんが、ログ ファイルの分析には慣れていないかもしれません。ただし、ログはサイトにとって非常に重要です。この記事がログ ファイルの分析に役立つことを願っています。この記事は、Sanmianfans http://www.sanmianfans.com からの引用です。転載の際は出典を明記してください。


元のタイトル: IIS ログから検索エンジン スパイダーのアクティビティの痕跡を調査することについて話す

キーワード: トーク、iis、ログ、中潭、検索、インデックス、清珠、スパイダー活動、動的トレース、サイト、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  ウェブサイトには360°診断が必要

>>:  時代に合わせた製品はさらに進化できる

推薦する

これについて話しましょう: ウェブサイトを最適化するときに、外部リンクを投稿する必要はまだありますか?

外部リンクワーカーによるプロパガンダとジャンク外部リンクからの攻撃が長く続いた後、多くの SEO 担...

草の根ウェブマスターがビジネスを始める際に直面する6つの困難

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスインターネットが発展して...

serverhub: 月額 79 ドル、米国サーバー (7 つのデータセンター利用可能)、2*e5-2650v2/128g メモリ/1TSSD/1Gbps 無制限トラフィック、

米国の老舗ブランドサービスプロバイダーであるServerhub(2002〜)は、現在、米国/ポーラン...

Taobao の販売業者は Weibo マーケティングをどのように活用していますか?

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス新浪微博から騰訊微博への...

Webmaster.com からの毎日のレポート: Jike Search の内部闘争が Suning に大きな変化をもたらす

1. 蘇寧は大きな変革に向けて準備中:張金東氏が過去3年間の電子商取引の影響を振り返る国美との長年に...

予算vm-$39/E3-1230/4Gメモリ/250Gハードディスク/5Tトラフィック/ロサンゼルス/Alipay

budgetvm.com からメッセージを受け取りました: ロサンゼルス データ センターには特別価...

電子商取引プラットフォームの618アリーナ

毎年恒例の電子商取引イベント618が今年も開催されます。DouyinやKuaishouなどの新しい電...

ビジネス戦略のSWOT分析から検索最適化のSWOT分析まで

SWOT 分析法は、企業の確立された内部条件を分析して、企業の強み、弱み、コア競争力を見つけ出す企業...

ウェブサイトの最適化のために守るべきこと

SEO について知らないウェブマスターはいません。なぜなら、SEO の品質はトラフィック、さらにはウ...

Cloudsilkの香港VPSレビュー、3つのネットワークに中国移動のCMI回線をバックホールに使用させる

一昨日cloudsilkが立ち上げた香港のVPSはモバイルCMIとBGPネットワークに接続されていま...

ヘイティーの後半戦に対する隠れた懸念

ラッキンコーヒーに代表されるインターネットコーヒーの成功的な台頭により、コーヒー業界の「王様の地位」...

分析データの氾濫を克服するクラウドコンピューティングの役割

情報インフラストラクチャを近代化する戦略の一環として、企業はクラウド コンピューティングをより有効に...

エッジ コンピューティングはクラウド コンピューティングよりも優れている点は何ですか?ついに誰かが明らかにした

1. すべてに力を与えるユビキタス環境における IoT 技術の急速な発展により、杭州 IoT タウン...

BIGOとテンセントクラウドが戦略的提携を締結し、世界市場拡大を加速

1月18日、テンセントクラウドは世界的なビデオソーシャルプラットフォームBIGOとの戦略的提携を発表...

小売業者がクラウドに移行する際に考慮すべき 5 つの重要な質問

[[260649]]小売業者にとって今は混乱の時代です。顧客のショッピング習慣や期待は過去 10 年...