IIS ログから検索エンジン スパイダーの活動の痕跡を見つけることについて議論する

IIS ログから検索エンジン スパイダーの活動の痕跡を見つけることについて議論する

サイト最適化のプロセスでは、サイトの問題をすべてウェブマスター ツールから直接取得できるわけではありません。多くの場合、ウェブマスター ツールから取得できる情報は、サイトで問題が発生した後でのみ検出できます。 SEO 担当者として、サイトの隠された情報についてさらに詳しく知る必要があります。たとえば、過去数日間に作成した外部リンクの結果はどうなっているか。コンテンツのどの側面が検索エンジン スパイダーに好まれる可能性が高いか。検索エンジン スパイダーはどの程度積極的にサイトをクロールしているか。など、これらはサイトのコンテンツ部門に隠された重要な情報です。ウェブマスターツールを通じてこの情報を分析することは困難です。この情報は当サイトの IIS ログで確認できます。

1: サイトの非表示情報を分析する上で IIS ログが重要な理由

1:この日記記録を通じて、スパイダーのクローリングルートやクローリング深度など、ウェブサイト上の検索エンジンスパイダーのクローリング情報をより明確に分析できます。このデータと情報を通じて、最近構築した外部リンクの有効性を分析できます。外部リンクは、クモが這うように導くクモの糸のようなものだということを私たちは知っているからです。外部リンクが適切に構築されていれば、クモは自然に這う頻度が高まり、クモが最も頻繁に入る「入り口」を記録できます。

2:ウェブサイトのコンテンツ更新とスパイダーのクロールには一定の関係があります。一般的に、安定して頻繁に更新する限り、スパイダーはより頻繁にクロールします。この目的のために、ログ内のスパイダー訪問頻度を使用して、Web サイトのコンテンツの更新頻度を微調整できます。

3: ログを通じて、一部のウェブマスター ツールでは検出されない可能性のある、スペース内のいくつかの障害を発見できます。例えば、最近人気のMeicheng Spaceは、技術者の誤操作によりBaidu Spiderをブロックしました。ウェブマスターが事前にスペースのログを分析していれば、このエラーを発見できたかもしれません。

2. ログファイルの取得方法と注意すべき事項

1: ログ ファイルを取得するには、当スペースに IIS ログ機能が必要です。当スペースにこの機能がある場合、ログ ファイルは通常、ウェブログ フォルダに記録されます。このフォルダから当サイトのログ ファイルを直接ダウンロードできます。

2: この機能を使用する場合、ログ生成時間の設定に注意する必要があります。作者の提案では、サイトが小規模な場合は 1 日に 1 回生成できます。大規模なサイトの場合は、生成されるファイルが大きくなりすぎないように、1 時間ごとに更新するようにすることができます。

3. クモの行動を分析し解釈する方法

サイトのログ ファイルをメモ帳で開き、メモ帳の検索機能を使用して、Baidu と Google のスパイダー (それぞれ BaiduSpider と Googlebot) を検索できます。

百度スパイダー

Googleスパイダー

以下のセクションに分けて分析することができます。

2012-04-5 00:47:10 この時点でクモがサイトに侵入したのです

116.255.109.63 このIPは当サイトを参照しています

GET の後に、スパイダーによってクロールされたページが続きます。ここから、どのページが最近クロールされたかを把握できます。 。

220.187.51.144 は IP 検索エンジン スパイダーの IP アドレスです。もちろん、ここには本物のアドレスと偽のアドレスが 2 つある可能性があります。では、このアドレスが本物のスパイダーなのか、偽装されたものなのかをどうやって見分けるのでしょうか。この記事では、著者が独自の小さな方法を紹介します。コマンド ウィンドウを開き、nslookup+ウィンドウ内のいわゆるスパイダーのアドレスを実行します。スパイダーが本物であれば、独自のサーバーを持っているはずですが、そうでなければ情報を見つけることができません。

本物の蜘蛛

偽の蜘蛛

では、なぜログに偽のスパイダーが存在するのでしょうか? その理由は、他のサイトが偽のスパイダーを装ってクロールし、サイトのコンテンツを取得するためです。これらの偽スパイダーが横行すると、サイトのサーバー消費に一定の影響が生じます。この方法を使用して、スパイダーを見つけてブロックすることができます。もちろん、慎重に扱う必要があります。そうしないと、実際のスパイダーを締め出すのに悪影響が出ます。

200 0 0 は、Web ページの通常のステータス コードを表します。もちろん、サーバーのタイムアウトを示す 500 など、異なる値を持つ他のステータス コードもあります。これらのステータス コードを使用して、サイト スペースの最近のパフォーマンスを分析できます。

スパイダーが最も頻繁にアクセスするページのログ ファイルを分析して記録し、スパイダーがそれらのページを好む内部的および外部的な理由を見つけることができます。

ウェブマスターとして、ほとんどの人はトラフィック、インクルージョン、バックリンクなどの直感的なデータの分析には慣れているかもしれませんが、ログ ファイルの分析には慣れていないかもしれません。ただし、ログはサイトにとって非常に重要です。この記事がログ ファイルの分析に役立つことを願っています。この記事は、Sanmianfans http://www.sanmianfans.com からの引用です。転載の際は出典を明記してください。


元のタイトル: IIS ログから検索エンジン スパイダーのアクティビティの痕跡を調査することについて話す

キーワード: トーク、iis、ログ、中潭、検索、インデックス、清珠、スパイダー活動、動的トレース、サイト、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  ウェブサイトには360°診断が必要

>>:  時代に合わせた製品はさらに進化できる

推薦する

対外貿易促進: 公開した製品をすぐに掲載してもらうにはどうすればよいでしょうか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています多くの貿易...

電子商取引企業が失敗する10の一般的な方法:単に製品を販売し、新しいメディアに関する知識が不足している

1. 純粋な販売思考コメント: これは、従来のブランドの従来のマーケティング思考が電子商取引の運営に...

コンテナクラウドリソースデータの関連付けとデータ連携の難しさと解決策

コンテナ クラウドがますます多くのビジネスをカバーするようになるにつれて、コンテナ クラウドの日常的...

クラウド コンピューティングをすぐに理解しましょう。クラウド コンピューティングとは正確には何でしょうか?

クラウドコンピューティングとは何ですか?クラウド コンピューティングは非常に注目されている概念ですが...

外国貿易SEO最適化の細部は、ウェブサイトのキーワードランキングを向上させる

現在の経済グローバル化の時代では、世界の金融が徐々に融合して一体化しており、国内外の貿易交流がますま...

perfectip 香港 VPS9.99 USD/月1Gメモリ/1M無制限

perfectip は、主にサーバーのレンタルとホスティングを提供する企業です。また、豊富なリソース...

UGVPS - 2.5g メモリ/80g ハードディスク/2T トラフィック/年間 45 ドル

UGVPS は、2.5g メモリ/80g ハードディスク/2T トラフィック/年間 45 ドルの特別...

CIOがクラウドサービスプロバイダーについて知っておくべき5つのこと

クラウド サービス プロバイダーは、展開速度の向上や将来の柔軟性の確保など、IT リーダーが運用を成...

経験の共有: QQ スペースをマーケティングに活用するには?

QQは中国最大のチャットツールであり、QQ Spaceは多くのユーザーを魅了しています。したがって、...

Baiduは外部リンクツールをリリースしており、4つの主要な機能を備えている。

10月30日午後、Baidu Webmaster Platformツールが更新されました。アドレスは...

クラウドサービスの選択に必読: 12 社以上の IaaS プロバイダーの長所と短所を比較

AWS、Microsoft Azure、Google、IBM は長い間パブリック クラウド IaaS...

エルケの突然の人気から、​​国内ブランドが長期的な成功を収める方法についてお話ししましょう。

昨日から今に至るまで、私の友人の輪にはERKEに関するメッセージが殺到しています。多くの人の記憶の中...

Bステーションはサークル外、UPホストは左

Bilibiliはサークルから抜け、UPホストも去っていきます。 6月14日、「ウィザードファイナン...

vps.net、100tb.com の登録と購入方法、アカウントレビューの問題を解決する方法

VPS.NET などの大手 VPS ベンダーはインターネット上での評判は良いのですが、登録制限が厳し...