SEO 担当者が IIS ログを通じてスパイダーの動きを分析する方法の例

SEO 担当者が IIS ログを通じてスパイダーの動きを分析する方法の例

最適化プロセスでは、私たちを悩ませるいくつかの問題に必然的に遭遇しますが、これらの問題は最適化戦略に関連しています。たとえば、私たちが作成した外部リンクはどの程度効果的か?私たちのスペースには肉眼では見えない不安定さはあるか?私たちのコンテンツの中でどのコンテンツがより好まれているか?検索エンジンのスパイダーはどのくらいの頻度で私たちのサイトをクロールしているか?などです。これらの問題は、最適化分析と戦略策定に関連します。では、これらの問題をより適切に分析できるチャネルは何でしょうか? サイトの IIS ログ ファイルを分析できます。

1: SEOにおけるIISの重要性

1: サイトの IIS ログを通じて、検索エンジンのクロール トラックやクロール量など、検索エンジンによるサイトのクロールを把握し、構築した外部リンクがクロールに与える影響を分析できます。外部リンクは、検索エンジン スパイダーがサイトに入るための入り口です。同時に、IIS レコードには、入り口からクロールする検索エンジン スパイダーが記録されます。

2:サイトの更新頻度と検索エンジンのクロール頻度には一定の関係があり、一般的には更新頻度が高いほど検索エンジンのクロール頻度も高くなります。 IIS ログの検索エンジンのクロール頻度を使用して、コンテンツの更新を微調整できます。

3: IIS ログには、サイトのスペースに外部からは識別できないエラーがあることが示され、これらのエラーは IIS ログに初めて反映されることがあります。ログを使用すると、問題を早期に検出して解決できます。

4: 同時に、IIS ログを通じて、コンテンツのどのコンテンツが検索エンジンに好まれ、どのコンテンツが検索エンジンに無視されるかを分析できます。このデータを活用してコンテンツを微調整します。

2. サイトのIISログの取得方法と設定上の注意

1: まず、ホストはサイトの IIS ログのダウンロードをサポートしている必要があります。購入時に、ホスト プロバイダーと連絡を取り、サポートされているかどうかを明確にする必要があります。サポートされている場合、通常はウェブログ ファイルにあり、このファイルから直接サイトのログ ファイルを取得できます。

2: 同時に、著者はログ生成を 1 時間に 1 回に設定することを推奨していることに注意する必要があります。コンテンツが少ない小規模または中規模のサイトの場合は、1 日に設定できます。コンテンツが大量にあり、1 日に 1 回生成されるように設定した場合、ログ ファイルが大きすぎる可能性があります。

3: IISログを分析する方法

1: ログファイルの分解と分析

メモ帳を使用してログ ファイルを開き、Ctrl + F を押して 2 つの検索エンジン スパイダー、BaiduSpider と Googlebot を検索できます。下の図に示すように

百度スパイダー

Googleスパイダー

セクションごとに分析することができます

2012-04-5 00:47:10 は検索エンジンスパイダーがこのページをクロールした時間を指します

116.255.109.37 このアドレスは当サイトのIPアドレスです

GET はイベントを表し、その後にスパイダーがクロールするページが続き、/ はホームページを表します。

220.187.51.144 この IP は、検索エンジン スパイダーのサーバーの IP アドレスを指します。このアドレスは検索エンジンスパイダーの実際の IP アドレスではない場合があります。どうすれば区別できるでしょうか? 私が行っている方法の 1 つを紹介します。コンピューターで CMD ウィンドウを開くことができます。 nslookup+IP アドレスを入力します。本物のスパイダーであれば、独自のスパイダー サーバーが存在します。下の図に示すように

本物の蜘蛛

偽の蜘蛛

追加されたスパイダー IP が表示されるのはなぜでしょうか? それは、誰かが検索エンジン スパイダーを装って、コンテンツを収集するためにサイトにアクセスするためです。過剰な収集はホストのリソースを消費します。このため、偽の IP の 1 つに基づいてブロックすることができます。

200 0 0 はステータス コードです。ステータス コードによって意味が異なり、たとえば 200 はダウンロード成功、500 はサーバー タイムアウトを意味します。これらは、ある程度、ホストのステータスを反映しています。

2: ログ分析を使用すると、スパイダーが最も頻繁にクロールするページを見つけて記録し、検索エンジン スパイダーがなぜそのページを好むのかを分析できます。​

3: URL アドレスが統一されていないことがあり、スラッシュ付きとスラッシュなしの URL アドレスに問題があります。検索エンジンのスパイダーは、これをスラッシュ付きのページへの 301 ジャンプとして自動的に識別します。ここで、検索エンジンがディレクトリを判別できることがわかるため、URL を統一する必要があります。​

4: 検索エンジンのスパイダーは、一般的にホームページ、ディレクトリ ページ、内部ページの順に、重みの降順でサイト ページをクロールします。​

IIS ログは、サイトの状態を分析するための重要なデータであり、最適化戦略を策定するための重要な指標の 1 つです。頻繁に分析して要約する必要があります。サイトのリソースを有効に活用してください。この記事はFree Movies http://www.ynt01.com/によって編集されています。転載の際は出典を明記してください。

元のタイトル: SEO 担当者が IIS ログを通じてスパイダーの動きを分析する方法の分析例

キーワード: インスタンス分類、SEOer、合格方法、IIS、ログ分類、分析、私たち、最適化、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  Googleは2012年3月の検索改善点の一部をリストアップ

>>:  優れたウェブサイトの外部リンクからインターネットマーケティング戦略を学ぶ

推薦する

vikinglayer -$7/KVM/4G メモリ/90g SSD/4T トラフィック/ダラス

vikinglayer は drserver.net のサブブランドです。1999 年から運営されて...

SEO の黄金の連鎖における偽りの「金」の誘惑

「ゴールデン チェーン」という用語は、ウェブマスターの友人にはおなじみのはずです。一般的な説明では、...

「ダブル11」のライブストリーミング販売のグレーマーケットを詳しく調査

ダブルイレブンの前にライブストリーミングアカウントを購入する必要がありますか? 10月20日、ダブル...

imidc: 人気の e3 独立物理サーバーが 30 ドルで販売中。香港、台湾、日本、ロシア、30M cn2 帯域幅!

有名なサーバープロバイダーであるimidc Rainbow Network。当社は複数の地域で独自の...

セレブたちも国境を越えた活動に夢中で、宋千、唐燕、江淑英らは皆東方見出しに参加した!

近年、コンピュータやインターネットの急速な発展により、人々のライフスタイル、支払い方法、さらにはスタ...

ftrack レビューが Alibaba Cloud Marketplace で利用可能になりました

2018 年 9 月、世界有数の映画およびテレビ番組制作パイプライン管理ソフトウェア企業である ft...

tmhhostはどうですか? 「ロサンゼルス CERA CN2 GIA」シリーズVPSの簡単なレビュー

tmhhostはどうですか? tmhhost のロサンゼルス cera cn2 gia シリーズ v...

サイト全体の最適化 VS キーワードの最適化、本当の「王」は誰でしょうか?

SEO ウェブサイトの最適化といえば、誰もがキーワード ランキングの最適化を思い浮かべると思います。...

ギャップはどこにあるのでしょうか?中国とアメリカのクラウドコンピューティングベンダー間の競争を技術と市場の観点から見る

ZTE事件以来、米中貿易戦争が激化するなか、「チョークポイント」という言葉が頻繁に聞かれるようになっ...

1API - .red ドメインを 3.45 ドルで登録

1api は .red ドメイン名の新年プロモーションを実施しており、初年度の登録料は 3.45 ド...

デジタル時代におけるクラウドコンピューティングとエッジコンピューティングの違い

クラウド コンピューティングとエッジ コンピューティングはよく議論されますが、機能が異なる場合があり...

AWS 対 Azure 対 Google Cloud: どの無料枠が優れていますか?

無料のものを嫌いな人がいるでしょうか?パブリッククラウドベンダーはこれをよく理解しています。クラウド...

「河源地震」がもたらした300ipの事例分析

私の会社の 1 つである中山泰成ケータリング会社の Web サイトは、構造が乱雑でレイアウトも不合理...

Baidu Libraryへの投稿に関する注意事項

これまでにも何度か Baidu ドキュメント ライブラリを提出しましたが、承認されたものもあれば、承...