SEO診断事例2: ウェブサイトの収集とスナップショットがタイムリーではない

SEO診断事例2: ウェブサイトの収集とスナップショットがタイムリーではない

みなさんこんにちは。私はMuzi Chengzhouです。 SEO 診断は、私が常にやり続けてきた仕事です。これまで、SEO 診断に関するさまざまなアイデアについてお話ししてきました。その多くは、友人からの質問や相談、また私自身の Web サイトの問題の発見や調査から生まれたものです。今日は別の診断事例を紹介します。主な問題は、ウェブサイトのインクルードとスナップショットがタイミングよく行われないという問題です。

昨日、友人が私のところに来て、彼のウェブサイトの症状の診断を手伝ってほしいと頼んできました。彼とやり取りした後、彼のウェブサイトについていくつかの情報を知りました。彼のウェブサイトは毎日更新されていますが、Baiduは翌日にはそれを組み込んで公開しません。毎週または毎月の更新時に多くの以前のページをリリースするだけです。スナップショットも非常にゆっくりと更新されていますが、徐々に組み込みとリリースに追いつきます。この状況は1か月以上続いています。以下は私のアイデアですが、皆様のお役に立てれば幸いです。

まず、この友人にウェブサイトの LOG ログを確認することを提案します。LOG ログには、ウェブサイト内の Baidu スパイダーのクローリング状況が反映される可能性があるからです。私の知る限り、多くの友人は現在、LOG ログを確認する習慣がないか、頻繁に LOG ログを確認することができません。この友人もその 1 人です。彼は LOG ログを確認したが、それを分析する方法がわからないと言っていました。以下は私の分析のアイデアの簡単な紹介です。

1. 検索エンジンスパイダーのクローリングサマリー分析をチェックして、各検索エンジンスパイダーの訪問数、総滞在時間、総クローリング量、割合を把握します。以下は、友人のウェブサイトのサマリー分析です(Lightyearログ分析ツールを使用して結果を表示します)。Baiduスパイダーは、292ワード、126訪問、総滞在時間8.873時間で、ウェブサイトのクローリング量が良好であり、すべてのスパイダーの41.011%を占めていることがはっきりとわかります。

ウェブサイト LOG ログ概要分析

Baidu スパイダーの総滞在時間は非常に長く、単一滞在時間は短くないので (PS: スパイダー単一滞在時間 = 総滞在時間 / 訪問数 = 0.0704 時間 / 時間 = 4.225 分)、なぜ Web サイトのインクルードが追いつかないのかと疑問に思う人もいるかもしれません。このような疑問を持って、Baidu スパイダーによる他のページのクロールについて分析してみましょう。

2. Baidu Spider によるウェブサイト ディレクトリのクロールを確認します。次のクロール チャートから、Baidu Spider がホーム ディレクトリと製品ディレクトリをより多くクロールしている一方で、ウェブサイト内のもう 1 つの重要なディレクトリであるニュースをあまりクロールしていないことがはっきりとわかります。このディレクトリは、ウェブサイトで毎日より頻繁に更新される作業ディレクトリです。スパイダーは、upload、files、img などのバックグラウンド ファイル ディレクトリもクロールします。

ウェブサイトディレクトリのクロール

上記の分析から、BaiduスパイダーによるWebページの内部部分のクロールが不合理であることがわかります。主な問題は次のとおりです。1. Webサイトの内部構造がニュースコラムをクロールするのに十分強力ではありません。2. ホームディレクトリはコミュニティとして使用され、製品ディレクトリは製品センターとして使用されているため、Webサイトスパイダーのクロールリソースが分散しています。3. Webサイトには、不要なクロールディレクトリに対する適切な制限がありません。問題を解決するには、これら 3 つの側面から始める必要があります。

1. サイト内の相互リンクのインポート、サイト外への外部リンクのリリースなど、更新されたページへのリンクの入り口をさらに作成するなど、スパイダーがニュース ディレクトリの下にあるより多くの Web ページをクロールするように誘導します。

2. ウェブサイトのコミュニティをチェックして、基本的に更新がないことを確認します。最初にホーム ディレクトリをブロックして、より多くの重みとスパイダーをニュース コラムに誘導することを検討できます。商品ディレクトリは比較的重要なディレクトリですが、含まれていない商品や新商品をクロールするように誘導する方がよいでしょう。ウェブサイトの商品ページを確認したところ、関連商品の推奨が十分ではなく、改善の余地があることがわかりました。

3. ロボット ファイルまたは nofollow タグを使用して、Web サイト上の重要でないディレクトリやページ、および一部のバックグラウンド ファイルを制限します。

さらに、もう1つ考慮すべき点があります。Baiduスパイダーは滞在時間が長いですが、クロールの量は特に多くありません。Baiduスパイダーがページをクロールするときに返すステータスコード200、304、404の割合も確認する必要があります。 304 が多数ある場合は、クロールされていないページにこれらのスパイダー リソースを割り当てることを検討してください。 404 ページが多数ある場合は、スパイダーが何らかの罠にかかっているかどうかを検討する必要があります。Web サイト内で 404 ステータス コードの原因となっているページを確認し、修正してください。

これまでお話ししたのは主にサイト内のスパイダークローリングの分布でしたが、サイト外のスパイダー誘導が十分に強力でない場合、Web サイトを組み込んでその重みを向上させるという作業は依然としてうまくいきません (PS: Web サイトのスナップショットは Web サイトの重みを反映しています)。使用できる方法は次のとおりです。

1. HTML および XML 形式のマップを含む Web サイト マップを再確立し、ロボット ファイルにクロール ルールを記述して、スパイダーが Web サイト サイトマップ マップをクロールするように誘導します。書き方は以下の通りです。

サイトマップ: http://www.xxx.com/sitemap.html

2. より多くの内部リンクと外部リンクを確立し、Web サイトのそれぞれの Web ページにできるだけ多くのスパイダー クローリングの入り口を提供して、Web ページのクローリング量を最大限に増やします。特に外部リンクの構築については、ウェブサイトが更新された直後にフォーラムやブログなどの権威の高いプラットフォームにアクセスし、記事やディレクトリへのリンクを投稿して、スパイダークローラーを引き付けることを検討できます。

今回は、LOG ログ解析に関するいくつかのアイデアについて、私なりの視点から簡単に、かつ表面的にお話ししましたが、皆様のお役に立てれば幸いです。

この記事はQQ Personalized Signature Network (http://www.yy521.com/qq/) によって公開されています。転載を歓迎します。転載の際はこのリンクを残してください。ご協力ありがとうございます!

原題: SEO診断事例2: ウェブサイトの収集とスナップショットがタイムリーではない

キーワード: SEO、診断事例、ウェブサイト、コレクション、スナップショット、みんな、成州、ウェブマスター向け、ウェブサイトのプロモーション、収益化

<<:  高品質な外部リンクを判断する基準

>>:  電子商取引ウェブサイトの外部リンク構築戦略とテクニック

推薦する

クラウド移行を成功させるための5つのステップ

組織はどのようなクラウド移行手順に従う必要がありますか? 「対策を講じない者は新たな課題に直面するこ...

百度百科事典:医療項目は一般人が編集できない

最近、一部のネットユーザーから、百度百科が医療機関のマーケティングに利用されているのではないかとの疑...

クリック広告の単価を上げるための新たな考え方

広告のクリック単価をいかに高めるかは、多くのウェブマスターが考えている問題です。短期間で収益をもたら...

話題:競合他社のウェブサイトを分析するには?

昔の人はこう言っています。「自分を知り、敵を知れば、百戦危うくない」。SEO でも同じことが言えます...

初の国家政府サービスミニプログラムが始動、テンセントクラウド技術で地域横断サービスを実現

最近、中国の政府サービスミニプログラムが正式に試験運用を開始しました。これは初の国家政府サービスプラ...

市場の動向に基づいてウェブサイト全体の調整を包括的に分析する方法について説明します。

ウェブサイトを購入または販売する場合でも、競合他社のウェブサイトを理解する場合でも、ウェブサイトの包...

dreamhost: 新年のフラッシュセール、無制限のウェブサイトホスティングが年間わずか 35.4 ドル (無料ドメイン名付き)

Dreamhost、この古いホスティングブランドは現在、新年のフラッシュセールを開催しています。ウェ...

CitrixとQingCloudが戦略的なクラウドコンピューティングパートナーシップを締結

Citrix は、中国市場におけるクラウド テクノロジー パートナーとして QingCloud を発...

マルチクラウド環境を監視する方法

今日の急速に成長するビジネス市場では、ユーザーはアプリケーションが常に利用可能で最新の状態であること...

Rhino Cloud·NetWin Chariot: 1元でSEO最適化を行い、潜在顧客の90%を獲得する方法を教えます!

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますウェブサイ...

ネットワークマーケティングを行う企業はアウトソーシングの罠に注意する必要がある

インターネットマーケティングはますます重要になってきており、インターネット上ではマーケティングが至る...

OnraHost - $4/Xen/512m メモリ/100g ハードディスク/1500g トラフィック/G ポート/ロサンゼルス

私の知る限り、OnraHost は多くの中国人に利用されていないようです。その理由は、第一に新しい業...

ソフト記事の外部リンクからウェブサイトの外部リンクを構築する方法

まず、ソフトコピーとは何かについて説明しましょう。ソフト記事は実はハード広告と相対的なものであり、日...

企業ウェブサイト最適化のいくつかの重要なポイントの簡単な分析

Baidu プロモーションを行う SEO 担当者にとって、企業サイトはおそらく最もよく目にするサイト...

chicagovps - 年間 30 ドル / メモリ 2g / ハード ドライブ 50g / トラフィック 2T / G ポート / データ センター 6 か所

chicagovps、3 月のプロモーションの第 1 波が始まりました。128M メモリ、1G メモ...