みなさんこんにちは。私はMuzi Chengzhouです。 SEO 診断は、私が常にやり続けてきた仕事です。これまで、SEO 診断に関するさまざまなアイデアについてお話ししてきました。その多くは、友人からの質問や相談、また私自身の Web サイトの問題の発見や調査から生まれたものです。今日は別の診断事例を紹介します。主な問題は、ウェブサイトのインクルードとスナップショットがタイミングよく行われないという問題です。 昨日、友人が私のところに来て、彼のウェブサイトの症状の診断を手伝ってほしいと頼んできました。彼とやり取りした後、彼のウェブサイトについていくつかの情報を知りました。彼のウェブサイトは毎日更新されていますが、Baiduは翌日にはそれを組み込んで公開しません。毎週または毎月の更新時に多くの以前のページをリリースするだけです。スナップショットも非常にゆっくりと更新されていますが、徐々に組み込みとリリースに追いつきます。この状況は1か月以上続いています。以下は私のアイデアですが、皆様のお役に立てれば幸いです。 まず、この友人にウェブサイトの LOG ログを確認することを提案します。LOG ログには、ウェブサイト内の Baidu スパイダーのクローリング状況が反映される可能性があるからです。私の知る限り、多くの友人は現在、LOG ログを確認する習慣がないか、頻繁に LOG ログを確認することができません。この友人もその 1 人です。彼は LOG ログを確認したが、それを分析する方法がわからないと言っていました。以下は私の分析のアイデアの簡単な紹介です。 1. 検索エンジンスパイダーのクローリングサマリー分析をチェックして、各検索エンジンスパイダーの訪問数、総滞在時間、総クローリング量、割合を把握します。以下は、友人のウェブサイトのサマリー分析です(Lightyearログ分析ツールを使用して結果を表示します)。Baiduスパイダーは、292ワード、126訪問、総滞在時間8.873時間で、ウェブサイトのクローリング量が良好であり、すべてのスパイダーの41.011%を占めていることがはっきりとわかります。 ウェブサイト LOG ログ概要分析 Baidu スパイダーの総滞在時間は非常に長く、単一滞在時間は短くないので (PS: スパイダー単一滞在時間 = 総滞在時間 / 訪問数 = 0.0704 時間 / 時間 = 4.225 分)、なぜ Web サイトのインクルードが追いつかないのかと疑問に思う人もいるかもしれません。このような疑問を持って、Baidu スパイダーによる他のページのクロールについて分析してみましょう。 2. Baidu Spider によるウェブサイト ディレクトリのクロールを確認します。次のクロール チャートから、Baidu Spider がホーム ディレクトリと製品ディレクトリをより多くクロールしている一方で、ウェブサイト内のもう 1 つの重要なディレクトリであるニュースをあまりクロールしていないことがはっきりとわかります。このディレクトリは、ウェブサイトで毎日より頻繁に更新される作業ディレクトリです。スパイダーは、upload、files、img などのバックグラウンド ファイル ディレクトリもクロールします。 ウェブサイトディレクトリのクロール 上記の分析から、BaiduスパイダーによるWebページの内部部分のクロールが不合理であることがわかります。主な問題は次のとおりです。1. Webサイトの内部構造がニュースコラムをクロールするのに十分強力ではありません。2. ホームディレクトリはコミュニティとして使用され、製品ディレクトリは製品センターとして使用されているため、Webサイトスパイダーのクロールリソースが分散しています。3. Webサイトには、不要なクロールディレクトリに対する適切な制限がありません。問題を解決するには、これら 3 つの側面から始める必要があります。 1. サイト内の相互リンクのインポート、サイト外への外部リンクのリリースなど、更新されたページへのリンクの入り口をさらに作成するなど、スパイダーがニュース ディレクトリの下にあるより多くの Web ページをクロールするように誘導します。 2. ウェブサイトのコミュニティをチェックして、基本的に更新がないことを確認します。最初にホーム ディレクトリをブロックして、より多くの重みとスパイダーをニュース コラムに誘導することを検討できます。商品ディレクトリは比較的重要なディレクトリですが、含まれていない商品や新商品をクロールするように誘導する方がよいでしょう。ウェブサイトの商品ページを確認したところ、関連商品の推奨が十分ではなく、改善の余地があることがわかりました。 3. ロボット ファイルまたは nofollow タグを使用して、Web サイト上の重要でないディレクトリやページ、および一部のバックグラウンド ファイルを制限します。 さらに、もう1つ考慮すべき点があります。Baiduスパイダーは滞在時間が長いですが、クロールの量は特に多くありません。Baiduスパイダーがページをクロールするときに返すステータスコード200、304、404の割合も確認する必要があります。 304 が多数ある場合は、クロールされていないページにこれらのスパイダー リソースを割り当てることを検討してください。 404 ページが多数ある場合は、スパイダーが何らかの罠にかかっているかどうかを検討する必要があります。Web サイト内で 404 ステータス コードの原因となっているページを確認し、修正してください。 これまでお話ししたのは主にサイト内のスパイダークローリングの分布でしたが、サイト外のスパイダー誘導が十分に強力でない場合、Web サイトを組み込んでその重みを向上させるという作業は依然としてうまくいきません (PS: Web サイトのスナップショットは Web サイトの重みを反映しています)。使用できる方法は次のとおりです。 1. HTML および XML 形式のマップを含む Web サイト マップを再確立し、ロボット ファイルにクロール ルールを記述して、スパイダーが Web サイト サイトマップ マップをクロールするように誘導します。書き方は以下の通りです。 サイトマップ: http://www.xxx.com/sitemap.html 2. より多くの内部リンクと外部リンクを確立し、Web サイトのそれぞれの Web ページにできるだけ多くのスパイダー クローリングの入り口を提供して、Web ページのクローリング量を最大限に増やします。特に外部リンクの構築については、ウェブサイトが更新された直後にフォーラムやブログなどの権威の高いプラットフォームにアクセスし、記事やディレクトリへのリンクを投稿して、スパイダークローラーを引き付けることを検討できます。 今回は、LOG ログ解析に関するいくつかのアイデアについて、私なりの視点から簡単に、かつ表面的にお話ししましたが、皆様のお役に立てれば幸いです。 この記事はQQ Personalized Signature Network (http://www.yy521.com/qq/) によって公開されています。転載を歓迎します。転載の際はこのリンクを残してください。ご協力ありがとうございます! 原題: SEO診断事例2: ウェブサイトの収集とスナップショットがタイムリーではない キーワード: SEO、診断事例、ウェブサイト、コレクション、スナップショット、みんな、成州、ウェブマスター向け、ウェブサイトのプロモーション、収益化 |
>>: 電子商取引ウェブサイトの外部リンク構築戦略とテクニック
SEO に関係するのは、1. ユーザーにとって価値のある、または役立つコンテンツを作成すること、2....
電子商取引の進化。今日の電子商取引は、Suning、JD.com、Dangdang、または他の一連の...
9月がまたやって来ました。この特別な月は新学期の到来を告げる月です。新入生たちが入学してくるのを見て...
5年間の地域ポータルの運営で、私は地域ポータルの運営について深く理解することができました。2007年...
Solidot によると、今年 10 月にマサチューセッツ大学アマースト校の研究者が、プロキシ サー...
この記事では、Linux システム上で SFTP を使用してファイルを転送する方法について説明します...
個人のウェブマスターは非常に特殊なグループです。通常、1 人がコンピューターに向かい、Web サイト...
みなさんこんにちは。私はテクノロジーの共有が大好きなプログラマーの Xiaomi です。今日は、Ja...
はじめに:この記事では、インターネット金融(および他の類似業界)における新メディアプロモーションのた...
1 週間前、onevps はロサンゼルス データセンターの M247 コンピュータ ルームにマシンを...
[51CTO.comからのオリジナル記事]現在、疫病と政治環境の影響により、多くの不確定要素が重なり...
米国のテクノロジー大手シスコシステムズは先週金曜日、イスラエルのクラウドサービスアプリケーションソリ...
老舗ホスティング会社である lfchosting が、非常に控えめなプロモーションを開始しました。3...
エッジ コンピューティングは、人工知能 (AI) および機械学習 (ML) アプリケーションを実現す...
最近、大量の注文により、onevps のロサンゼルス データ センターでサーバーを増設しており、配送...