クロール エラーは、Google ウェブマスター ツールの中で最も人気のあるツールの 1 つです。 URL リンクだけでなく、DNS 解決の失敗、サーバー リンク、robots.txt ファイルなどの問題を含む、間違ったリンクを確認するのに役立ちます。ほぼすべての Web サイトにクロール エラーがあります。 ウェブマスター ツールでは、エラーをサイト エラーと URL エラーの 2 つのカテゴリに分類します。ウェブサイトに複数のクロールエラーがある場合、ウェブサイトの信頼性が低下し、ランキングにも影響します。もちろん、このツールはBaiduの最適化にも効果的です。では、Google ウェブマスター ツールのクロール エラーをどのように解決すればよいのでしょうか? Googlebot がクロールするエラーを分類することで、クロール エラーの原因を把握できます。 1. HTTPエラー サイト上のページ(たとえば、ユーザーがブラウザでページにアクセスしたときや、Googlebot がページをクロールしたとき)がサーバーにリクエストを送信すると、サーバーはリクエストに応じて HTTP ステータス コードを返します。 403 ステータスが表示された場合は無視してください。これは、ホストが Googlebot のクロールをブロックしていることを意味します。すべての HTTP ステータス コードの完全なリストについては、Google HTTP ステータス コードのヘルプ ページをご覧ください。 2. サイトマップのエラー サイトマップ エラーが発生すると、多くの場合、404 エラー ページが表示されるか、現在のマップで 404 エラー ページが返されます。404 エラー ページが表示される場合は、サイトマップ内のすべてのリンクを確認してください。 削除したサイトマップを Google が引き続きクロールするのは困ったものですが、解決方法があります。管理者ツールで古いサイトマップが削除されていることを確認してください。クロールされたくない場合は、古いサイトマップが 404 を表示するか、新しいサイトマップにリダイレクトするようにしてください。 Google 社員の Susan Moskwa 氏は次のように説明しています。 Googlebot によるクロールを防ぐ最善の方法は、これらの URL(古いサイトマップなど)を 404 にすることです。URL が複数回 404 に表示された場合は、Googlebot はクロールを停止します。 3. リダイレクトエラー 301 リダイレクトによってエラーが発生することがあります。リダイレクトを実行した後はどのような点に注意すればよいでしょうか? 1: 正しい HTTP ステータス コードが返されることを確認します。 2: 循環リダイレクトがないことを確認します。 3: リダイレクトが404ページや503(サーバーエラー)や403(禁止)などのエラーページではなく、有効なWebページを指していることを確認します。 4: リダイレクトが空のページを指していないことを確認します。 4. 404 エラー 404 エラーは次の領域に表示される場合があります。 1: ウェブサイト上のウェブページを削除しました。 2: ウェブページの名前を変更しました。 4: 存在しないページにリンクされています。 5: 他のウェブサイトがあなたのウェブサイトに存在しないページにリンクしている。 6: ウェブサイトは、ウェブサイトと完全に一致しない新しいドメイン名に移行されます。 5. robots.txt による制限 もう 1 つの理由は、robots.txt ファイルが Googlebot のクロールをブロックしていることです。クロール エラーが多数ある場合は、まず robots.txt を確認してください。 6. ソフト404エラー 通常、存在しないページがリクエストされると、サーバーは 404 (見つかりません) エラーを返します。要求されたページが存在しない場合に 404 コードを返すだけでなく、サーバーは 404 ページも表示します。 これは、標準の「ファイルが見つかりません」というメッセージである場合もあれば、ユーザーに詳細情報を提供するために設計されたカスタム ページである場合もあります。 ページの内容は、サーバーから返される HTTP 応答とはまったく関係ありません。ページに「404 ファイルが見つかりません」というメッセージが表示されたとしても、それが 404 ページであるとは限りません。 7. タイムアウト ウェブサイトのタイムアウトもクロール エラーの原因の 1 つです。タイムアウトが発生すると、Googlebot はクロールを停止します。タイムアウト エラーの種類は次のとおりです。 1: DNS タイムアウト。DNS を検出するには、Nslookup コマンドを使用できます。DNS タイムアウトの最大の要因は、ドメイン ネーム サービス プロバイダーの DNS サーバーの不安定性です。 2: URL タイムアウト、ドメイン全体ではなく特定のページのエラー。 3: robots.txt のタイムアウト。Web サイトに robots.txt があっても、サーバーがタイムアウトすると、Googlebot はファイルが存在しないと見なします。 4: 動的 Web ページの応答時間が長すぎるため、Web ページの読み込み時間が長くなります。
|
<<: 中小規模のウェブサイトの危険性とチャンス: 即時検索から即時使用へ
8月14日、2011年の共同購入サイトの隆盛から、多くのプレイヤー間の激しい競争、そして今年の倒産、...
Swiftvm のサーバーは優れており、西海岸のデータセンターも中国に非常に優しいです。現在、この商...
シンガポールは中国に近いです。ヨーロッパやアメリカと比較すると、シンガポールの VPS とシンガポー...
Hostyun 61 周年記念イベントが始まりました: 香港 VPS、日本 VPS、米国 cn2 g...
2010 年にはまだ多くの人にとって Weibo が新しい概念であったとしても、2011 年にはよく...
12月28日、一部のメディアはヴィヤの夫である董海鋒氏の写真を撮影しており、現在は彼がヴィヤのその後...
今日、多くの組織がデジタル変革戦略としてクラウドネイティブ プラットフォームを採用しています。クラウ...
Hostdare のプレミアム中国最適化 KVM VPS は、約半年間在庫切れだった後、ようやく再入...
ほとんどの企業は、オンプレミス データに対して強力なバックアップ戦略を導入することの重要性を理解して...
はじめに:ご存知のとおり、国内のAndroidチャンネルは主にサードパーティ製であり、どの程度のボリ...
データの処理、分析、保存は、ユーザーやデバイスが情報にアクセスする必要がある場所に近いネットワークの...
ソーシャルマーケットの状況はますます濁り始めている。最近、一部のメディアは、Baiduが「Hands...
Webmaster Networkによると、Suning.comが今年4月に価格戦争を開始して以来、...
みなさんこんにちは、シャオシです。セルフメディアの話題はますます奇妙になっています。一般の人々がセル...
今年は非常に騒々しい年であり、多くの企業による技術買収がほとんど注目されずに終わりました。しかし、S...