ウェブサイトの最適化がページクロールに影響を与えるいくつかの重要な理由

ウェブサイトの最適化がページクロールに影響を与えるいくつかの重要な理由

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています

スパイダーのクロールに影響し、最終的にページの包含結果に影響する主な理由はいくつかあります。

1.ウェブサイトの更新

一般的に、ウェブサイトの更新が速いほど、スパイダーがウェブサイトのコンテンツをクロールする速度も速くなります。ウェブサイトのコンテンツが長期間更新されていない場合、スパイダーはそれに応じてウェブサイトのクロール頻度を調整します。ニュースやその他の Web サイトでは更新頻度が重要です。したがって、スパイダーを引き付けるには、毎日一定数の更新を維持することが非常に重要です。

2.ウェブサイトのコンテンツの質

検索エンジンは、低品質のページに対して常に批判的です。したがって、スパイダーを引き付けるには、高品質のコンテンツを作成することが重要です。この観点からすると、「コンテンツが勝つ」というのは完全に正しいです。同じコンテンツが大量に集められ、ページの核となるコンテンツが空であるなど、Web ページの品質が低い場合、スパイダーはそれを好みません。

3.ウェブサイトは正常にアクセス可能ですか?

ウェブサイトに正常にアクセスできるかどうかは、検索エンジンに対する接続性によって決まります。接続には、Web サイトが頻繁にアクセス不能になったり、アクセス速度が極端に遅くなったりしないことが求められます。スパイダーの視点から見ると、検索クライアントに提供できるウェブページは、正常にアクセスできるページであることを期待しています。応答が遅かったり、頻繁にクラッシュしたりするサーバーの場合、関連するウェブサイトは間違いなく悪い印象を与えます。深刻な場合、スパイダーは徐々にクロールを減らし、含まれているページを削除することもあります。

実際には、国内のサーバーサービスは比較的高価であり、規制要件に基づいて、国内のウェブサイトの開設にはファイリングシステムが必要であり、オンラインでのファイリング情報のアップロードなどのプロセスを経る必要があるため、中小規模のウェブサイトのウェブマスターの中には、Godaddy(ドメイン名登録およびインターネットホスティングサービスを提供する米国の会社)などの海外のサーバーサービスをレンタルする人もいます。しかし、中国から海外のサーバーにアクセスする場合、距離が長いため、アクセスが遅くなったり、システムがクラッシュしたりすることが避けられず、長期的にはウェブサイトの SEO 効果が制限されてしまいます。ウェブサイトを慎重に運営したい場合は、国内のサーバー サービスを使用するようにしてください。より優れたサービスとより使いやすいインターフェイスを備えたサーバー サプライヤーを選択できます。現在多くの企業が立ち上げているクラウド サーバーは良い選択です。

さらに、検索エンジンはウェブサイトの全体的なパフォーマンスに基づいて評価します。この評価は重みと完全に同じではありませんが、評価はスパイダーのウェブサイトのクロール戦略に影響します。

クロール頻度に関しては、一般的に検索エンジンはクロール頻度の設定を調整するためのツールを提供しており、SEO担当者は実際の状況に応じて調整を行うことができます。サービスリクエストの数が多い大規模な Web サイトの場合、頻度調整ツールを使用して Web サイトへの負荷を軽減できます。

実際のクローリングプロセス中に、ウェブサイトにアクセスできない異常なクローリング状況が発生した場合、検索エンジンによるウェブサイトの評価が大幅に低下し、クローリング、インデックス作成、並べ替えなどの一連の SEO 効果に影響を及ぼし、最終的にはトラフィックの損失につながります。

クロール異常には、サーバーの不安定性、サーバーの過負荷、プロトコル エラーなど、さまざまな原因があります。そのため、ウェブサイトの運用・保守担当者は、ウェブサイトの安定した運用を確保するために、ウェブサイトの運用を継続的に追跡する必要があります。プロトコル構成では、Robots の Disallow 設定エラーなど、いくつかの低レベルのエラーを回避する必要があります。かつて、ある会社のマネージャーが SEO 担当者に相談し、外部の開発者に Web サイトの構築を依頼したにもかかわらず、なぜ検索エンジンで Web サイトが見つからないのかを尋ねました。 SEO スタッフが自分のウェブサイトの Robots アドレスを URL アドレス バーに直接入力したところ、スパイダー クローリングが禁止されている (Disallow コマンド) ことがわかりました。

ウェブサイトにアクセスできない原因としては、ネットワーク オペレーターの異常 (スパイダーが China Telecom や Netcom などのサービス プロバイダーを介してウェブサイトにアクセスできない)、DNS 異常 (スパイダーがウェブサイトの IP を正常に解決できない) などが考えられます。これは、アドレスが間違っているか、ドメイン名がブロックされているために発生する可能性があります。この場合、ドメイン名オペレーターに連絡する必要があります。もう 1 つの可能性は、Web ページのリンクが壊れていることです。たとえば、現在のページが無効であるかエラーがあり、一部の Web ページが一括してオフラインになっている可能性があります。この場合、最善の方法は、壊れたリンクの説明を送信することです。古い URL が無効で、URL の変更によりアクセスできない場合は、301 ジャンプを設定して、古い URL と関連する重みを新しいページに転送するのが最適です。もちろん、検索エンジン自体が過負荷になり、一時的にブロックされている可能性もあります。

クロールバックされたデータについては、次のステップはスパイダーがデータベースを構築することです。このリンクでは、検索エンジンは特定の原則に基づいてリンクの重要性を判断します。一般的に言えば、判断の原則は次のとおりです。コンテンツがオリジナルであるかどうか、そうであれば重み付けされます。メインコンテンツが鮮明であるかどうか、つまりコアコンテンツが目立つかどうか、そうであれば重み付けされます。コンテンツが豊富かどうか、コンテンツが非常に豊富であれば重み付けされます。ページがよりスムーズである、広告がより少なく読み込まれるなど、ユーザーエクスペリエンスが優れているかどうか、そうであれば重み付けされます、など。

したがって、ウェブサイトの日常的な運用においては、以下の原則を遵守する必要があります。

(1)盗作をしてはいけない。ユニークなコンテンツはすべての検索エンジン会社に好まれるため、インターネットは独創性を奨励します。多くのインターネット企業は、大量のオンライン コンテンツを収集して自社の Web サイトを整理したいと考えています。SEO の観点から見ると、これは実際には望ましくない動作です。

(2)ウェブサイトのコンテンツをデザインする際は、メインテーマを強調するようにしなければなりません。これにより、検索エンジンは、大量のコンテンツに基づいてウェブサイトがどのようなビジネスに関するものかを判断するのではなく、ウェブサイトをクロールしたときにそのウェブサイトが何に関するものかを知ることができるようになります。テーマが目立たない。無秩序に運営されている多くのウェブサイトに典型的な例があります。たとえば、いくつかの小説サイトでは、800語の章が8ページに分かれており、各ページには約100語あり、ページの残りの部分はさまざまな広告と無関係なコンテンツ情報で埋め尽くされています。一部の Web サイトでは、メイン コンテンツがフレームまたは AIAX フレームであり、スパイダーがクロールできる情報は無関係です。

(3)リッチコンテンツ、すなわち、コンテンツには大量の情報があり、コンテンツの表示モードも多様である。適切な広告とは、埋め込まれる広告の数を減らし、カラフルな広告で埋め尽くされた Web ページを開かないことを意味します。広告の読み込み時間はページ全体の読み込み時間に計算されるため、広告の読み込み時間が長すぎるとページを完全に読み込むことができず、ページが空のまま短くなってしまいます。同時に、大量の広告がユーザーエクスペリエンスに与える影響に対応して、Baiduは2013年5月17日に発表を行い、低品質のWebページ向けの「ザクロアルゴリズム」の開始を発表しました。これは、ユーザーの正常な閲覧を妨げる大量の悪質な広告を含むページ、特に大量の低品質の広告やページのメインコンテンツを混乱させるスパム広告をポップアップ表示するページに対抗することを目的としています。現在、一部の大規模ポータルは、収益の観点から依然として大量の広告をぶら下げています。SEO担当者としては、この問題を考慮する必要があります。

(4)ウェブコンテンツのアクセシビリティを維持する。一部の Web ページには大量のコンテンツが含まれていますが、検索エンジンでは認識できない js、AJAX などを使用して表示されており、その結果、Web ページ コンテンツが空になったり短くなったりすることがあります。これにより、ページの評価が大幅に低下します。

さらに、リンクの重要性に関して、2 つの重要な判断原則があります。ディレクトリ階層の観点からは、浅い優先順位の原則に従います。内部リンク設計の観点からは、人気のあるページの優先順位の原則に従います。

いわゆる浅い優先順位とは、検索エンジンが新しいリンクを処理してリンクの重要性を判断するときに、URL を優先することを意味します。より多くのページ、つまり URL 構成の観点からホームページのドメイン名に近いページ。そのため、SEOで重要なページを最適化する際には、フラット化の原則に注意し、URLの中間リンクを短くするように努めることが重要です。

浅いコンテンツが優先されるので、すべてのページをウェブサイトのルートディレクトリに配置して、最高のSEO効果を達成できるでしょうか?絶対にできません。まず、優先順位は相対的な概念です。すべてのコンテンツをルートディレクトリに配置すると、優先順位がなくなり、重要なコンテンツと重要でないコンテンツの区別がなくなります。また、SEOの観点からは、URLはクロール後のウェブサイトの構造を分析するためにも使用されます。URLの構成を使用して、コンテンツのグループ分けを大まかに判断できます。SEO担当者は、URLの構成を使用して、キーワードとキーワードWebページを整理できます。

たとえば、このグループのコンテンツはすべて、www.abc.com/jiaoyu/1.html のように教育に関連している可能性があります。 www.abc.com/lvyou/このグループのコンテンツはすべて旅行に関連するものかもしれません。たとえば、www.abc.com/lvyou/1.html

サイト内の現在の人気は、主に以下の指標によって反映されています。

・サイト内でこのページにつながる内部リンクの数。

・サイト内での自然な閲覧行動によりこのページに辿り着いたPV。

・このページのクリック率。

したがって、SEO の観点から、ページの検索ランキングを迅速に向上させる必要がある場合は、次のようにそのページの人気度を高める作業を行うことができます。

・他のページ、特にPRの高いページからのアンカーテキストをもっと使ってこのページに誘導しましょう。

・ページに魅力的なタイトルを付けて、より自然に閲覧しているユーザーがリンクをクリックしてページに到達するように誘導します。

・ページのコンテンツ品質を向上させ、ページのトラフィック率を下げる

この記事は、Lingchuang Network Heze ウェブサイト構築会社によって提供されています。

原文、無断転載禁止。転載の際は出典を明記し、このリンクを残してください。よろしくお願いいたします。

元のタイトル: ウェブサイトの最適化がページクロールに影響を及ぼすいくつかの重要な理由

キーワード: ウェブサイトの最適化、ウェブサイトのページの最適化

<<:  検索エンジンスパイダーがどのように機能するかご存知ですか?

>>:  テキストコンテンツ以外に、ユーザーがウェブサイトをクリックする主な理由となるものはありますか?

推薦する

誇張や誹謗中傷は一切なし。2か月以上安定稼働している Pacificrack PR-V シリーズ VPS の真実のレビューです。

Pacificrack は昨年の立ち上げ以来、低価格戦略を採用してきました。結局のところ、それらはす...

Baiduの検索結果は画像とテキストの組み合わせに重点を置く

今日、Lu Songsong さんのブログで、自分のサイトのインクルード数が記録を更新したと書いてあ...

hosthatch Chicago VPS はいかがでしょうか?測定データの共有、Tiktok/ChatGPTのロック解除

ホストハッチはどうですか? Hosthatch Chicago VPS はいかがでしょうか? Hos...

入札の知られざる秘密を解き明かす

現在、多くのウェブマスターが入札を行っていますが、そのうち約30%は入札後に後悔しています。入札では...

tmhhost: 新学期割引、クラウドサーバー 24 元/月、米国 CN2 GIA (+200g 防御)、香港 CN2、日本 CN2、Windows

tmhhost は現在、春学期プロモーションを実施しており、これには米国 cera データセンターの...

ウェブサイト上でロングテールキーワードを配置する方法

ウェブマスターにとって、ロングテールキーワードの構築は非常に重要です。さらに、私たちは皆これを認識し...

DEDECMSプログラムホームページのSEO最適化を共有する

オープンソース プログラムの人気に伴い、DEDECMS プログラムを使用して Web サイトを構築す...

SEO の効果に影響を与える非技術的な要因は何ですか?

多くの SEO 担当者は、検索エンジンのダイナミクス、SEO テクニックの学習、ウェブサイトの最適化...

Kubernetes と OpenEBS における永続ボリュームと永続ボリュームクレームの理解

[[438582]] [51CTO.com クイック翻訳]概要: Kubernetes のボリューム...

cloudcone: Black 5 の先行販売、安価な大容量ハードディスク VPS、最低 $14.2/年、ロサンゼルス MC データセンター

Cloudcone はブラックフライデーのプレコレクションを開始し、KVM 仮想化 + HDD RA...

主流のリレーショナル分散データベースの選択と設計

[[420327]] [[420328]]王宗瑞Alibaba Cloud データベース配信アーキテ...

標準インターネット - 109元/年、ロサンゼルス高防御、512Mメモリ、Windows、無制限トラフィック

Standard Interconnect は、ロサンゼルスの新しいコンピュータ ルーム、第 3 世...

新たなドメイン名ビジネス: ICANN の新規則がインターネットドメイン名をめぐる争いを引き起こす

6月14日、非営利の国際組織であるインターネットネーム・番号割当機関(ICANN)は、新しい汎用トッ...

小社超:90年代以降の世代が作ったサッカーソーシャルプラットフォーム:O2Oクローズドループを完成させ、収益を生み出した

【小ソーシャルネットワーク】の設立当初、最初に発表するプロジェクトは北京大学と清華大学発の出会い系ア...