スパイダーがあなたのウェブサイトを訪問しない理由をご存知ですか?

スパイダーがあなたのウェブサイトを訪問しない理由をご存知ですか?

私のように、多くのウェブマスターは毎日ウェブサイトのログをチェックする習慣があり、ログを分析して、スパイダーがウェブサイトをクロールしてグラブしている状況を把握していると思います。もちろん、このプロセスでは、通常、スパイダーが毎日ウェブサイトをクロールする回数を単純に見ています。この時点から、ウェブサイトの健全性を直感的に確認できます。しかし、多くのウェブマスターにとって、自分のウェブサイトは非常に完璧だと感じていますが、スパイダーがクロールしてグラブしないのは、間違いなくウェブマスターにとって大きな打撃です。そこで、今日は特に、スパイダーがウェブサイトにアクセスしない理由をいくつか整理し、以下で皆さんと共有します。

(1)ウェブサイトにはフラッシュや画像が多すぎます。

大手検索エンジンは、特に近年、アルゴリズムを絶えず更新しているため、かなり賢くなったと言わざるを得ません。たとえば、2011年にGoogleは画像検索機能を開始しました。これにより、画像からソースWebページのアドレスを見つけることができます。しかし、結局のところ検索エンジンであり、まだ大きなギャップがあります。しかし、現在、多くのウェブマスター、特に企業サイトは、自社の製品をアピールするために、ウェブサイトに大量のフラッシュや画像を埋め込んでいます。しかし、検索エンジンのスパイダーはフラッシュや画像ファイルをクロールできないことは誰もが知っているので、コンテンツが優れていても、スパイダーはクロールできません。したがって、画像やフラッシュを大量に含む Web サイトの場合、スパイダー クローリングをシミュレートするツールを使用して独自の Web サイトを検出し、これがスパイダーが Web サイトにアクセスしない理由であるかどうかを確認することをお勧めします。

(2)ウェブサイト上には多数のリンク切れがある。

スパイダーが喜んで私たちのウェブサイトを訪問するたびに、私たちのウェブサイトの各リンクのソースコードをクロールし、新鮮で良いコンテンツが見つかると思っても、多くのデッドリンクがそれを待っていて、それが1回、2回、3回起こると想像してください。スパイダーはあなたのウェブサイトに良い評価を与え、あなたのウェブサイトのコンテンツを再びクロールすると思いますか?私のウェブサイトwww.qqya.ccと同じように、当時は大量の404ページがスパイダーによってクロールされ、ウェブサイトのコンテンツのそのセクションが検索エンジンに含まれませんでした。そこで後になって、編集者はスパイダーがクロールしたページにウェブサイトのログにステータスコード404のページが含まれていることを発見し、突然それに気づき、すぐにこれらの404ページをクリアしてブロックし、その間に大量の外部リンクを送信しました。その後、ウェブサイトのスパイダーのクロールとクロールは正常になりました。

(3)ウェブサイトの外部リンクとnofollowタグ

スパイダーが頻繁にウェブサイトを訪問する理由の大部分は、外部リンクの魅力によるものだと私は考えています。したがって、時間を無駄にしないためにも、外部リンクのフレンドリーさを頻繁に観察する必要があります。このとき、多くのウェブマスターが、なぜこう言うのか、外部リンクの友好度をどのように判断するのかと尋ねると思います。ここでは、エディターがこれを行います。スパイダーが毎日ウェブサイトを訪問する回数を確認することに加えて、スパイダーの入り口も確認する必要があります。これらの入り口を通じて、私たちが作成した外部リンクが価値があるかどうかを判断できます。このようにして、毎日要約を作成し、有効な外部リンクを記録することができます。そして、時間の経過とともに、独自の外部リンクリソースライブラリを構築します。もちろん、これらのデータから、nofollowタグ付きの外部リンク(Baidu Experienceなど)など、どの外部リンクが役に立たないかを判断することもできます。このようなことは、将来的には行わないほうがよいでしょう。無駄だからです。

(IV) ウェブサイトには複雑なコードと構造があります。

ご存知のとおり、スパイダーはウェブサイトのソースファイルコードを通じてウェブサイトにアクセスします。そのため、この時点でウェブサイトのコードを最適化する必要があり、長いコードはウェブサイトにとって意味がなく、ウェブサイトの起動速度にも影響し、スパイダーを嫌がらせます。さらに、これらの構造はスパイダークローリングに適していません。スパイダーは通常、最初にウェブサイトのホームページにアクセスし、次にクロール列に移動し、コンテンツをクロールするためです。ただし、スパイダーによるこのようなアクティビティの回数は通常 3 回に制限されています。したがって、複雑すぎて重量が軽いウェブサイトは、スパイダークローリングに適していません。

(V) ウェブサイトマップが正しくありません。

サイト マップは、スパイダーが Web サイトの全体構造をすばやく理解できるようにするページです。優れたサイト マップは、スパイダーがクロールするための簡単なエントリを提供します。もちろん、リンク切れが大量にある間違ったマップであれば、ウェブサイト全体のクロール状況を台無しにしてしまうことは間違いないので、ウェブサイトマップを作成する際には注意が必要です。

要約: 実際、上記の理由に加えて、スパイダーが当社のウェブサイトにアクセスしない理由は他にもたくさんあります。たとえば、違法コンテンツ、大量の収集コンテンツ、ポルノや悪意のある情報など、すべてが検索エンジンスパイダーによる当社のウェブサイトのクロールを妨げる可能性があります。したがって、具体的な詳細な問題については、当社自身のウェブサイトログに基づいて独自の判断を下す必要があります。今日はこれで終わりです。この記事は、http://www.name2012.com/ のウェブサイト所有者によって最初に共有されました。転載する場合はリンクを含めてください。ありがとうございます。


元のタイトル: スパイダーがあなたのウェブサイトを訪問しない理由をご存知ですか?

キーワード: スパイダー、訪問しない、ウェブサイトについて尋ねる、理由、明確かどうか、信じる、複数のサイト、長さ、編集者、同じ、ウェブマスター、ウェブサイト、ウェブサイトの宣伝、お金を稼ぐ

<<:  デジタル音楽は無料ランチに別れを告げる:B2BモデルがB2Cに変化

>>:  レンレンダイ金融管理は資金を集めるために「危険を冒す」:中国でのP2Pの生き残り

推薦する

#推薦# hostens - 信頼できる業者、大容量ハードドライブ、大容量トラフィック、大容量ストレージ VPS

リトアニアで非常に有名で信頼できる販売業者である Hostens が、超割引価格を開始しました。この...

v.psはどうですか?ドイツの Nano シリーズ VPS レビュー

v.psはどうですか? v.ps のドイツ Nano KVM VPS シリーズはいかがでしょうか?ご...

チャンネルソーシャルネットワーキングに焦点を当て、スーパーファンパスの機能アップグレードの目標はブランドマーケティングです

モバイル端末の発展により、ブランドはソーシャルメディアとソーシャル配信のチャネルを継続的に拡大し、製...

Virpus - 創業10年のブランド、シアトルのXen PV仮想VPSが40%オフ、生涯価格

Virpus は本日、全製品 (SSD ハード ドライブのみ) が 40% オフとなる 2 日間の ...

ウェブマスターは、Baidu がサイト検索エンジンとして衰退していることにどう対処すべきでしょうか?

Baiduで「デジタルマルチメーター」を検索してください。検索結果の最初のページを見てみましょう。 ...

タオバオ、JD.com、ピンドゥオドゥオによるダブルイレブン電子商取引戦争!

ダブル11は経済成長を刺激します。この競争環境において、ダブル11の電子商取引戦争はもはやアリババと...

中央調達データベースリストの最終候補に選ばれたH3C PaaSクラウドサービスの背後にあるハードパワーとは

近年、第14次5カ年計画以降、全国でデジタル政府構築が本格化しており、2035年までの長期目標では「...

Qiniu Cloud Storage 2.0、第2世代のビッグデータストレージは素晴らしい

Qiniu Cloud Storageは、新しいアーキテクチャと消失訂正符号算術冗長技術を備えた第2...

動画プロモーションを行う際に注意すべき3つのポイント

インターネットビデオサイトの継続的な発展により。インターネット ビデオの力は、今やテレビ メディアに...

Baiduオリジナルは必ずしもウェブサイトのランキングを向上させるとは限らない

最近、多くの最適化クライアントから、私が毎日オリジナルの記事を書いているにもかかわらず、なぜウェブサ...

AWS がクラウドを活用した航空宇宙分野のイノベーションを推進する新たな航空宇宙事業部門を設立

世界は航空のエキサイティングで大胆な新時代を迎えています。新しい企業が航空宇宙事業に参入し、より多く...

合肥移転ウェブサイト内部最適化の実践分析

Baidu アルゴリズムの継続的な改訂により、ウェブサイトの最適化作業はますます困難になり、最適化に...

建国記念日のゴールデンウィーク中、陰謀を企む広告は、あなたを楽しいものにするための新しい方法を試みている

月収10万元の起業の夢を実現するミニプログラム起業支援プラン建国記念日は常にブランドにとっての「戦場...

ハッカー組織の内部:10,000アカウントの卸売価格は50元

中国のネットユーザーの情報は一夜にしてパッケージファイルとなり、ネット上で拡散した。個人の銀行情報や...

swiftvm-closed

昨日の午後は暇だったので、夜遅くまでカラオケに出かけました。そして朝遅く起きました。日中は家に冷蔵庫...