リンクの偽装と百度の本物と偽物のスパイダー

リンクの偽装と百度の本物と偽物のスパイダー

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています

以前、グループの友人からリンク詐欺とは何かと尋ねられました。今日はこの話題について皆さんにシェアし、本物の Baidu スパイダーと偽物の Baidu スパイダーについて説明します。

まず、リンク欺瞞の原則。もちろん、ここで言及されているリンクはすべてフレンドリーリンクです。原理としては、相手と友好リンクを交換すると、その時点では両者に友好リンクがあるように見えますが、しばらくすると友好リンクが消えていることに気付きます。実際、これは最も単純なタイプのリンク詐欺です。さらに隠れたものもあります。それは、Baiduスナップショットを含む相手方のウェブサイトのホームページで確認でき、Aizhanやウェブマスターツールを使用して検出することもできますが、バックエンドのソースコードにアクセスして確認すると、hrefのリンクの部分が完成したホームページURLではなく、src = '/images/loading.gif' data-original="https://a5img.pncdn.cn/2018/0607/1528342105617.jpg" border="0" />であることがわかります。

次に、別のトピックを分析しましょう。偽の Baidu スパイダーを識別するにはどうすればよいでしょうか?

なぜ偽の Baidu スパイダーが存在するのでしょうか? たとえば、Aizhan や ChinaZ を使用して Baidu や Google スパイダーをシミュレートし、Web ページを分析する場合、この種のスパイダーは偽のスパイダーです。別の方法は、Python スクリプトなどのプログラムを通じてシミュレートすることですが、それをどのように識別するのでしょうか?

スパイダーがウェブサイトを訪問すると、それを記録するためのログがバックグラウンドで作成されることがわかっています。したがって、ウェブサイトのアクセスログから対応する IP を見つけることができますが、1 つずつ検索するのは非効率的です。ここでは、光年ログ分析ツールをお勧めします。杭州光年情報技術有限公司が開発した、IISやApacheなどのログを解析できるウェブサイトログ解析ソフトウェアです。

異常な IP を見つけたら、それが Baidu Spider の IP かどうかをどのように確認しますか? Windows システムに付属の cmd コマンドを使用する必要があります。図に示すように、IP アドレスが 117.136.45.119 の場合、nslookup コマンドを使用し、スペースを押して右クリックし、IP アドレスを貼り付け、最後に Enter キーを押して、特定の IP 情報を表示します。

名前が China Mobile のアドレスとして表示されていることがわかります。もちろん、ここでは例として自分の携帯電話の IP を使用しているだけです。偽の Baidu スパイダーを識別する目的は何なのかと尋ねる人もいます。

まず、これを使用して、Web サイトが含まれているかどうかを分析し、ログ ファイルに Baidu スパイダーが含まれているかどうかを確認します。この時点で、これらのスパイダーが本物か偽物かを分析する必要があります。 Baidu スパイダーの訪問は演出されているからです。

第二に、自社のウェブサイトを収集する窃盗プログラムに遭遇した場合、ログを分析して判断を下すことができます。ウェブサイトのアクセスログから相手のIPを調べてブロックします。犯人のプログラムは基本的にサーバー上にあるので、IPは比較的固定されています。

この記事はSuzhou SEO Optimizer Blogからの引用です。転載の際は出典を明記してください。よろしくお願いいたします。

原題: リンク詐欺と百度の本物と偽物のスパイダー

キーワード: Baidu スパイダー、検索エンジン スパイダー

<<:  ウェブサイトのデザインでは慎重に作成する必要があるいくつかの詳細

>>:  劉強東からマーケティングを学ばなければ、英雄になるのは無駄だ

推薦する

NetEase Cloud: オーディオとビデオのトレンドが生まれ、R&Dの課題を解決する必要がある

近年、モバイルインターネットの普及とスマート端末機器の広範な使用により、ショートビデオ、ライブブロー...

Webmaster.com のおかげで、3 日間で Baidu スナップショットを正常に復元できました。

6月22日と6月28日のBaiduの洗礼を受けた後、残念ながら私のウェブサイトはランキングと外部リン...

未成年者のインターネット利用に関する報告書

最近、テンセントの持続可能な社会価値事業部門と中国児童センターは共同で「未成年者のインターネット興味...

Java仮想マシン、これは進歩する価値のある方向です

時間が経つにつれて、誰もが徐々に中級プログラマーのレベルに入ります。同時に、学習しないことは立ち止ま...

茶包装ステーションの最適化プロセス中に発生した問題の原因の簡単な分析

私が最適化を始めたお茶のパッケージを販売するサイトは、4月8日にオンラインになってから安定したインク...

aquatis: 米国の大容量メモリ VPS、月額 6 ドル、8G メモリ/2 コア/20g NVMe/1T トラフィック/1Gbps 帯域幅

aquatis.host は 2009 年にゲーム サーバーとしてスタートし、その後、通常の VPS...

企業がハイブリッド クラウドの導入を検討する必要があるのはなぜですか?

ビジネスや人生の多くは意味論に帰着します。人々はさまざまな言葉で目標を表現し、成功を測定します。いく...

OneDrive と Dropbox

クラウド ストレージを使用して複数のコンピューター上のファイルを同期することは、非常に基本的な効率化...

Qvodの原罪:著作権侵害を助長する3つの方法で告発され、動画サイトは大惨事に見舞われる

【概要】「オタクの魔法の道具」として知られるKuaiBoは、数年間順調に稼働していましたが、2014...

アプリケーション依存関係マッピングがクラウド移行に重要な理由

ソフトウェアの依存関係は、効果的なコンポーネントベースのプログラミングの重要な部分です。同時に、ソフ...

どのような外部リンクが良いリンクなのか

SEO における外部リンクの重要性は誰もが知っています。特に人気のあるキーワードを最適化する場合は、...

最新のTOP44ウェブマスターウェブサイトの要約と分析

昨年3月に、Alexaランキング1万位以下の国内ウェブマスターサイトを初めてまとめました。その時は合...

トラフィックを増やすのに役立つデータは何か? ウェブサイト分析ホワイトペーパー: 分析指標

ウェブサイト、特に電子商取引ウェブサイトでは、すべての運用データを分析して、トラフィックの増加、コン...

クラウドコンピューティングは人気があるが、クラウドコンピューティングへの支出の無駄に注意する必要がある

[[347963]] 「正しいことをする」と「物事を正しく行う」はほぼ同じ文ですが、単語を入れ替える...