PR ハイジャックと同様に、私は、多くの場合、罪のないウェブマスターに大きな損害を与える可能性があるため、防止するのがより困難なブラックハット フレーミング手法について積極的に議論したくありませんでした。 2 日前の SEO のケースで、プロキシ ハイジャックについて触れました。プロキシ ハイジャックとは何かと尋ねられた方がいました。今日はそれを説明したいと思います。このようなことは諸刃の剣です。悪意のある人にとっては、他人に危害を加え、自分に利益をもたらすもう 1 つの手段となります。一方、すでに大きな被害を受けているウェブマスターにとっては、これを読むことで予防や回復に役立つかもしれません。 簡単に言えば、プロキシ ハイジャックとは、検索エンジンがプロキシ サーバーを介して閲覧された Web ページを含め、元の実際の Web ページを罰したり削除したりすることを意味します。 国内のウェブマスターはプロキシ サーバーに精通している必要があります。プロキシ サーバーを使用して他の Web サイトにアクセスする場合、ブラウザーに表示される URL は通常、次のようになります。 http://www.proxysite.com/proxy/www.proxysite.com このうち、proxysite.com はプロキシ サーバーのドメイン名であり、proxysite.com は実際にアクセスしたい Web サイトです。 この種の URL をブラウザで開くことには確かに問題はありませんが、検索エンジンがこの種の URL をクロールすると、元の Web サイトと完全に重複したコンテンツの Web ページが形成されます。重複コンテンツのページはほとんどの場合単に無視されますが、場合によっては検索エンジンが誤った判断を下し、元のバージョンをコピーとしてペナルティを課したり削除したりすることがあります。 一般的に、プロキシ経由でアクセスされる URL はインデックス化されません。しかし、誰かが悪意を持ってこのプロキシ URL にリンクすると、検索エンジンもそれにアクセスしてクロールします。 プロキシによるランキングの乗っ取りを防止または復元するにはどうすればよいでしょうか? 最も簡単な方法は、Web ページがプロキシによってハイジャックされていることがわかった場合は、プロキシ サーバーの IP アドレスを確認し、自分のサーバーでその IP アドレスをブロックして、クロールを禁止することです。 しかし、プロキシ サーバーの IP アドレスは変更される場合があり、プロキシ サーバーの数が多いとすべてをブロックすることが不可能になる場合があります。より複雑な方法は、サーバーがプログラムを使用して、訪問者が検索エンジン スパイダーであるかどうか、また実際の検索エンジン スパイダーであるかどうかを識別します。 場合によっては、プロキシ URL 経由でアクセスするときに検索エンジン スパイダーが使用するブラウザー タイプ (ユーザー エージェント) が、検索エンジン スパイダーのブラウザー タイプのままになることがあります。ただし、プロキシ サーバーの中には、元の IP アドレスとユーザー エージェントを隠すように設定されているものもあり、検索エンジン スパイダーであるかどうかを判断するのが非常に困難になります。 このとき、ウェブサイト プログラムは、訪問者が実際の検索エンジン スパイダーであるかどうかを積極的に検証する必要があります。プログラムがそれが本当に本物のスパイダーであることを確認すると、通常のページに戻ります。ユーザーがスパイダーではなく、通常のユーザー、または偽のスパイダーであることが検出された場合、返される Web ページに noindex タグと nofollow タグが追加されます。この方法では、プロキシ経由でアクセスした場合、これらの元の Web ページは検索エンジンによってクロールされません。 2月にGoogleのBlackboardとWebmaster Blogに掲載された、Googleスパイダーの検証方法に関するMatt Cutts氏の投稿(Matt Cutts氏の元の投稿は自身のブログではなく、Webmaster Blogの英語版に掲載されていた)は、面白半分に投稿されたのではなく、深い意味がある。これまでのところ、引用リンクとコメントがゼロであることから判断すると、ほとんどの人はこの投稿が何についてのものか全く分かっていない。 理論的には、検索エンジンはこの種のプロキシハイジャックを判断する方法を持っている必要があります。そうしないと、一部の人々が競合他社を陥れる簡単な方法になってしまいます。しかし、どんなアルゴリズムにも抜け穴は存在します。たとえアルゴリズムが 99% の正しい判断を下すことができたとしても、網をすり抜けた 1 つのエラーによって、無実の Web サイトが削除されてしまう可能性があります。 この記事は、より多くの人に知ってもらい、より効果的に予防できるようになることを願って書きました。誰もが、他人を陥れるためにこの方法を使うことを嫌うだろうと私は信じています。 私が記事を書くとき、それを理解できる人が少なければ少ないほど良いと考えることはめったにありません。これは一つです。 元のタイトル: プロキシハイジャックとは何ですか? キーワード: |
SEO ページ最適化のための 8 つのベスト プラクティスを詳しく紹介します。 1. タイトルタグこ...
コンピュータビジネスニュースのホームページに残っているのは停止通知だけだ1月30日午前のニュースによ...
IDC Review Network (idcps.com) は 6 月 12 日に次のように報告し...
知識決済ビジネスは一定の市場があるものの、知名度を上げるのは容易ではありません。一方では、自社の知識...
写真だけの商品広告は絶対に売れません。文字だけの商品広告は必ずしも売れないわけではありません。これは...
このシリーズの 3 番目の記事「Kubernetes の基礎: まず方法を学ぶ」では、Kuberne...
yyyhost(~)は、主に中国本土向けに最適化されたロサンゼルス、香港、韓国ソウルのデータセンター...
みなさんこんにちは、私はXiaosiです。フォーラムで何人かのSEO担当者とこの話題について話し合い...
クラウドやクラウドに関する最善の決定を組織内の他の人に説明するときは、それを裏付けるデータが必要です...
現代社会は消費社会の段階に入っています。これは軽蔑的な言葉ではなく、消費が社会の主な活動となっている...
ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスWeibo が大規模なマ...
チャンスと課題が共存する時代において、企業としてトレンドに乗り遅れず、「クラウド+AI」を効果的に活...
トレーダーという概念は、常に神秘的で素晴らしいものに思えます。昨年上半期、私は偶然、交通オペレーター...
現在、xsx.net ( XSXネットワーク、運営歴12年)では、すべてのVPSを20%オフ、月額4...
ネット上で、あるネットユーザーがBaiduに検索包含ルールを策定するよう求める投稿を見た。実際、Ba...