プロキシハイジャックとは

プロキシハイジャックとは

PR ハイジャックと同様に、私は、多くの場合、罪のないウェブマスターに大きな損害を与える可能性があるため、防止するのがより困難なブラックハット フレーミング手法について積極的に議論したくありませんでした。

2 日前の SEO のケースで、プロキシ ハイジャックについて触れました。プロキシ ハイジャックとは何かと尋ねられた方がいました。今日はそれを説明したいと思います。このようなことは諸刃の剣です。悪意のある人にとっては、他人に危害を加え、自分に利益をもたらすもう 1 つの手段となります。一方、すでに大きな被害を受けているウェブマスターにとっては、これを読むことで予防や回復に役立つかもしれません。

簡単に言えば、プロキシ ハイジャックとは、検索エンジンがプロキシ サーバーを介して閲覧された Web ページを含め、元の実際の Web ページを罰したり削除したりすることを意味します。

国内のウェブマスターはプロキシ サーバーに精通している必要があります。プロキシ サーバーを使用して他の Web サイトにアクセスする場合、ブラウザーに表示される URL は通常、次のようになります。

http://www.proxysite.com/proxy/www.proxysite.com

このうち、proxysite.com はプロキシ サーバーのドメイン名であり、proxysite.com は実際にアクセスしたい Web サイトです。

この種の URL をブラウザで開くことには確かに問題はありませんが、検索エンジンがこの種の URL をクロールすると、元の Web サイトと完全に重複したコンテンツの Web ページが形成されます。重複コンテンツのページはほとんどの場合単に無視されますが、場合によっては検索エンジンが誤った判断を下し、元のバージョンをコピーとしてペナルティを課したり削除したりすることがあります。

一般的に、プロキシ経由でアクセスされる URL はインデックス化されません。しかし、誰かが悪意を持ってこのプロキシ URL にリンクすると、検索エンジンもそれにアクセスしてクロールします。

プロキシによるランキングの乗っ取りを防止または復元するにはどうすればよいでしょうか?

最も簡単な方法は、Web ページがプロキシによってハイジャックされていることがわかった場合は、プロキシ サーバーの IP アドレスを確認し、自分のサーバーでその IP アドレスをブロックして、クロールを禁止することです。

しかし、プロキシ サーバーの IP アドレスは変更される場合があり、プロキシ サーバーの数が多いとすべてをブロックすることが不可能になる場合があります。より複雑な方法は、サーバーがプログラムを使用して、訪問者が検索エンジン スパイダーであるかどうか、また実際の検索エンジン スパイダーであるかどうかを識別します。

場合によっては、プロキシ URL 経由でアクセスするときに検索エンジン スパイダーが使用するブラウザー タイプ (ユーザー エージェント) が、検索エンジン スパイダーのブラウザー タイプのままになることがあります。ただし、プロキシ サーバーの中には、元の IP アドレスとユーザー エージェントを隠すように設定されているものもあり、検索エンジン スパイダーであるかどうかを判断するのが非常に困難になります。

このとき、ウェブサイト プログラムは、訪問者が実際の検索エンジン スパイダーであるかどうかを積極的に検証する必要があります。プログラムがそれが本当に本物のスパイダーであることを確認すると、通常のページに戻ります。ユーザーがスパイダーではなく、通常のユーザー、または偽のスパイダーであることが検出された場合、返される Web ページに noindex タグと nofollow タグが追加されます。この方法では、プロキシ経由でアクセスした場合、これらの元の Web ページは検索エンジンによってクロールされません。

2月にGoogleのBlackboardとWebmaster Blogに掲載された、Googleスパイダーの検証方法に関するMatt Cutts氏の投稿(Matt Cutts氏の元の投稿は自身のブログではなく、Webmaster Blogの英語版に掲載されていた)は、面白半分に投稿されたのではなく、深い意味がある。これまでのところ、引用リンクとコメントがゼロであることから判断すると、ほとんどの人はこの投稿が何についてのものか全く分かっていない。

理論的には、検索エンジンはこの種のプロキシハイジャックを判断する方法を持っている必要があります。そうしないと、一部の人々が競合他社を陥れる簡単な方法になってしまいます。しかし、どんなアルゴリズムにも抜け穴は存在します。たとえアルゴリズムが 99% の正しい判断を下すことができたとしても、網をすり抜けた 1 つのエラーによって、無実の Web サイトが削除されてしまう可能性があります。

この記事は、より多くの人に知ってもらい、より効果的に予防できるようになることを願って書きました。誰もが、他人を陥れるためにこの方法を使うことを嫌うだろうと私は信じています。

私が記事を書くとき、それを理解できる人が少なければ少ないほど良いと考えることはめったにありません。これは一つです。

元のタイトル: プロキシハイジャックとは何ですか?

キーワード:

<<:  Baidu 最適化の全体概要

>>:  PR値更新時間予測

推薦する

Baidu 関連ドメインを素早く増やしてウェブサイトの重量を改善する方法

今朝のフォーラムの SEO セクションで、なぜウェブサイトのページ自体がドメイン: ドメイン名の後に...

クラウド コンピューティングの未来: パブリック クラウド、プライベート クラウド、それともハイブリッド クラウド?

[[210952]] 確かに、クラウド コンピューティングとその発展の可能性は、熱く議論されている問...

数十億ドル規模のブランドのための6つのマーケティングのブレークスルー

1兆ドル規模の新しい消費市場において、なぜ一部のブランドはデビュー直後から注目を集め、長い間人気と売...

通信とエッジコンピューティングの融合がネットワークインテリジェンスをどのように再定義するか

急速に変化するテクノロジーの世界では、通信とエッジ コンピューティングの融合は、ネットワーク インテ...

Baidu Accelerator Smart DNSが再度アップグレードされ、マルチラインカバレッジを実現

Baidu Accelerator は、ウェブマスター専用のサービスを提供することを目的として 2 ...

Facebookチャットのダウンロード数は4000万回を超えるが、利益は出せないほど大きい

北京時間6月8日、海外メディアの報道によると、Facebook Chatのフィーチャーフォン版はリリ...

Taobao Live を始めるにはどうすればよいですか? また、Taobao Live を開設する必要がある理由は何ですか?

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス近年、ライブストリーミン...

AWS、Azure、GCP: クラウド サービスの詳細な比較

[[435078]]デジタル革命によってもたらされたクラウド コンピューティングの第 3 の波は、私...

新時代を突き進み、革新を求めて、志雄張昊公開講座が武漢にやってきた

月収10万元の起業の夢を実現するミニプログラム起業支援プラン9月は収穫の季節です。私たちは、熊張オー...

国産CPUをベースにしたクラウドプラットフォーム上でコンテナ管理プラットフォームを構築するには? (パート2)

「ZTE事件」が拡大し続ける中、中国国民は自主管理可能な国産技術に大きな注目を寄せている。私の部署の...

evorack - 7 ドル / Windows / メモリ 1g / ハードディスク 25g / トラフィック 700g / 英国

ABPNI Computer Solutions Ltd 傘下のブランドである Evorack は、...

2023年雲奇会議開幕 アリババの蔡崇馨氏:AI時代の最もオープンなクラウドを構築

10月31日午前、杭州雲棲鎮で2023年雲棲会議が開幕した。アリババグループのジョセフ・ツァイ会長は...

ケーススタディ |製造業におけるクラウドコンピューティングへの道

[[254473]]近年、インターネット+、クラウドコンピューティング、ビッグデータの急速な発展に伴...

ランキング最適化のための3つの要素: データ、ユーザー、クリック

ウェブサイトの SEO 担当者として、私たちがすべきことは、ウェブサイトのキーワードを検索エンジンの...