Hong Bo氏:検索クロールはルールを遵守する必要があります。合意に違反すると混乱が生じます。

Hong Bo氏:検索クロールはルールを遵守する必要があります。合意に違反すると混乱が生じます。

最近、Qihoo 360総合検索が国際的に認められているロバーツ議定書を無視し、BaiduやGoogleなどの検索エンジンからコンテンツをクロールし、多くのウェブサイトがセキュリティとプライバシー上の理由から検索エンジンによるクロールを許可していない内部ネットワーク情報を漏洩したことが明らかになったことに関して、上級インターネットオブザーバーのHong Bo氏は、検索を行う際には、検索業界で認められたゲームのルールを遵守しなければならないと指摘した。ルールを無視し、故意に違反することは、本当の不正競争である。この行為が法律と政府の監督によって適時に阻止されなければ、業界に混乱を引き起こすだろう。

検索エンジンの原理は、インターネット上の Web ページを自動的に収集し、クローラー スパイダー プログラムを通じて関連情報を取得することです。ネットワーク セキュリティとプライバシーを考慮して、各 Web サイトは独自のロボット プロトコルを設定し、検索エンジンにどのコンテンツが検索エンジンに含まれることを希望し許可されているか、またどのコンテンツが許可されていないかを明確に示します。検索エンジンは、Robots プロトコルによって付与された権限に従ってクロールします。ロボット プロトコルは、すべての検索エンジンが準拠しなければならない国際的な慣行となっています。これは普通の人が他人の家に行くのと同じです。まずドアをノックして許可を得てからリビングに入る必要があります。所有者からの許可と招待がない限り、許可なく内部の部屋に入ったり、他人の家の周囲を歩き回ったりすることはできません。

そのため、2週間前に新たに開始された360度総合検索がロボットプロトコルを無視し、不正な情報データを直接取得したとき、その実践は業界関係者から広く疑問視されました。

Baidu サイトの Robots プロトコルでは 360 検索クローラーのクロールを許可していないと認識されていますが、360 検索はこの設定を無視して許可なくクロールを実行します。多くのコンテンツ ソース Web サイトが検索エンジンによる Web ページのクロールを禁止していることを考慮すると、そのほとんどはバックグラウンド データベース、ユーザーのプライバシー、パスワード、およびサーバー上に保存されているその他の情報に関係しています。つまり、360 がコンテンツ ソース ウェブサイトの robots.txt プロトコルの設定を無視すると、サーバー上に保存されている検索されるべきではない個人情報が検索され、検索結果に直接表示されることになります。

ロボットプロトコル違反の疑いについては、事実が判明したため、周洪一氏はもはや否定できないとしたが、百度がロボットプロトコルで360クローラーを禁止したことは不当競争だとも反論した。これに対して洪波氏は、ロボットプロトコルはウェブサイトに検索クローラーを禁止する権利を与えるものであり、不正競争とは全く関係がないと述べた。 360 が業界のデフォルト ルールを無視していることが、真の不公平な競争です。

「検索を行う際は、検索業界で一般的に認められているゲームのルールを遵守する必要があります。ルールを無視し、勝手に違反することが、本当の不公平な競争です。」 洪波氏の見解では、百度はQ&A、知道、鉄馬のコンテンツをクロールするすべてのクローラーを禁止しているわけではない。百度が禁止しているのは、潜在的なセキュリティリスクをもたらす、手に負えないクローラーだけだ。これは、市場秩序とユーザーのプライバシーを保護するための合理的な措置だ。同氏は、タオバオも2008年にバイドゥのクローラーを禁止したが、バイドゥはロボットプロトコルを厳格に遵守し、タオバオのコンテンツのクロールをやめ、タオバオの不正競争をロボットプロトコル違反の口実にしなかったと指摘した。

360 は、常に革新的な検索方法を採用していると自慢してきた。洪波氏は、その見解を一文で述べた。「ゲームの基本的なルールさえ守らない検索エンジンが、どうして自らを『革新的』と称することができるのか。周洪一氏の辞書では、ルールを無視することが革新に等しいのかもしれない」。洪波氏は、このような行為が法律や政府の監督によって適時に阻止されなければ、360 は今日百度のコンテンツを違法にクロールし、明日は人人からプライバシーを多く含むコミュニティ情報を無断でクロールするかもしれないと述べた。他のウェブサイトや検索エンジンもこれに追随するかもしれない。JD.com によってブロックされた Yitao も、競合他社の製品情報をクロールする可能性がある。同様に、インターネット業界全体が混乱に陥るでしょう。

原題: Hong Bo: 検索クロールはルールを遵守する必要があります。合意に違反すると混乱が生じます。

キーワード: Hongbo、検索、クロール、遵守すべき、規則を遵守する、違反する、合意、Zhida、Riqi、36、ウェブマスター、ウェブサイト、ウェブサイトの宣伝、お金を稼ぐ

<<:  Baidu、開発者にAPIを提供するクラウドサービスプラットフォームを正式に開始

>>:  Dianpingは激しい競争に直面している:3つの要因がユーザーの離脱を容易にする

推薦する

フォーラム署名の外部リンクを作成するときに注意すべきことは何ですか?

毎日のウェブサイトのメンテナンス作業に加えて、すべてのウェブマスターは外部リンク作業も毎日行う必要が...

2018 年に推奨される安価なアメリカの VPS トップ 10

どの米国の VPS が優れていますか?米国で良い評価を得ている VPS プロバイダーはどれですか?初...

テクノロジー+エコロジー、効率的で安全な電子署名の実現

[51CTO.comよりオリジナル記事] インターネットの波に後押しされ、近年中国では電子契約(電子...

SEO リサーチ: Baidu の検索ランキングの原則

Baidu は世界最高の中国の情報検索および配信技術プロバイダーであり、同社は「世界最大の中国の検索...

ブランドマーケティング:ブランドロゴとシンボルデザイン

ブランドを識別したい場合、最も早い方法はブランドロゴを見ることです。では、ブランドアイデンティティに...

5d6d フォーラムの戦略的調整は私たちにどのような考えを与えるのでしょうか?

最新ニュースによると、閉鎖されたと言われていた5d6d領土フォーラムがついに終了しました。本日、新し...

負け犬のウェブマスターのありふれた起業家の旅

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス私が最後にSong Ge...

クラウドネイティブ クラスタにおけるネットワーク トラフィックの可観測性に関する考察

背景クラウド ネイティブ テクノロジーが広く普及し、実装される中で、私が遭遇した多くのユーザー ニー...

無視されたビデオウェブサイトは将来のSEOの主な先駆者です

時代の発展とともに、ますます多くの企業が、電子商取引がマーケティングに与える大きな影響を徐々に認識し...

企業ウェブサイトプロモーションのベテランからの考察

著者は、数年間、企業のウェブサイトのインターネット マーケティングに携わってきました。著者が従来の企...

Linux 仮想化 KVM-Qemu Virtqueue の分析

[[390061]]この記事はWeChatの公開アカウント「LoyenWang」から転載したもので、...

クリック課金型広告のプロモーションを肯定的側面と否定的側面の両方から弁証法的に分析する

ウェブマスターは皆、検索エンジン最適化とクリック課金が SEM を構成することを理解しています。ほと...