Hong Bo氏:検索クロールはルールを遵守する必要があります。合意に違反すると混乱が生じます。

Hong Bo氏:検索クロールはルールを遵守する必要があります。合意に違反すると混乱が生じます。

最近、Qihoo 360総合検索が国際的に認められているロバーツ議定書を無視し、BaiduやGoogleなどの検索エンジンからコンテンツをクロールし、多くのウェブサイトがセキュリティとプライバシー上の理由から検索エンジンによるクロールを許可していない内部ネットワーク情報を漏洩したことが明らかになったことに関して、上級インターネットオブザーバーのHong Bo氏は、検索を行う際には、検索業界で認められたゲームのルールを遵守しなければならないと指摘した。ルールを無視し、故意に違反することは、本当の不正競争である。この行為が法律と政府の監督によって適時に阻止されなければ、業界に混乱を引き起こすだろう。

検索エンジンの原理は、インターネット上の Web ページを自動的に収集し、クローラー スパイダー プログラムを通じて関連情報を取得することです。ネットワーク セキュリティとプライバシーを考慮して、各 Web サイトは独自のロボット プロトコルを設定し、検索エンジンにどのコンテンツが検索エンジンに含まれることを希望し許可されているか、またどのコンテンツが許可されていないかを明確に示します。検索エンジンは、Robots プロトコルによって付与された権限に従ってクロールします。ロボット プロトコルは、すべての検索エンジンが準拠しなければならない国際的な慣行となっています。これは普通の人が他人の家に行くのと同じです。まずドアをノックして許可を得てからリビングに入る必要があります。所有者からの許可と招待がない限り、許可なく内部の部屋に入ったり、他人の家の周囲を歩き回ったりすることはできません。

そのため、2週間前に新たに開始された360度総合検索がロボットプロトコルを無視し、不正な情報データを直接取得したとき、その実践は業界関係者から広く疑問視されました。

Baidu サイトの Robots プロトコルでは 360 検索クローラーのクロールを許可していないと認識されていますが、360 検索はこの設定を無視して許可なくクロールを実行します。多くのコンテンツ ソース Web サイトが検索エンジンによる Web ページのクロールを禁止していることを考慮すると、そのほとんどはバックグラウンド データベース、ユーザーのプライバシー、パスワード、およびサーバー上に保存されているその他の情報に関係しています。つまり、360 がコンテンツ ソース ウェブサイトの robots.txt プロトコルの設定を無視すると、サーバー上に保存されている検索されるべきではない個人情報が検索され、検索結果に直接表示されることになります。

ロボットプロトコル違反の疑いについては、事実が判明したため、周洪一氏はもはや否定できないとしたが、百度がロボットプロトコルで360クローラーを禁止したことは不当競争だとも反論した。これに対して洪波氏は、ロボットプロトコルはウェブサイトに検索クローラーを禁止する権利を与えるものであり、不正競争とは全く関係がないと述べた。 360 が業界のデフォルト ルールを無視していることが、真の不公平な競争です。

「検索を行う際は、検索業界で一般的に認められているゲームのルールを遵守する必要があります。ルールを無視し、勝手に違反することが、本当の不公平な競争です。」 洪波氏の見解では、百度はQ&A、知道、鉄馬のコンテンツをクロールするすべてのクローラーを禁止しているわけではない。百度が禁止しているのは、潜在的なセキュリティリスクをもたらす、手に負えないクローラーだけだ。これは、市場秩序とユーザーのプライバシーを保護するための合理的な措置だ。同氏は、タオバオも2008年にバイドゥのクローラーを禁止したが、バイドゥはロボットプロトコルを厳格に遵守し、タオバオのコンテンツのクロールをやめ、タオバオの不正競争をロボットプロトコル違反の口実にしなかったと指摘した。

360 は、常に革新的な検索方法を採用していると自慢してきた。洪波氏は、その見解を一文で述べた。「ゲームの基本的なルールさえ守らない検索エンジンが、どうして自らを『革新的』と称することができるのか。周洪一氏の辞書では、ルールを無視することが革新に等しいのかもしれない」。洪波氏は、このような行為が法律や政府の監督によって適時に阻止されなければ、360 は今日百度のコンテンツを違法にクロールし、明日は人人からプライバシーを多く含むコミュニティ情報を無断でクロールするかもしれないと述べた。他のウェブサイトや検索エンジンもこれに追随するかもしれない。JD.com によってブロックされた Yitao も、競合他社の製品情報をクロールする可能性がある。同様に、インターネット業界全体が混乱に陥るでしょう。

原題: Hong Bo: 検索クロールはルールを遵守する必要があります。合意に違反すると混乱が生じます。

キーワード: Hongbo、検索、クロール、遵守すべき、規則を遵守する、違反する、合意、Zhida、Riqi、36、ウェブマスター、ウェブサイト、ウェブサイトの宣伝、お金を稼ぐ

<<:  Baidu、開発者にAPIを提供するクラウドサービスプラットフォームを正式に開始

>>:  Dianpingは激しい競争に直面している:3つの要因がユーザーの離脱を容易にする

推薦する

hostkvm: 30% オフ - 香港 VPS\韓国 VPS、20% オフ - 日本ソフトバンク、米国 CN2 GIA、シンガポール直接 VPS

今月、hostkvm は香港国際回線および韓国 CN2+bgp 回線の VPS に生涯 30% 割引...

SEMにおけるユーザーのキーワード検索行動の分析

ユーザーが検索エンジンを使用する際、最初の結果ページで理想的な結果が見つかることを期待します。満足の...

hosthink-格安トルコ VPS/KVM/$6.95/512M メモリ/20g ハードディスク/1T トラフィック

トルコの VPS やサーバーは比較的珍しいですよね?少なくとも珍しいですね! 2010 年に設立され...

Baidu の大規模アップデートについて: 誤って削除されたウェブサイトの数

現在、百度は意識的にウェブサイトのランキングに手動で介入し始めています。これは私が以前の記事で述べた...

SAPと永泰生物科技が共同でデジタル運用管理プラットフォームを構築し、デジタルパワーでがんと闘う

本日、SAPと北京永泰生物製品有限公司(以下、「永泰生物」)は調印式を開催し、全面的な協力関係に合意...

Weiboマーケティング戦略:ファンが多ければ多いほど良い?

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスファンの数は重要ではない...

選ばれたソリューションが生まれ、その背後にある3つの価値が説明される

過去数年間にデジタル変革が世界を席巻したことは周知の事実です。新しいテクノロジーが広く応用されるにつ...

Google Urchin 設定: 訪問者セグメントをカスタマイズする方法

Urchin では、定義済みのセグメント (地理的地域や言語など) 別にユーザーをグループ化するだけ...

CentOS 6にMinecraftサーバーをインストールする

ホストの猫は退屈していたので、ゲームをインストールして遊びたいと思っていました。Minecraft ...

#BlackWeek5# hostdime-25% オフ/完全管理 VPS+完全管理サーバー/ハイエンド コンピュータ ルーム

15 年間運営されている Hostdime も、ブラック フライデーに値下げプロモーションを実施し、...

#割引: Ramnode - 生涯10%オフ/信頼できる商人

Ramnode は、2016 年 9 月に新しい価格体系を導入して以来、生涯割引コードをリリースして...

vpsdime-7 USD/年/512 MB RAM/7 GB SSD/2 TB データトラフィック

vpsdimeは設立1周年を迎え、年間わずか7ドルで利用できる非常に優れたVPSです。マイニングなど...

ケース分析: オンライン旅行電子商取引はどのようにマーケティングを行うのか?

国内の旅行会社でECに取り組み始めたばかりの企業の多くは、臨時でチームを立ち上げるケースが多く、マー...

中小規模の共同購入サイトは急速に閉鎖され、大手サイトが第3、第4層の都市に進出し始めた。

共同購入ウェブサイトの衰退が加速している。 Tuan800のデータによると、今年上半期の取引額と購入...