Baidu の画像審査条件に基づいて、Baidu が画像からどのような情報をキャプチャして収集しているかを分析する

Baidu の画像審査条件に基づいて、Baidu が画像からどのような情報をキャプチャして収集しているかを分析する

360 の画像検索機能のベータ版が正式にリリースされたというニュースをネットで見たので、試してみました。 306画像検索が現在サポートしている検索条件は画像のサイズに制限されていることがわかりました。Baidu画像検索の多くの詳細な設定項目と比較すると、この機能はまだ比較的シンプルです。百度がこれほど多くの画像検索条件を提供できるのは、より包括的な画像情報インデックスライブラリを構築しているからだ。では、百度が画​​像を集める際、ネットユーザーの正確な検索を助けるためにどのような情報を収集するのだろうか?

画像検索の主な基準は画像の alt とタイトルのアンカー テキストであることは誰もが知っています。つまり、画像を検索すると、検索したキーワードが画像のアンカー テキストと一致する場合にのみ、画像が検索結果に表示されます。画像の位置情報のテキストに加えて、Baidu は画像に関するどのような情報を取得するのでしょうか。Baidu の検索フィルター項目を見て、Baidu の画像取得情報項目を分析してみましょう。

1. 画像フォーマット

これは、Baidu の画像検索ホームページで「詳細」をクリックした後、入力される詳細検索のスクリーンショットです。このインターフェースを通じて、キーワードと画像限定 URL に加えて、Baidu が現在 jpg、gif、bmp、png の 4 つの形式で画像検索を提供できることが直感的にわかります。つまり、Baidu が画像を収集する際、画像形式が情報ポイントとしてキャプチャされ、インデックス化されます。

2. 画像が撮影された時刻

たとえば、Baidu でクリスマスを検索すると、基本的に上位の画像にはクロールされた時間のヒントが含まれています。つまり、Baidu は検索が完了した後、デフォルトで新しくクロールされた画像を上位にランク付けすることになります。以前にキャプチャされた他の画像には、スナップショットの時刻がマークされます。

3. 画像のピクセルサイズ。

画像検索結果の左側には、フィルタリング オプションの列があります。 1 つ目は画像サイズです。Baidu では、事前に設定された正確な画像サイズに基づいた検索も提供しています。これは、Baidu が画像を含めるときに、画像の正確なサイズ データをキャプチャして記録することを示しています。

4. 画像全体の色分布データ

Baidu は特徴的な色に基づいて画像をフィルタリングする機能を提供しており、現在は 12 色のフィルタリングをサポートしています。この機能を通じて、百度が写真を収集する際に、写真全体における特定の色の割合の閾値に従って、これらの12色ごとに写真を分類し、これを基礎としてネットユーザーが正確にスクリーニングするための検索項目を確立すると推測できます。

5. 画像の動的および静的形式。

前述のように、Baidu には現在 4 つの形式の画像が含まれており、これら 4 種類の画像を動的と静的の 2 つのカテゴリに分類しています。しかし、スクリーニングしてみると、Baidu のこの検索項目は gif 形式の画像のみを抽出して動画像とみなし、他の 3 つの形式の画像は静止画像として分類されていることがわかりました。

6. 写真の主な内容

Baidu の最後の正確な項目によって提供されるフィルタリング項目から、Baidu は実際にすでに画像に表示されるコンテンツに対して一定の判断と評価を行うことができることがわかります。この機能は現時点ではまだ非常に弱いですが、検索エンジンが画像で表現されたコンテンツを認識できるようになることは前進です。将来的には、Baidu が写真に表示されるコンテンツを認識する技術をさらに強化することが予想されます。

周知のとおり、Baidu の画像クロール機能は、テキストコンテンツに比べるとまだ比較的弱いです。しかし、360 の画像検索などの他の検索エンジンと比較すると、Baidu は依然としてかなりの優位性を持っています。もちろん、360 にあまり要求しすぎることはできません。結局のところ、3B 戦争はまだ始まったばかりであり、今後、検索分野で両者の衝突が増えると考えています。ユーザーの観点からは、3B の衝突ごとに、よりエキサイティングな検索体験がもたらされることを期待しています。

この記事は、http://www.8dai.cn のウェブサイト運営・保守担当者によって作成されたものであり、担当者自身の行動に責任があります。 A5 Webmaster Network が独占公開しました。再投稿の際は、Web サイトと A5 のリンクを残してください。ご協力ありがとうございます。


元のタイトル: Baidu の画像スクリーニング条件に基づいて、Baidu が画像からどのような情報をキャプチャして収集しているかを分析する

キーワード: Baidu、画像、フィルター バー、クロール、含む、どれ、情報、1、ニュース、36、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、お金を稼ぐ

<<:  企業サイトが消費者を追従してSEOを行う方法の分析例

>>:  2013年の垂直B2Cの生死の瞬間を読んで、垂直電子商取引の発展の道筋についていくつかの考えがあります

推薦する

KubernetesでのSparkのデプロイメントに関する完全なガイドをご覧ください

この記事は、Kubernetes 上で Spark クラスターを構築するためのガイドです。また、Sp...

高級品のウェブサイトは概念を混乱させ、本物の商品を誤解させる疑いがあります。説明は非常に薄弱です

エルメスのCEOは、オンラインで販売されているエルメスの製品の80%が偽物であると述べた。このニュー...

#アメリカVPS# Virpus-50% オフ/シアトル/Xen VPS/G ポート/SSD/クラシック格安 VPS

wow technologies inc の VPS ブランドである Virpus が、50% オフ...

エッジコンピューティングとは何ですか?フォグコンピューティングとは何ですか?

モノのインターネットの継続的な進歩に伴い、フォグ コンピューティングやエッジ コンピューティングなど...

「一人一ホームページ」の秘密 百度の新ホームページの便利さを体験

「一人一ホームページ」は百度の新しいホームページを作る秘訣と方法です。ここ数日、私たちは百度の新しい...

iwebfusionのオレゴン州ベンドのVPSの簡単なレビューでiwebfusionの仕組みを説明します

オレゴンは、米国西海岸、カリフォルニア州のすぐ上に位置しています。ベンドは、オレゴン州中央部にありま...

数百社が廃業、電子商取引代理店の運営モデルは終焉

代理店運営モデルの見通しは、以前ほど楽観的ではないかもしれません。杭州の運営会社であるJuhe Be...

#五一# spinservers: 米国サーバー、月額 89 ドル (2*e5-2650Lv3/64g メモリ/1.6TSSD/10g 帯域幅)、追加の 1.26PB 大規模ストレージ サーバー

spinservers は、メーデー特別イベントを開始しました。シリコンバレー (サンノゼ) とダラ...

新しいサイトのランキングを素早く上げるためのヒント

これは実際のケースです。私は数年間ウェブサイトを作っており、さまざまな規模のウェブサイトを何百も持っ...

Webmaster Network からの毎日のレポート: 電子商取引のアップグレード価格戦争、Zhongdai.com が破産

1. インターネット融資プラットフォームZhongdai.comは開始から1か月後に倒産した4月2日...

トラフィックの断片化、電子商取引の混乱

変化の核心は、交通が細分化され、供給側が開放され、インフラが普及することです。電子商取引はトラフィッ...

ロングテールキーワードがウェブサイトへのトラフィックを引き付ける4つの主な要素

ご存知のとおり、ロングテールキーワードはウェブサイトの記事ページのタイトルとして使用されます。ロング...

[受賞討論] パブリッククラウドサービスはますます多様化しており、企業がクラウドに移行する適切な方法が明らかになっています

[51CTO.comより引用] ガートナーが発表した最新のレポートによると、世界のパブリッククラウド...

ウェブサイトのコンテンツシステムを構築する鍵は、コンテンツの価値とウェブマスターの粘り強さにあります。

土曜日、私は朝早くからウェブサイトのコンテンツについての記事を書きたいと思いました。なぜなら、私のウ...

クラウドネイティブ権限を構築するための 5 つのベスト プラクティス

クラウドネイティブ/マイクロサービスベースの製品は複雑であり、これらの製品に対するアクセス制御の構築...