Baidu の画像審査条件に基づいて、Baidu が画像からどのような情報をキャプチャして収集しているかを分析する

Baidu の画像審査条件に基づいて、Baidu が画像からどのような情報をキャプチャして収集しているかを分析する

360 の画像検索機能のベータ版が正式にリリースされたというニュースをネットで見たので、試してみました。 306画像検索が現在サポートしている検索条件は画像のサイズに制限されていることがわかりました。Baidu画像検索の多くの詳細な設定項目と比較すると、この機能はまだ比較的シンプルです。百度がこれほど多くの画像検索条件を提供できるのは、より包括的な画像情報インデックスライブラリを構築しているからだ。では、百度が画​​像を集める際、ネットユーザーの正確な検索を助けるためにどのような情報を収集するのだろうか?

画像検索の主な基準は画像の alt とタイトルのアンカー テキストであることは誰もが知っています。つまり、画像を検索すると、検索したキーワードが画像のアンカー テキストと一致する場合にのみ、画像が検索結果に表示されます。画像の位置情報のテキストに加えて、Baidu は画像に関するどのような情報を取得するのでしょうか。Baidu の検索フィルター項目を見て、Baidu の画像取得情報項目を分析してみましょう。

1. 画像フォーマット

これは、Baidu の画像検索ホームページで「詳細」をクリックした後、入力される詳細検索のスクリーンショットです。このインターフェースを通じて、キーワードと画像限定 URL に加えて、Baidu が現在 jpg、gif、bmp、png の 4 つの形式で画像検索を提供できることが直感的にわかります。つまり、Baidu が画像を収集する際、画像形式が情報ポイントとしてキャプチャされ、インデックス化されます。

2. 画像が撮影された時刻

たとえば、Baidu でクリスマスを検索すると、基本的に上位の画像にはクロールされた時間のヒントが含まれています。つまり、Baidu は検索が完了した後、デフォルトで新しくクロールされた画像を上位にランク付けすることになります。以前にキャプチャされた他の画像には、スナップショットの時刻がマークされます。

3. 画像のピクセルサイズ。

画像検索結果の左側には、フィルタリング オプションの列があります。 1 つ目は画像サイズです。Baidu では、事前に設定された正確な画像サイズに基づいた検索も提供しています。これは、Baidu が画像を含めるときに、画像の正確なサイズ データをキャプチャして記録することを示しています。

4. 画像全体の色分布データ

Baidu は特徴的な色に基づいて画像をフィルタリングする機能を提供しており、現在は 12 色のフィルタリングをサポートしています。この機能を通じて、百度が写真を収集する際に、写真全体における特定の色の割合の閾値に従って、これらの12色ごとに写真を分類し、これを基礎としてネットユーザーが正確にスクリーニングするための検索項目を確立すると推測できます。

5. 画像の動的および静的形式。

前述のように、Baidu には現在 4 つの形式の画像が含まれており、これら 4 種類の画像を動的と静的の 2 つのカテゴリに分類しています。しかし、スクリーニングしてみると、Baidu のこの検索項目は gif 形式の画像のみを抽出して動画像とみなし、他の 3 つの形式の画像は静止画像として分類されていることがわかりました。

6. 写真の主な内容

Baidu の最後の正確な項目によって提供されるフィルタリング項目から、Baidu は実際にすでに画像に表示されるコンテンツに対して一定の判断と評価を行うことができることがわかります。この機能は現時点ではまだ非常に弱いですが、検索エンジンが画像で表現されたコンテンツを認識できるようになることは前進です。将来的には、Baidu が写真に表示されるコンテンツを認識する技術をさらに強化することが予想されます。

周知のとおり、Baidu の画像クロール機能は、テキストコンテンツに比べるとまだ比較的弱いです。しかし、360 の画像検索などの他の検索エンジンと比較すると、Baidu は依然としてかなりの優位性を持っています。もちろん、360 にあまり要求しすぎることはできません。結局のところ、3B 戦争はまだ始まったばかりであり、今後、検索分野で両者の衝突が増えると考えています。ユーザーの観点からは、3B の衝突ごとに、よりエキサイティングな検索体験がもたらされることを期待しています。

この記事は、http://www.8dai.cn のウェブサイト運営・保守担当者によって作成されたものであり、担当者自身の行動に責任があります。 A5 Webmaster Network が独占公開しました。再投稿の際は、Web サイトと A5 のリンクを残してください。ご協力ありがとうございます。


元のタイトル: Baidu の画像スクリーニング条件に基づいて、Baidu が画像からどのような情報をキャプチャして収集しているかを分析する

キーワード: Baidu、画像、フィルター バー、クロール、含む、どれ、情報、1、ニュース、36、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、お金を稼ぐ

<<:  企業サイトが消費者を追従してSEOを行う方法の分析例

>>:  2013年の垂直B2Cの生死の瞬間を読んで、垂直電子商取引の発展の道筋についていくつかの考えがあります

推薦する

人気のない業界のウェブサイトでも、宣伝にはオリジナルの記事が必要だ

月収10万元の起業の夢を実現するミニプログラム起業支援プラン近年、星智連はウェブサイトの最適化に力を...

伝伝における仮想番号の実践と応用

1. はじめに仮想番号は、インターネット技術に基づいた電話番号サービスです。電話番号をユーザーの携帯...

バイラルマーケティングを簡単にマスターする方法

Xiang Yancong は、バイラル マーケティングについて話すとき、誰もが私と同じように興奮す...

Baidu の重みをどのように改善できますか?

サードパーティのウェブマスターツールにおける「Baidu の重み」の提供に関する声明: Baidu ...

従来の業界のウェブサイトの内部リンクを最適化する際に注意すべき事項は何ですか?

伝統的な業界のウェブサイトにとって、内部リンクと外部リンクは最適化プロセスに不可欠であり、特に一部の...

Cloud+ CommunityとKuaishouが共同で、5つの人気のビッグデータ技術の詳細な分析を提供

[51CTO.com からのオリジナル記事] データは企業にとって貴重な資産となっています。データ分...

クラウドで新しい交通手段を実現

運輸は基礎的かつ先駆的かつ戦略的な産業であり、経済と社会の発展にとって重要な支えと強力な保証です。過...

高セキュリティ Sharktech データセンター - サーバー/E5-2670/64g メモリ/2x2T ハードディスク/29IP/10T トラフィック

DDoS 防御で有名なアメリカのデータセンターである Sharktech は、ロサンゼルスのデータセ...

#ブラックウィーク 5#: イーグルホスト - ホスト 25% オフ/ディストリビューター 40% オフ/セミバーチャルホスト 25% オフ/VPS 40% オフ

Hawkhost は毎年恒例のブラックフライデー プロモーションを開始し、仮想ホスティング、リセラー...

教えるのが下手な教師だけが語る、サスのウェブサイトコンテンツシステム構築

ベッドに横になりながら、蘇貞潔の『尊厳は無価ではない』を楽しく読みました。本を手に取りながら、蘇貞潔...

ウェブサイトのバックリンク統計におけるSEOツールの違いを分析する

外部リンク構築は、すべての SEO 担当者が注意を払う作業です。なぜなら、SEO プロセスでは、ほと...

Vultrドイツのデータセンタークラウドサーバーのレビュー、VULTRの仕組みを説明します

Vultr は、ヨーロッパのドイツ・フランクフルトに独自のデータセンターを持ち、Intel や AM...

NameCheap-7周年記念/Webホスティング 1年間 7ドル/サーバー 100Tトラフィック

8 月 13 日は Namecheap の 7 周年記念日です。7 周年を記念して、1,000 の仮...

fdcservers 384M xen onapp 5IPv4 9$

fdcservers は、米国デンバーを本拠地とする老舗 IDC と言えます。同社の VPS は非常...

台湾サーバー

台湾サーバー、台湾独立サーバー。このサイトでは、広い帯域幅、大きなトラフィック、低価格の台湾サーバー...