検索エンジンの技術と概念について

検索エンジンの技術と概念について

この記事はいくつかの引用で始まります:

1. 「ユーザーの意図を理解し、ニーズに応える。」

2. 「ポータルサイトは、テクノロジーを購入するためにお金を使う方法ではなく、お金を節約する方法ばかり考えています。」

3. 「検索エンジンは誰もが取り組める分野ではありません。参入障壁が比較的高いのです。」

4. 「優れているだけでは十分ではありません。最善の方法は、1 つのことを極限まで行うことです。」(Google の 10 大真実)

5. 「検索エンジンは集中力を必要とする」「ポータルが 4 位にランクされているビジネスに集中するのは難しい。」

6. 「ユーザーは、自分が探しているものを実際に見ることができなければ、それを説明することはできません。」

7. 「いわゆるくさびは、実は逆三角形です。逆三角形の先端は検索技術、真ん中は技術に基づく製品応用プラットフォーム、そして頂点は検索エンジンユーザー全体の文化に対する親しみと理解、そしていわゆるブランドを表しています。これは現代の企業競争において最も重要で捉えどころのない要素です。」 「くさび」のもう一つの意味は、くさびを壁に打ち込む場合、先端が鋭いかどうかが重要ですが、くさびの破壊力と壁からどれだけのスペースを絞り出せるかは、真ん中と後ろの端の安定性と厚さに依存します。

検索エンジンの技術とコンセプトは、蓄積するのに時間と経験を必要とする。

長期にわたる継続的な改善と進歩が必要です。一夜にして達成できると考えないでください。比較的成熟した最先端の検索エンジンが、最初からトップの段階に達するまでには、通常 4 年かかります。焦らないでください。その理由は、検索エンジンが複雑すぎるため、「ユーザーは探しているものが見えなければ、探しているものを説明できない」からです。すべてを調査して試してみる必要があり、問題を一つずつ解決する必要があり、ユーザーのニーズを少しずつ調査する必要があります。

検索エンジンはユーザーにサービスを提供する製品です。

ユーザーエクスペリエンスを継続的に向上させ、ユーザーのニーズの増大と変化に対応し、ネットワークの変化に常に適応するには、長期にわたる継続的な改善、アップグレード、調整が必要です。これは、ネットワーク環境が絶えず変化し、ネットユーザーのニーズも絶えず変化しているためです。検索をプロジェクトとして扱わないでください。単に完成させてユーザーが使用できるようにしておくだけでは、チャンスは確実になくなります。検索エンジンの分野では、経験がすべてです。新しいエンジンがユーザー エクスペリエンスで全体的に 1 年以上リードし、その状態が 2 年間続くと、検索エンジンのユーザー切り替えコストが比較的低く、口コミが情報を広める最良の方法であるため、先行者の優位性は失われます。検索エンジンが技術と概念を継続的に革新できない場合、それはその検索エンジンにとって死に等しいことになります。一般的に、検索エンジンのリーダーシップは時間で測定されると言われています。例えば、中国SosoとBaiduの総合的な差は×年、BaiduとGoogleの総合的な差は×年、…ユーザーエクスペリエンスにおける1年間の優位性を2年間維持できれば、誇大宣伝の必要はなく、すべてうまくいくでしょう。ユーザーエクスペリエンスを前にすると、どんな誇大宣伝も比較にならないほどに色あせてしまいます。

垂直検索エンジンとしては小型ですが、必要な機能はすべて備えています。

コンセプト文化、製品ガバナンス、アプリケーション、テクノロジーのいずれであっても、検索エンジンのウェッジ理論と違いはありません。したがって、垂直検索をうまく行うには、これらの側面に対処する必要があります。

くさびの先端:垂直検索テクノロジー。

垂直検索テクノロジーは、主にテンプレート レベルと Web ページ ライブラリ レベルの 2 つのレベルに分かれています。

テンプレートレベルは、Web ページにテンプレートを設定するか、テンプレートを自動生成してデータを抽出します。Web ページの収集も対象としており、小規模で、情報ソースが少なく、安定したものに適しています。利点は、実装が迅速、コストが低い、柔軟性が高いことです。欠点は、その後のメンテナンスコストが高い、情報ソースが小さい、情報量が少ないことです。ウェブページライブラリレベルとは、情報ソースの数、データ容量、検索能力、安定性、信頼性がすべてウェブページライブラリ検索エンジンレベルの要件であることを意味します。テンプレート方式との最大の違いは、特定のウェブページに依存せず、通常のウェブページであればどこでも情報の収集と抽出を行えることです...これにより、この方法とテンプレート方法の間にはデータ容量の質的な違いが生じますが、柔軟性が低く、コストが高くなります。もちろん、テンプレート方式とウェブページライブラリレベルの方式は矛盾するものではありません。テクノロジーはユーザーのニーズを満たすための手段に過ぎないため、垂直検索エンジンではこの 2 つは互いに補完し合います。この記事で説明する技術は、主に Web ページ ライブラリ レベルの垂直検索エンジン技術を指します。

原題: 検索エンジンの技術と概念について

キーワード: 検索エンジン

<<:  完全な計画は検索エンジン最適化から始まります

>>:  垂直検索における情報更新の3つの要件

推薦する

MIIT がさらに 7 つの CDN ライセンスと 9 つのクラウド サービス ライセンスを発行

12月4日、工業情報化部はCDNライセンスを取得した企業の最新リストを発表した。リストに載っていたの...

Zhihu: Qihoo 360 の収益はどのような事業や製品から生まれているのでしょうか?

昨年3月、Qihoo 360は米国で株式を公開し、資本市場から大きな注目を集めました。これは、360...

balticservers-VPS-10% オフ-100M 無制限 (素晴らしい)

12年の歴史を誇るIDCのBalticserversが、6か月間、VPSを通常価格の10%割引で提供...

クラウド関連の IoT 脅威を軽減する方法

モノのインターネット (IoT) は、デバイスやシステムが相互に通信し、データを交換できるようにする...

ウェブマスターネットワークニュース: SEO は死に、アプリはタクシー業界を脅かす

1. Vanclは数百のブランドを対象とする「フラッシュセールツール」アプリをリリースします電子商取...

全能ではない:WeChat O2Oはまだ単なる話

戦争について書面で語ることは軍事戦略においては大きなタブーである。ビジネスは戦場のようなものです。自...

知っておくべきトップ 15 のクラウド管理サービス プロバイダー

クラウド コンピューティングの時代において、マネージド サービス プロバイダーが重要な位置を占めてい...

推奨される米国の高防御サーバー、無制限の DDoS 防御、CC 攻撃の無視

米国のサーバーでホストされているウェブサイトが攻撃を受けた場合、どうすればよいでしょうか?サーバーが...

/boot が不十分ですW: mdadm: /etc/mdadm/mdadm.conf にアレイが定義されていません。

システムを更新するときに、W: mdadm: /etc/mdadm/mdadm.conf にアレイが...

ユーザーエクスペリエンスと独創性: 250以上の非オリジナル記事が、高品質で安定したランキングを簡単にもたらします。

オリジナルのウェブサイト コンテンツは、疑似オリジナルまたは直接コピーされたコンテンツよりも確実に優...

SEO への基本的なルート: 2 つのポイントと 1 つのハート

SEO を効果的に行う方法は数多くあり、多くの SEO 担当者によって多くのテクニックがまとめられて...

Baidu、開発者にAPIを提供するクラウドサービスプラットフォームを正式に開始

9月3日午前のニュース、Baidu World 2012カンファレンスが本日北京で開催され、その中で...