Baidu 単語分割研究 - 高品質のロングテールトラフィックを獲得する方法

Baidu 単語分割研究 - 高品質のロングテールトラフィックを獲得する方法

以前は百度の単語分割研究にあまり注意を払っていませんでしたが、ある時、最適化を行っていたときに、単語のたった1文字の違いがランキングに大きな違いをもたらすことを偶然発見しました。 「中古住宅」というキーワードを使ったのですが、私のページのキーワード設定は「中古住宅 情報源」になっています。これで問題ないと言う友人もいるかもしれませんが、「中古住宅 情報源」には「中古住宅」というキーワードは含まれていないのでしょうか?百度の単語分割を注意深く研究しないと、2つの単語の違いがわからないかもしれません。しかし、検索結果に少し注意を払えば、手がかりがわかります。百度の「中古住宅」と「中古住宅源」という2つの単語の単語分割は異なります。百度は独自の語彙を構築しているため、「中古住宅」という単語全体を扱いますが、「中古住宅源」という単語については、百度は「中古」と「住宅源」という2つの単語に分割します。当然、他の人が「中古住宅」というキーワードを検索しても、私のページは見つかりません。この小さな詳細を通して、私は百度の単語分割について詳細な研究を行う必要があると思います。私は大まかに次の点をまとめました。

1. Baidu の単語分割は、コンテンツ内でのキーワード関連単語の初出に基づいて行われます。たとえば、テキストの最初に「今日」という単語が表示された場合、ページのキーワードは「今日」と「新しくオープンした熱血江湖SF」の2つの単語に分割されます。タイトルにはキーワードが含まれている必要がありますが、完全に一致する必要はありません。ただし、コンテンツに表示されるキーワードは、Baiduの単語分割と完全に一致する必要があります。完全一致の場合、ファイルのURLパスの深さに応じて並べ替えられます。キーワードが完全に一致する場合、たとえば、ディレクトリはファイルよりも優先され、ルートディレクトリのファイルはセカンダリディレクトリのファイルよりも優先されます。完全一致が最初にランク付けされ、次に部分一致がランク付けされます。

2. キーワードが完全に一致しない場合、単語の分割がある場合、たとえば、キーワード「ブラウザ ダウンロード」の場合、ある Web ページに最初に表示されるキーワードはブラウザであり、キーワード密度が高いですが、この Web ページにはキーワード「ダウンロード」がなく、別の Web ページに最初に表示されるキーワードがダウンロードである場合、この Web ページのキーワードは 2 つの単語「ブラウザ ダウンロード」に分割されます。2 番目の Web ページには「ブラウザ」と「ダウンロード」が含まれていますが、1 番目の Web ページは 2 番目の Web ページよりも上位にランク付けされ、キーワードの前半部分が最も重要であることが示されます。

3. キーワードの最初の部分の頻度がランキングの鍵となります。たとえば、「ブラウザ ダウンロード」の場合、2 つの Web ページが完全に一致せず、両方に 2 つの分詞が含まれている場合、「ブラウザ」の密度が高い Web ページが 1 位にランク付けされます。

4. 完全に一致しているが、キーワードがページ コンテンツの最後に最初に表示される場合、この Web ページのランキングは前のページよりも低くなります。したがって、キーワードがコンテンツのできるだけ早く表示されることが非常に重要です。

5. Baidu は、関連キーワードの初出に基づいて単語を分割します。関連キーワードの初出がキーワードの末尾である場合は、後ろから分割を開始し、前部である場合は、前から分割を開始します。つまり、Web ページの内容の順序と逆順に従って単語の分割が行われます。順序の場合は、キーワードの前半が開始点として使用され、逆順の場合は、キーワードの後半が開始点として使用されます。たとえば、「newly turned on」というキーワードの場合、Web ページに表示される最初のキーワードが「hot blooded martial arts sf」であれば、ページのキーワードは「hot blooded martial arts sf」と「newly turned on」という 2 つの単語に分割されます。

6. Baidu の単語分割原則に従って、作成しやすいキーワード ヘッダーを選択できます (つまり、Web ページのコンテンツに初めて表示されるキーワードを調整します)。つまり、手動で単語の分割が行われます。Baidu は前から後ろに向かって判断し、後ろから前に向かって分割します。

7. セグメンテーションの前半と後半が繰り返される場合、繰り返されるものは繰り返されないものよりも低いランクになります。ただし、両方が繰り返される場合は、前半の密度を使用してランクが決定されます。
例えば、今日の新しい熱血河川湖sfを今日の新しい熱血河川湖|新しい熱血河川湖sfにカットすると(このように切り取られた単語の前半が長すぎるため、ランキングは好ましくありません)、ランキングは今日の新しい|熱血河川湖| sfにカットされたランキングよりも確実に悪くなります。

原題: Baidu 単語分割研究 - 高品質のロングテールトラフィックを獲得する方法

キーワード:

<<:  ウェブサイトの最適化: テクノロジーよりもユーザーに重点を置く

>>:  エッジ要素: Cheshijie.com の最適化とプロモーションの提案

推薦する

SEOがどのように読者数の増加に役立つかについての簡単な説明

英国オンライン出版者協会と世界編集者フォーラムは最近の記事で、英国の新聞のオンライン版の最近のパフォ...

V.PS: 全アイテムが 10% オフ、IP が 8 で終わるお客様のトラフィックが 2 倍、古いユーザーの場合は無料の構成アップグレードまたはトラフィックが 2 倍

v.ps運営チームは、皆様のご支援に感謝の意を表すため、最新の年末プロモーションをリリースしました。...

Baidu 関連検索の謎を解き明かし、Baidu ドロップダウン ボックスの成功方法を共有する

Baidu の検索ボックスでキーワードを検索すると、まず Baidu の検索ボックスがドロップダウン...

モバイルインターネット環境におけるオンラインマーケティングの新しいアイデア

月収10万元の起業の夢を実現するミニプログラム起業支援プランインターネットの普及により、オンラインマ...

OpenStack は Ceph ストレージを使用します。 Ceph は何をしますか?

1 背景1.1 Ceph の紹介Ceph は、高いスケーラビリティ、高いパフォーマンス、高い信頼性の...

B2Bウェブサイトを最適化する方法についてのアイデア

インターネット産業の急速な発展に伴い、国内の産業プラットフォームはますます増加し、ますます専門化して...

史上最大の「クラウドオフィス」実験が始まった。参加しましたか?

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

日本ソフトバンク VPS: kvmla、350 元/年、2G メモリ/2 コア/20g SSD/600g トラフィック/月 (月に 1 回の無料リセット)、Windows/Linux をサポート

kvmlaは現在、日本のVPSの特別プロモーションを提供しています。350元/年、日本のソフトバンク...

10のオンラインマーケティングスキルの5番目: 検索入札ランキング

以前は、検索入札は PPC と呼ばれていましたが、現在では少し不正確になっています。 PPC は P...

servermania-1G メモリ/月額 7 USD/XEN ONAPP ベース

Servermania は 2002 年に設立されたインターネット企業です。主な事業は、サーバーのレ...

sharktech: 10Gbps 帯域幅無制限トラフィック サーバー、月額 259 ドルから、2*e5-2678v3/64g メモリ/1T NVMe/60G 高防御

Sharktech(米国Shark Data Center)は現在、デンバーのデータセンターで10G...

セカンドレベルドメイン名を最適化して、海から目立つようにする方法

ウェブサイトを最適化する場合、多くの場合、ウェブサイトのトップレベルドメイン名の最適化だけを考えます...

優華婦人服ショッピングガイドネットワークは、キーワードランキングを回復するために3か月半の旅を経験しました

中小規模のウェブサイトにとって最も重要なことは、検索エンジンでのキーワードのランキングであることは誰...

中国モバイルクラウドの最新財務報告が発表:「200億」時代に向けて加速中!

中国移動は3月23日、2021年度の業績報告を発表し、営業収益は前年比10.4%増の8,483億元に...