Baidu 単語分割研究 - 高品質のロングテールトラフィックを獲得する方法

Baidu 単語分割研究 - 高品質のロングテールトラフィックを獲得する方法

以前は百度の単語分割研究にあまり注意を払っていませんでしたが、ある時、最適化を行っていたときに、単語のたった1文字の違いがランキングに大きな違いをもたらすことを偶然発見しました。 「中古住宅」というキーワードを使ったのですが、私のページのキーワード設定は「中古住宅 情報源」になっています。これで問題ないと言う友人もいるかもしれませんが、「中古住宅 情報源」には「中古住宅」というキーワードは含まれていないのでしょうか?百度の単語分割を注意深く研究しないと、2つの単語の違いがわからないかもしれません。しかし、検索結果に少し注意を払えば、手がかりがわかります。百度の「中古住宅」と「中古住宅源」という2つの単語の単語分割は異なります。百度は独自の語彙を構築しているため、「中古住宅」という単語全体を扱いますが、「中古住宅源」という単語については、百度は「中古」と「住宅源」という2つの単語に分割します。当然、他の人が「中古住宅」というキーワードを検索しても、私のページは見つかりません。この小さな詳細を通して、私は百度の単語分割について詳細な研究を行う必要があると思います。私は大まかに次の点をまとめました。

1. Baidu の単語分割は、コンテンツ内でのキーワード関連単語の初出に基づいて行われます。たとえば、テキストの最初に「今日」という単語が表示された場合、ページのキーワードは「今日」と「新しくオープンした熱血江湖SF」の2つの単語に分割されます。タイトルにはキーワードが含まれている必要がありますが、完全に一致する必要はありません。ただし、コンテンツに表示されるキーワードは、Baiduの単語分割と完全に一致する必要があります。完全一致の場合、ファイルのURLパスの深さに応じて並べ替えられます。キーワードが完全に一致する場合、たとえば、ディレクトリはファイルよりも優先され、ルートディレクトリのファイルはセカンダリディレクトリのファイルよりも優先されます。完全一致が最初にランク付けされ、次に部分一致がランク付けされます。

2. キーワードが完全に一致しない場合、単語の分割がある場合、たとえば、キーワード「ブラウザ ダウンロード」の場合、ある Web ページに最初に表示されるキーワードはブラウザであり、キーワード密度が高いですが、この Web ページにはキーワード「ダウンロード」がなく、別の Web ページに最初に表示されるキーワードがダウンロードである場合、この Web ページのキーワードは 2 つの単語「ブラウザ ダウンロード」に分割されます。2 番目の Web ページには「ブラウザ」と「ダウンロード」が含まれていますが、1 番目の Web ページは 2 番目の Web ページよりも上位にランク付けされ、キーワードの前半部分が最も重要であることが示されます。

3. キーワードの最初の部分の頻度がランキングの鍵となります。たとえば、「ブラウザ ダウンロード」の場合、2 つの Web ページが完全に一致せず、両方に 2 つの分詞が含まれている場合、「ブラウザ」の密度が高い Web ページが 1 位にランク付けされます。

4. 完全に一致しているが、キーワードがページ コンテンツの最後に最初に表示される場合、この Web ページのランキングは前のページよりも低くなります。したがって、キーワードがコンテンツのできるだけ早く表示されることが非常に重要です。

5. Baidu は、関連キーワードの初出に基づいて単語を分割します。関連キーワードの初出がキーワードの末尾である場合は、後ろから分割を開始し、前部である場合は、前から分割を開始します。つまり、Web ページの内容の順序と逆順に従って単語の分割が行われます。順序の場合は、キーワードの前半が開始点として使用され、逆順の場合は、キーワードの後半が開始点として使用されます。たとえば、「newly turned on」というキーワードの場合、Web ページに表示される最初のキーワードが「hot blooded martial arts sf」であれば、ページのキーワードは「hot blooded martial arts sf」と「newly turned on」という 2 つの単語に分割されます。

6. Baidu の単語分割原則に従って、作成しやすいキーワード ヘッダーを選択できます (つまり、Web ページのコンテンツに初めて表示されるキーワードを調整します)。つまり、手動で単語の分割が行われます。Baidu は前から後ろに向かって判断し、後ろから前に向かって分割します。

7. セグメンテーションの前半と後半が繰り返される場合、繰り返されるものは繰り返されないものよりも低いランクになります。ただし、両方が繰り返される場合は、前半の密度を使用してランクが決定されます。
例えば、今日の新しい熱血河川湖sfを今日の新しい熱血河川湖|新しい熱血河川湖sfにカットすると(このように切り取られた単語の前半が長すぎるため、ランキングは好ましくありません)、ランキングは今日の新しい|熱血河川湖| sfにカットされたランキングよりも確実に悪くなります。

原題: Baidu 単語分割研究 - 高品質のロングテールトラフィックを獲得する方法

キーワード:

<<:  ウェブサイトの最適化: テクノロジーよりもユーザーに重点を置く

>>:  エッジ要素: Cheshijie.com の最適化とプロモーションの提案

推薦する

メールマーケティングのクリック率を上げる5つのヒント

電子メール マーケティングは、ウェブサイトのトラフィックを増やし、オンライン取引のコンバージョン率を...

簡単な分析: ロングテールキーワードは今でもウェブサイトにとって有用でしょうか?

ロングテール キーワードは、多くの SEO 担当者にとって、ウェブサイトへのトラフィックを誘導するの...

これらのウェブサイト最適化テクニックを学べば、基本的な操作経験がなくても数秒で SEO マスターになれます!

2月17日、百度は、上海警察がネットユーザーが検索エンジンを使って売春を勧誘していた事件を摘発したと...

ブランドマーケティング:イベント企画のポイントとなる4つの特徴!

一度事件が起きて議論が始まれば火がつくが、世論のコントロールがプロフェッショナルであるかどうかにかか...

2022年のサーバー仮想化市場の発展状況

サーバー仮想化とは、物理サーバーを複数の仮想サーバーに分割する技術です。各仮想モーメントは他の仮想モ...

ウェブサイト最適化の最初のレッスン: スパイダーの仕組みを理解する

ウェブサイト最適化の専門家として、スパイダーの仕組みを理解していなければ、そのような最適化は間違いな...

Oracle Brontoは、すべてのチャネルでパーソナライズされた製品推奨を提供します。

インターネット小売業者トップ 1000 社に対するクラウドベースの電子メール マーケティングの大手プ...

Krypt データセンター VPS ブランド イオンクラウド: ロサンゼルス データセンター VPS 簡単評価

クリプト電脳室直系のVPSブランドであるイオンクラウドのVPSについて、その速度や効果などについて知...

在庫一掃: hosteons、月額 3.49 ドル、ロサンゼルス/ソルトレイクシティ、3G メモリ/3 コア/60g SSD/6T トラフィック/10Gbps 帯域幅/無料スナップショット

Hosteons は、ロサンゼルスとソルトレイクシティのデータセンターを対象とした在庫一掃プロモーシ...

12306 はユーザーから批判されていますが、支持すべきでしょうか、それとも反対すべきでしょうか?

年末が近づくにつれ、春節の列車の切符は販売ピーク期に入り、オンライン切符購入システム12306は世論...

ネットワークチャネルの動作の分析と比較

不完全なデータ報告によると、国内の「OEM」製造業の現状は、依然として伝統的なビジネスモデルの範囲内...

夢を追いかける人はSEOで自分を売り込む方法を学ぶ

私は自分の幸せを探し続けてきた人間です。最初から最後までずっと探し続けてきました。人それぞれ幸せは違...

私たちは本当に SEO を理解しているのでしょうか?

SEO 最適化に関しては、業界のベテランであっても、この分野に参入したばかりの新人であっても、多かれ...

ネガティブケース分析はユーザーエクスペリエンスを向上させる方法を教えます

焦点となるトピックはランキングからコンバージョン率に移りました。多くのウェブマスターが、ランキングが...