Baidu 単語分割研究 - 高品質のロングテールトラフィックを獲得する方法

Baidu 単語分割研究 - 高品質のロングテールトラフィックを獲得する方法

以前は百度の単語分割研究にあまり注意を払っていませんでしたが、ある時、最適化を行っていたときに、単語のたった1文字の違いがランキングに大きな違いをもたらすことを偶然発見しました。 「中古住宅」というキーワードを使ったのですが、私のページのキーワード設定は「中古住宅 情報源」になっています。これで問題ないと言う友人もいるかもしれませんが、「中古住宅 情報源」には「中古住宅」というキーワードは含まれていないのでしょうか?百度の単語分割を注意深く研究しないと、2つの単語の違いがわからないかもしれません。しかし、検索結果に少し注意を払えば、手がかりがわかります。百度の「中古住宅」と「中古住宅源」という2つの単語の単語分割は異なります。百度は独自の語彙を構築しているため、「中古住宅」という単語全体を扱いますが、「中古住宅源」という単語については、百度は「中古」と「住宅源」という2つの単語に分割します。当然、他の人が「中古住宅」というキーワードを検索しても、私のページは見つかりません。この小さな詳細を通して、私は百度の単語分割について詳細な研究を行う必要があると思います。私は大まかに次の点をまとめました。

1. Baidu の単語分割は、コンテンツ内でのキーワード関連単語の初出に基づいて行われます。たとえば、テキストの最初に「今日」という単語が表示された場合、ページのキーワードは「今日」と「新しくオープンした熱血江湖SF」の2つの単語に分割されます。タイトルにはキーワードが含まれている必要がありますが、完全に一致する必要はありません。ただし、コンテンツに表示されるキーワードは、Baiduの単語分割と完全に一致する必要があります。完全一致の場合、ファイルのURLパスの深さに応じて並べ替えられます。キーワードが完全に一致する場合、たとえば、ディレクトリはファイルよりも優先され、ルートディレクトリのファイルはセカンダリディレクトリのファイルよりも優先されます。完全一致が最初にランク付けされ、次に部分一致がランク付けされます。

2. キーワードが完全に一致しない場合、単語の分割がある場合、たとえば、キーワード「ブラウザ ダウンロード」の場合、ある Web ページに最初に表示されるキーワードはブラウザであり、キーワード密度が高いですが、この Web ページにはキーワード「ダウンロード」がなく、別の Web ページに最初に表示されるキーワードがダウンロードである場合、この Web ページのキーワードは 2 つの単語「ブラウザ ダウンロード」に分割されます。2 番目の Web ページには「ブラウザ」と「ダウンロード」が含まれていますが、1 番目の Web ページは 2 番目の Web ページよりも上位にランク付けされ、キーワードの前半部分が最も重要であることが示されます。

3. キーワードの最初の部分の頻度がランキングの鍵となります。たとえば、「ブラウザ ダウンロード」の場合、2 つの Web ページが完全に一致せず、両方に 2 つの分詞が含まれている場合、「ブラウザ」の密度が高い Web ページが 1 位にランク付けされます。

4. 完全に一致しているが、キーワードがページ コンテンツの最後に最初に表示される場合、この Web ページのランキングは前のページよりも低くなります。したがって、キーワードがコンテンツのできるだけ早く表示されることが非常に重要です。

5. Baidu は、関連キーワードの初出に基づいて単語を分割します。関連キーワードの初出がキーワードの末尾である場合は、後ろから分割を開始し、前部である場合は、前から分割を開始します。つまり、Web ページの内容の順序と逆順に従って単語の分割が行われます。順序の場合は、キーワードの前半が開始点として使用され、逆順の場合は、キーワードの後半が開始点として使用されます。たとえば、「newly turned on」というキーワードの場合、Web ページに表示される最初のキーワードが「hot blooded martial arts sf」であれば、ページのキーワードは「hot blooded martial arts sf」と「newly turned on」という 2 つの単語に分割されます。

6. Baidu の単語分割原則に従って、作成しやすいキーワード ヘッダーを選択できます (つまり、Web ページのコンテンツに初めて表示されるキーワードを調整します)。つまり、手動で単語の分割が行われます。Baidu は前から後ろに向かって判断し、後ろから前に向かって分割します。

7. セグメンテーションの前半と後半が繰り返される場合、繰り返されるものは繰り返されないものよりも低いランクになります。ただし、両方が繰り返される場合は、前半の密度を使用してランクが決定されます。
例えば、今日の新しい熱血河川湖sfを今日の新しい熱血河川湖|新しい熱血河川湖sfにカットすると(このように切り取られた単語の前半が長すぎるため、ランキングは好ましくありません)、ランキングは今日の新しい|熱血河川湖| sfにカットされたランキングよりも確実に悪くなります。

原題: Baidu 単語分割研究 - 高品質のロングテールトラフィックを獲得する方法

キーワード:

<<:  ウェブサイトの最適化: テクノロジーよりもユーザーに重点を置く

>>:  エッジ要素: Cheshijie.com の最適化とプロモーションの提案

推薦する

ほとんどの企業が無視しているWeChat公式アカウントへのフォロワー追加方法

WeChatの運営はますます困難になっている。3月のWeChatアカウントブロックと4月のWeCha...

週刊ニュースレビュー:悪評を書いた最初の事件は解決し、Xiaomi Boxは「座礁」

1. 中国で初めて悪質な否定的レビュー投稿事件が解決し、容疑者7人が逮捕された11月29日のニュース...

B2Bウェブサイトのコンテンツオーディエンスのニュアンスを理解する方法

あなたのオーディエンスは誰ですか? 彼らはどんな問題を抱えていますか? 彼らが何に興味を持っているの...

大連のウェブサイト最適化は、ウェブサイトの最適化にかかる時間と労力を節約する良い方法を共有しています

1. 大連のウェブサイトを最適化するには、外部リンクを公開し、外部リンクを見つける必要があります。で...

著作権なし/外国貿易 VPS: hostsolutions-1.99 ユーロ/メモリ 2g/ハードディスク 30g/トラフィック 30T

hostsolutions.ro は、ルーマニアの著作権フリー VPS プロモーションを提供していま...

Amazon Web Services がアクセンチュアおよび Anthropic と提携し、企業の責任ある AI 構築を支援

アマゾン ウェブ サービスは、アクセンチュアおよび人工知能企業アントロピックとの世界的なコラボレーシ...

中小規模のウェブマスターにインターネットページの価値を啓蒙することについて語る

以前、インターネットページの価値に関する記事を読みました。Baidu のエンジニアは、インターネット...

アリババ国際ステーションのSEO分析

今日は日曜日なので、少し時間を取ってアリババ国際駅のSEOを分析した記事を書きます。この記事はA5で...

regencyhost-$0.99/Xen/128MB RAM/10GB SSD/無制限帯域幅

ご紹介しましょう:regencyhost.comは2009年に設立され、主に仮想ホスティング、VPS...

インクルージョンはウェブマスターにとって問題になっていますか?

最近、パソコンの電源を入れて最初にやることは、データの変更を確認することではなく、ウェブサイトを開い...

Chiaマイニングマシン: 537ドル、2*e5-2690v4 (28C/56T)/32gDDR4/23T SSD/10Gbps帯域幅

莫大な利益が得られることから、マイニング(チアマイニング)は最近とても人気があるようです。誰もが大容...

背景で最も影響力のある3つのデータの簡単な例

最適化担当者として、私たちは基本的に、検索エンジンの監視、外部リンクの公開、そしてもちろん重要なデー...

クラウド プラットフォームを「より適切に管理」するにはどうすればよいでしょうか?ファーウェイのクラウド集中運用・保守が企業のイノベーションを加速

デジタル化の波は世界の経済情勢を一変させており、デジタル経済は世界の持続可能な成長の新たな原動力にな...

激動の時代、狂気の起業家精神

はじめに:投資家のヤンヤンはかつてこう言いました。「もし誰もが自分のビジネスを始めたら、それはこの国...

SEO 最適化: 「一般的な分析を安易に使用しないでください」

真夜中に、ずっと聞きたかった、あるいは誰もが知っているこの質問を突然思いつきました。まずはここで続き...