SEO担当者はインデックス作成プロセスで重み付け手法をうまく活用すべきである

SEO担当者はインデックス作成プロセスで重み付け手法をうまく活用すべきである

月収10万元の起業の夢を実現するミニプログラム起業支援プラン

検索エンジンは各ページに一定の重み値を与え、この値はページが更新されて時間が経過するにつれて変化します。

今日、小小科堂 SEO 自習ネットワークは、「SEO 担当者はインデックス作成プロセスで加重方式を有効活用すべき」というテーマをお届けします。これが皆さんのお役に立てば幸いです。

1. インデックス作成における重み

検索エンジン スパイダーによるクロールとクローリング、およびページの組み込みとインデックス作成は、ユーザーがキーワードを検索したときにページが表示されるための基本的な手順です。インデックス作成には、ページ コンテンツ自体の重み付け係数が含まれます。

① 索引項目重み概念

インデックス項目の重みは、ある程度、ドキュメント内の単語の相対的な重要度を反映します。この値は通常、インデックスのソート プロセス中にスコアを計算するために使用されます。これは、検索エンジンのランキングに影響を与える重要な要素の 1 つです。

② 指標項目の重みはどのようにして算出されるのですか?

インデックス項目の重みは、ドキュメント統計を使用して検索モードの重み付けコンポーネントによって計算されます。

③ 指標項目の重み付け方法

従来の検索モードで最も一般的な重み付け方法: TF-IDF アルゴリズム。

2. TF-IDFアルゴリズム

① TF-IDFアルゴリズムの定義

TF-IDF アルゴリズムは、ドキュメント内で索引用語が出現する回数または頻度と、ドキュメント コレクション全体における索引用語の頻度の組み合わせ (または積) に基づいています。

②TF-IDFアルゴリズムにおける単語分析

1) TF

この数と頻度は単語頻度と呼ばれ、英語では tf と略されます。

2) イスラエル国防軍

ドキュメント コレクション全体におけるインデックス用語の出現頻度は、モデル ドキュメント頻度 (英語では idf) と呼ばれます。

③TF-IDFアルゴリズムの簡単な説明

TFIDF の核となる考え方は、ある単語またはフレーズが文書内に頻繁に出現し、インデックス ライブラリ内の他の文書にはほとんど出現しない場合、この単語またはフレーズはカテゴリの区別能力に優れており、分類に使用できると考えられるというものです。

簡単に言えば、単語またはフレーズは索引用語であり、この記事ではこの用語に高い重みが与えられます。

たとえば、「TWNM-SEO」というフレーズは、Xiaoxiaoketang.com によって完全に提案されました。記事「Total Network Marketing SEO [TWNM-SEO] This is My Website Optimization」では、このフレーズが非常に頻繁に登場します。同時に、これまで誰もこのフレーズについて言及していません。そのため、このドキュメントでは、「TWNM-SEO」という用語に非常に高い重みが与えられています。

3. TF-IDFアルゴリズムの理解と使用

SEO 担当者にとっては、上記の知識を理解していれば十分です。結果を計算するのにどの関数や数式が使用されるかを知る必要はありません。

実際、TF-IDF アルゴリズムを学習することで、SEO に関する常識的な知識をより深く理解できるようになります。

① ブランドワードは最適化しやすい

ブランドワードは、通常、自分で作成し、TF値が大きく、IDF値も大きく、ページウェイトも高いため、自然にランク付けされやすいです。

② 業界のコアワードの最適化が難しい

数え切れないほど多くのウェブサイトが同じ単語を最適化していますが、ホームページ上のスペースは限られています。誰もが大きなTFの要件を満たしていますが、IDFが小さいほど、この単語を最適化することが難しくなります。

そのため、Baidu 検索の関連結果の数は、キーワード最適化の難易度を判断する理由の 1 つとして使用されます。

③百度インデックスのないキーワードを掘り起こし、最適化の難易度を下げる

業界には百度インデックスに載っている単語があり、誰もが最適化とランキングに取り組んでいます。そのような単語は競争圧力が大きいだけでなく、多くのクリックをもたらさない可能性があります。 Baidu 指数が 100 の場合、実際のユーザーは 2 人だけであり、残りの 98 人はその会社の競合他社である可能性があります。

Baidu インデックスがない単語をいくつか掘り出す必要がありますが、今回は一定の検索ボリュームを維持して、最適化の難易度を下げながら、より多くの実際のトラフィックをもたらす必要があります。

④TFは万能ではない!過剰蓄積は有害です!

TF-IDF アルゴリズムによれば、多くの人は TF 値を高めてより良いランキングを得るためにキーワードの密度や頻度を高めたいと考えています。ただし、このアプローチは適切に実行できますが、一定量を超えるとあまり効果がなく、過剰な蓄積により検索エンジンのランキングが下がる可能性もあります。

いわゆるキーワード密度2%~8%は、あくまでもおおよその範囲です。上位にランクされるページの多くは、密度が2%を下回っています。もちろん、8%を超えるページもあります。密度が小さすぎない限り、あまり心配する必要はありません。

例えば、密度がすでに 5% の場合、意図的に 8% や 20% まで蓄積しても意味がなくなります。これは高TFに関する誤解です。

つまり、TF-IDF アルゴリズムから得たインスピレーションに基づいて、キーワードの密度または頻度 (TF) を低くしすぎないようにする必要があります。ただし、IDF の場合、IDF 値の高いキーワードを見つけることによってのみ最適化できます。最適化するキーワードの IDF 値がすでに非常に低い場合、この状況を変更することはできません。IDF 値が低いほど、この単語をある程度最適化することが難しくなります。

したがって、Web サイトの最適化のプロセスでは、ページを適切に処理することに加えて、内部リンクと外部リンクの最適化にも注意を払う必要があります。

4. TF-IDFアルゴリズムの式

①TF式

TF(i,j): 文書iにおけるキーワードjの出現頻度。

n(i,j): 文書iにキーワードjが出現する回数。

例えば:

記事には合計 100 語あり、そのうち「SEO トレーニング」は 10 回出現するため、TF は 10/100、つまり 0.1 になります。

しかし、冠詞には「的」「得」「吗」「地」が多く、通常は冠詞の語句を反映できないため、IDF を制限として使用する必要があります。

②IDF式

IDF(i): 単語iの逆文書頻度

|D|: コーパス内の文書の総数

|j:t(i)はd(j)に属する|単語iが出現する文書の総数

+1 は分母が 0 になるのを防ぐためです。

IDF は一般的な単語からの干渉を防ぐことができます。

先ほどの例を見てみましょう。

記事には合計 100 語あり、そのうち「SEO トレーニング」は 10 回出現するため、TF は 10/100、つまり 0.1 になります。

また、「私たち」という単語は合計10回出現し、TF結果も0.1でした。

コーパスに合計 1,000 件の記事があり、そのうち 10 件の「SEO トレーニング」記事と 1,000 件の「私たち」記事があるとします。

「SEOトレーニング」のIDF = log(1000/10) = 2

「私たち」のIDF = log(1000/1000) = 0

③ TF-IDF式

TF-IDF = TF*IDF

「SEOトレーニング」のTF*IDF = 0.1*0 = 0

「私たち」のTF*IDF = 0.1*2 = 0.2

明らかに、この記事では「私たち」よりも「SEO トレーニング」の方が重要です。

小小科堂 SEO 自習ネットワークがお伝えするのは、上記のとおりです。「SEO 担当者は、インデックス作成プロセスで加重方式を有効活用する必要があります。」ご視聴ありがとうございました。 SEOトレーニングには、Xiaoxiao Classroomをお選びください。その他の SEO チュートリアルについては、Xiaoxiao Classroom を検索してください。オリジナル記事の転載は歓迎されており、著作権は留保されています。

元のタイトル: SEO担当者はインデックス作成プロセスで加重法を有効活用すべき

キーワード: ウェブサイトの重み、SEO

<<:  新しいサイトがサンドボックスに入る場合、どのように対処すればよいでしょうか?

>>:  サイトSEO最適化で注意すべき4つのポイント

推薦する

A5ウェブマスターネットワークB2Bウェブサイト運営研修体験共有

A5 Webmaster Networkの第2回B2Bウェブサイト運用研修に参加して、とても興奮し、...

AARRR モデル: ゲーミフィケーションによるユーザー成長戦略

オンラインインターネットトラフィックの浸透がますます集中するにつれて、ユーザーの心を占める製品が徐々...

動画サイトの現状とサイト最適化運用方法

調査によると、多くのウェブマスターの中で、動画サイトのウェブマスターも無視できないグループです。動画...

新しいウェブサイトを構築する初心者向けのFAQ

1. 新しいサイトのランキングは非常に良いのに、数日後に消えてしまうのはなぜですか?分析:検索エンジ...

myhosting - 共有ホスティングが 25% オフ / 月額 2.95 ドル

myhosting は、ドメイン名登録、Windows および Linux プラットフォームの仮想ホ...

2019年の新メディアトレンド予測: 縦型スクリーンが王者、バブルは消滅

コンテンツ起業家にとって、2018 年は浮き沈みの多い年でした。例えば、Tik Tokは大人気となり...

草の根ウェブマスターは、検索エンジンアルゴリズムの頻繁な変更にどのように対処できるでしょうか?

インターネットに注目している友人は、最近、Google のランキング アルゴリズムの考え方が変わり、...

NodeServ – 年間 30 ドル / 500g DDOS 保護 / 256M メモリ / 50G ハードディスク / 500G トラフィック

NodeServ.com は、DDOS 保護を備えた VPS の提供を開始したと発表しました。ネット...

グリーンクラウドはいかがでしょうか?サンノゼデータセンターのAMDシリーズチキンのレビュー

グリーンクラウドはいかがでしょうか? greencloudvpsはどうですか?ブラックフライデー中に...

レポート:共同購入サイトの半数が閉鎖

中国電子商取引研究センターが最近発表した「2012年中国オンライン共同購入市場データ監視レポート」に...

コミュニティの次の形は、新しい小売会員システムです。

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています過激な分裂...

間違いをしないでください! Weiboマーケティングに関する5つの誤解を挙げる

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス企業であれ個人であれ、W...

円周率は「4」マーケティングとSEOの革新は単なるナンセンスではない

純粋なオンラインマーケティング(またはSEO)の観点から見ると、「円周率は本当に3.14ですか?教科...