SEOを行う際に数千万ページを制作・管理する方法

SEOを行う際に数千万ページを制作・管理する方法

友人の招待により、Taozui は今日、Himalaya SEO が何千万ページものコンテンツをどのように処理するかについてお話しします。

SEO の専門家は、コンテンツが王様だといつも言っています。確かに、検索トラフィックはキーワードから生まれ、キーワードはコンテンツから生まれます。

Himalaya SEO プロジェクトは、数千万のエントリと数十万の毎日の UV を持つように配置されています。SEO の観点から見ると、次の 2 つの機能が「ルート」です。

1. 高品質なコンテンツを制作する能力

2. パーソナライズされたコンテンツ管理機能

1. コンテンツ制作能力の問題は主に以下の戦略によって解決されます。

まず、既存のコンテンツの一括移行

インターネット上の既存コンテンツのバッチマイニング、バッチコレクション、バッチ公開。

2つ目はUGCコンテンツの作成を積極的に推進することです

コンテンツの自己集約やコンテンツの自己更新の促進など、ユーザーが製品から独立してコンテンツを生成することを促進する。

タイプ3: 既存コンテンツの自然な集約

既存の収集コンテンツとUGCコンテンツを自然な条件下で組み合わせ、集約し、再編成できるようにします。

4番目の方法:自然に生成された効果のないコンテンツを再編成して効果的なコンテンツにする

たとえば、主にモバイルベースのこのような製品の場合、1 回限りのユーザーの割合が非常に高くなります。 Web の観点から見ると、利点はページが大量生産されることです。欠点は、それらはすべて無効なページであることです。

では、どうすれば無駄を宝に変えるのでしょうか。コンテンツを合理化して再編成することが非常に効果的です。

2. パーソナライズされたコンテンツを管理する機能は、主にプログラムと手作業の組み合わせによって解決されます。

私たちの前には大きな問題が立ちはだかっています。何千万もの Web ページをどのように管理し、価値のあるページをスパイダーに適切に提示するかということです。

一つ一つ定義したり変更したりすることはできません。ここで、技術専門家がよく使う宝物、正規表現を推奨します。

はい、正規表現を学習し、特定のルールでバッチデータを処理するという考え方です。

最初のステップは重要な情報を抽出することです。

ステップ 2: 基本ルールを設定します。

3 番目のステップは、ルールをグループ化することです。

ステップ 4: ルールの範囲と優先順位を設定します。

したがって、正規表現の仕組みを理解していれば、ルール システムを簡単に設計し、数千万のデータを簡単に処理できます。

============================

以下に簡単な例を示します。

ヒマラヤタイトル管理ルールシステム構成 - ロジック

———————————-カスタム設定↓↓↓

表紙:

タイトル 必須フィールド: カスタム

キーワード: カスタム

説明: 必須フィールド: {カテゴリ名}、カスタム

カテゴリページ:

タイトル 必須フィールド: {カテゴリ名}、カスタム

キーワード: カスタム

説明: 必須フィールド: {カテゴリ名}、カスタム

———————————-グローバル設定↓↓↓

アルバム詳細ページ:

タイトル 必須フィールド: {アルバム名}、カスタム

キーワード: カスタム

説明: 必須フィールド:

{はじめに: 40文字の漢字を抽出}、{アルバム名}、カスタム

フィールド詳細ページ:

タイトル 必須フィールド: {フィールド名}、カスタム

キーワード: カスタム

説明: 必須フィールド:

{はじめに: 40 文字の中国語を抽出}、{フィールド名}、カスタム

個人情報ページ:

タイトル 必須フィールド: {ユーザー名}、カスタム

キーワード: {ユーザー名}、カスタム

説明: 必須フィールド:

{はじめに: 40 文字の中国語を抽出}、{ユーザー名}、カスタム

サウンド詳細ページ:

タイトル必須フィールド: {タイトル}、{アルバム}、{カテゴリ}、{著者名}、{アップローダーユーザー名}、カスタム

キーワード: {フィールド}、{親カテゴリで設定されたキーワードを継承}

説明: 必須フィールド:

{はじめに: 40文字の中国語を抽出}、{フィールド名}、{アルバム名}、{カテゴリ名}、{著者名}、{アップローダーユーザー名}、カスタム

—————————————

タイトル: 30文字の中国語を表示

Des: 80文字の中国語を表示

カテゴリタイトル: キーワードの組み合わせに基づく (カスタマイズ)

アルバムタイトル:ターゲットキーワード(比較的人気の高いワード)

詳細ページのタイトル: 7〜20文字

詳細ページの説明: 50文字以上の漢字

============================

具体的なコンテンツの組み合わせ例については、ヒマラヤのウェブサイトのオンライン版を参照してください。

============================


原題: SEO を行う際に数千万ページを制作・管理する方法

キーワード: SEO、1000万ページレベル、SEOを行う

<<:  ウェブサイト最適化の最良の状態とステータス

>>:  SEO 担当者はどうすれば急速に成長できるでしょうか?

推薦する

マルチクラウドをマスターするには、インクルージョンの文化が重要

今日、クラウド コンピューティングの利用が増加しています。多くの組織では、クラウドへの支出、クラウド...

vpsnet-lt、2 ドル / 1g メモリ / 10g SSD / 50m 無制限トラフィック

vpsnet.lt (2007 年に設立、UAB「Esnet」と提携) は、リトアニアのデータ セン...

医療ウェブサイトの直帰率における訪問者を強制的に直帰させる 6 つの SEM の罪

著者は、「SEM の医療 SEO は検索エンジンの背後にいるユーザーに焦点を当てている」、「SEM ...

数千の共同購入サイトの戦いが再編される:わずか半年で1,500の共同購入サイトが消滅

共同購入は2010年に中国に参入した。1年以上の急速な発展の後、すぐに再編が行われた。昨年8月から半...

交流リンクの超詳しい知識まとめ

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています友好的なリ...

新しい D0 ステッピング Core i7-975 の消費電力とオーバークロック性能に関する予備調査

AMD は Phenom II X4 955 Black Edition を発売しようとしており、I...

Huawei CloudとCNCFが共同でコンテナ技術とシナリオベースのアプリケーション間のギャップを埋める

[51CTO.comからのオリジナル記事] Huawei CloudとCNCFの関係は2015年にま...

ピンドゥオドゥオは商品フローに基づいた「今日頭条」か?

今週、Pinduoduoは2018年第4四半期および通年の監査されていない財務報告書を発表しました。...

dediserve-4 EUR/KVM/1G メモリ/25G SSD/1T トラフィック/8 コンピュータ ルーム (オプション)

dediserve.com がなぜ突然プロモーションを開始したのかはわかりません。サーバーが多すぎて...

losangelesvps: 年間 11 ドル、ロサンゼルスの無制限トラフィック VPS、1Gbps 帯域幅、768M メモリ/1 コア/10g SSD

中国の旧正月が近づいており、losangelesvps もこの楽しみに参加し、中国の旧正月向けの特別...

多用途-1gメモリ/1gVswap/4IP//30Gハードディスク/1.5T月間トラフィック/月額7ドル

VersatileIT はオーストラリアで正式に登録された会社であり、7 年以上にわたってシステムを...

転載ウェブサイトのユーザーエクスペリエンスを向上させる方法についての簡単な説明

現在、検索エンジンはユーザーエクスペリエンスの向上を提唱しています。ウェブサイトのウェブマスターが優...

パブリッククラウド、プライベートクラウド、ハイブリッドクラウド、企業ユーザーはどのように選択するのでしょうか?

[[221007]]いわゆるクラウドコンピューティングのサービスタイプとは、ユーザーにどのようなサー...

分散、高同時実行性、マルチスレッドを区別できますか?

これら 3 つの単語を見ると、分散 = 高い同時実行性 = マルチスレッドと考える人が多いのではない...

初期段階の企業Weiboの運用方法

インターネットはすでにWeiboの商業運用の検討を本格的に開始しており、Weiboマーケティングをう...