ユーザーの閲覧履歴に基づくウェブページのランキングのアイデア

ユーザーの閲覧履歴に基づくウェブページのランキングのアイデア

Google の PageRank については詳しく説明しません。これは、Web ページの重要性を測定できるアルゴリズムです。本質的には、Web ページが互いに投票した結果です。この機能に基づいて、サイトマップを使用して、検索エンジンが可能な限り多くの Web サイト コンテンツを閲覧できるようにすることができます。また、より多くの外部リンクを作成して Web サイトの PR 価値を高め、SEO 目標を達成することもできます。

市場にあるほとんどの検索エンジンは PageRank に似た方法を使用しており、公平性を確保するために、Web クローラーを介して Web サイトを走査するために純粋な機械操作を使用しています。これにより、いくつかの興味深い疑問が生じます。

1. Web ページの内容は素晴らしいのですが、外部リンクが少なすぎるため、クローラーが設定された深度しきい値内でクロールできず、ほとんどの人が気にしない「ダーク コンテンツ」になってしまう可能性があります。

2. 一部のウェブサイトはPR値が高いため、コンテンツを転載したり価値の低いコンテンツを掲載したりしても、検索ランキングは良い場合があります。大手検索エンジンがセマンティックネットワーク方式を使用して高品質のコンテンツを識別しても、その効果はまだ十分ではありません。

上記の問題を回避するために、Web ページ コンテンツの重要性と品質を判断するためのユーザー データを導入することが、考えられる研究方向です。どのように行うのでしょうか?

仮定: 閲覧行動と閲覧時間は、ウェブページの品質を判断する最良の基準であり、ユーザーによる注釈と同等である。大規模データの場合、効果は機械による注釈よりも優れているはずである。

原理:

1. ブラウザやその他のクライアント ソフトウェア (できればファイアウォールやその他のセキュリティ ソフトウェア) を通じてユーザーの閲覧ログを取得し、検索エンジンのクローラー データベースにアップロードして、ユーザーの閲覧データを取得します。

2. クローラーは既存のインデックスライブラリと照合し、インデックスされていないコンテンツを見つけてクロールします。

3. ユーザーログを使用してWebページに投票します。閲覧時間が長いほど重みが高くなります。Webページのランクを計算します。

欠陥:

1. クライアントへの依存

2. ユーザーのプライバシーの問題がある

避ける:

1. クラウドウイルス対策、クラウド防御、クラウドセキュリティを提案し、閲覧履歴のアップロードにユーザーに同意させる

2. こっそりアップロードし、閲覧履歴(他のファイルもOK)を暗号化して別々にアップロードし、サーバー側で再構成して復元する

さて、アイデアを説明したので、これを派手で意味深い名前にしましょう。peoplerank

最後に、私はテクノロジーについて真剣に話しています。

iDark Horse 経由 sluke Lu Weiqing 著 元の URL: http://luplusplus.com/peoplerank-model

元のタイトル: ユーザーの閲覧履歴に基づく Web ページのランキングのアイデア

キーワード: ベース、ユーザー、閲覧、記録、ウェブページ、ランク、アイデア、Google、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  FashionPlaytes: 子供たちが自分の服をデザインできる電子商取引サイト

>>:  事例分析: ブロックされてから 1 か月後にウェブサイトが復旧

推薦する

温愛雲:香港メガツーデータセンターの3ネットワークcn2 giaラインの簡単な評価

Wenaiyun(wenaiyun)は、2007年に香港(LOKWIN INTERNATIONAL ...

反著作権侵害同盟は、百度が海賊版動画を部分的に削除したと発表

新浪科技報、11月18日朝のニュースによると、中国オンラインビデオ著作権侵害防止連盟は本日、そのテス...

[高同時実行性] 数十億のトラフィック下で分散電流制限を実現するにはどうすればよいでしょうか?これらの理論をマスターしなければなりません! !

[[335435]]著者は、正確にスケジュールされたタスクと遅延キュー処理機能を備えた、高同時実行シ...

1000リンクの価値があるリンクを公開する方法を教えます

優れた外部リンクは、Web サイトの掲載性を向上させるだけでなく、トラフィックをもたらすこともできま...

アマゾン ウェブ サービス (AWS) のクラウドネイティブな自社開発プロセッサが中国に初上陸

アマゾン ウェブ サービス (AWS) は 1 月 28 日、AWS Graviton2 プロセッサ...

WeChat が入力方法を開発する必要があるのはなぜですか?

張小龍が公開授業のスピーチで言及した5つの実験プロジェクトのほとんどは、WeChatバージョン8.0...

ウェブマスターはどのようにして優れた外部リンク リソースを見つければよいでしょうか?

インターネットには外部リンクの作り方に関する記事がたくさんありますが、どれも同じです。フォーラム、機...

小規模地域の病院ウェブサイトは、百度の大再編の機会を捉えて「一挙に優勝」すべき

先雲さんは最近、地方の民間病院のネットワーク部門で編集者と最適化担当者として働いていた。6月から現在...

2012 年のオンライン イベント マーケティング プランニングの代表的な 5 つの事例のレビュー

2012年は、終末の予言を超えて新たな生命をもたらす、特別な年になるはずでした。 2012 年は多く...

要約: ウェブサイトの最適化中に見落としがちな知識

みなさんこんにちは。私はHongtu Internetです。私は1年以上ウェブサイトの最適化に携わっ...

2019年中国オンライン動画市場年次分析

インターネット市場におけるビデオのトレンドは止められない。コアオンラインビデオは依然として積極的に市...

weloveservers-2g メモリ/100g ハードディスク/G ポート/月額 5 ドル

PS: 年間 25 ドルの VPS と Spring 2048 VPS を購入した後、チケットで G...

Rancher の Kubernetes が再生可能なリソースを「提供」する方法をご覧ください

[51CTO.comよりオリジナル記事] インターネットの発展により、エネルギー企業にも変革の波が到...

Baidu の「ビッグアップデート」により、ユーザーエクスペリエンスが再び向上。Baidu 関連情報は 2 ページ目の上部に表示されます

数回の大規模なKステーション調整の後、Baiduは本日、さらに大きなアップデートを実施しました。まず...

hiformance-5 USD/KVM/3 GB RAM/30 GB HDD/3 TB Flow/ユタ

新規加盟店の Hiformance は、ユタ州のデータセンターで KVM 仮想 VPS を暫定的に運...