Web 分析データ収集方法の説明: Web ログ JS タグとパケット スニファー

Web 分析データ収集方法の説明: Web ログ JS タグとパケット スニファー

ウェブサイト分析の歴史を振り返ると、「あなたは***番目の訪問者です」という表現から、現在の専門ツールプロバイダーの隆盛に至るまで、ウェブサイト分析は徐々に科学へと発展してきました。しかし、さまざまな形式の分析データに直面して、多くの人が依然としてデータのソースについて混乱しています。Web サイトの分析データを収集する原則を理解することで、これらの混乱を解決できる可能性があります。

現在、Web サイトの分析データを収集する主な方法は、Web ログ、JavaScript タグ、パケット スニファーの 3 つです。

1. ウェブログ

下の図は、Web ログ データ収集プロセスの概略図です。

上の図から、ウェブサイト訪問者が URL を入力し、ウェブサイト サーバーに http リクエストを送信すると、ウェブサイト分析データの収集が開始されることがわかります。リクエストを受信すると、Web サイト サーバーは独自のログ ファイルにレコードを追加します。レコードの内容には、リモート ホスト名 (または IP アドレス)、ログイン名、フル ログイン名、リクエストの日付、リクエストの時刻、リクエストの詳細 (リクエスト方法、アドレス、プロトコルを含む)、リクエストの戻りステータス、およびリクエストされたドキュメントのサイズが含まれます。その後、Web サーバーはページを訪問者のブラウザに返して表示します。

一部のプロフェッショナル ツール メーカーは、大量のログ データを処理し、処理したデータを独自のデータベースに保存するための専用の処理サーバーを備えています。ウェブサイト運営者は、分析レポート システムにアクセスして、ウェブサイトの分析データを表示します。中小規模のウェブサイト所有者の中には、コストを考慮して専門のツールメーカーの支援を求めない人もいます。彼らは、シンプルなウェブサイトログ分析ソフトウェアを使用してログデータの処理を完了します。もちろん、処理されたデータには一定の制限があります。

2. JavaScript タグ

次の図は、JavaScript タグ収集データ プロセスの概略図です。

上記の JavaScript タグは、Web サイトの訪問者が http リクエストを行うことから始まり、Web ログと同じようにデータを収集します。違いは、JavaScript タグによって訪問者に返される Web ページ コードに、ページが表示されるときに実行される特別な JavaScript コードが含まれることです。このコードは、訪問者の Cookie から詳細情報 (アクセス時間、ブラウザ情報、ツール製造元によって現在の訪問者に割り当てられたユーザー ID など) を取得し、ツール製造元のデータ収集サーバーに送信します。データ収集サーバーは収集されたデータを処理し、データベースに保存します。ウェブサイト運営者は、分析およびレポート システムにアクセスしてこのデータを表示します。

JavaScript タグは、そのスピードと精度からほとんどのツールメーカーに好まれており、最も人気のあるデータ収集方法となっています。

3. パケットスニファー

次の図は、パケット スニファーがデータを収集するプロセスの概略図です。

上の図から、Web サイトの訪問者が送信したリクエストが Web サイト サーバーに到達する前に、まずパケット スニファーを通過し、次にパケット スニファーがリクエストを Web サイト サーバーに送信することがわかります。パケット スニファーによって収集されたデータは、ツール製造元のサーバーによって処理され、データベースに保存されます。ウェブサイト運営者は、分析レポートシステムを通じてこのデータを閲覧できます。

4. データ収集方法の長所と短所の比較

完璧なデータ収集方法はありません。データ収集方法によっても、それぞれの特徴が異なります。さまざまな収集方法の長所と短所を理解することは、ツールを選択する際の指針にもなります。

次の表は、3 つのデータ収集方法の長所と短所を詳細に比較したものです。

Web ログ JavaScript マーカー パケット スニファー

利点: データソースの入手が容易

・履歴データの再処理に便利

・検索エンジンクローラーのアクセス記録を記録できる

・ファイルのダウンロード状況を記録・柔軟なデータ収集と強力なカスタマイズ性

・キャッシュやプロキシサーバへのアクセスを記録可能

・訪問者の行動をより正確に追跡・クロスドメインアクセスを監視するのがより便利

・リアルタイムデータを取得するとより便利

デメリット: キャッシュとプロキシサーバーへのアクセスを記録できない

・カスタマイズされたビジネス情報を取得できない

・来場者の位置づけが曖昧すぎる

・クロスドメインアクセスの監視が難しい ・ユーザー側のJS設定がデータ収集に影響する

・ダウンロードやリダイレクトの記録が難しい

・WebサイトのJSスクリプト負荷が増加する・初期導入コストが高い

・キャッシュやプロキシサーバへのアクセスを記録できない

・ユーザーデータのプライバシーに対する潜在的なセキュリティリスク

どのデータ収集方法を選択するかを決定する前に、ニーズを理解する必要があります。ウェブサイトのトラフィック データを第三者に取得されたくない場合は、ウェブ ログが間違いなく最適な選択肢です。ただし、Web サイト訪問者の行動に関するより正確なデータを取得したい場合は、JavaScript タグを使用してデータを収集する必要があります。このデータ収集方法は、キャッシュ アクセスとプロキシ アクセスを正確に記録できるだけでなく、Cookie を通じて独立した訪問者の位置をより正確に特定することもできます。

もちろん、多面的なデータを取得するために、複数のデータ収集方法を同時に使用するウェブサイトもあります。たとえば、JavaScript タグは正確なデータを収集するために使用されますが、検索エンジンの最適化のために、Web ログ内の検索エンジン クローラー レコードも分析されます。パケット スニファーを使用してデータを収集し、キャッシュ アクセス用に JavaScript タグ付けを実行するものもあります。

採用するデータ収集方法によって、分析ツールの選択は大きく決まりますが、この側面だけでツールの選択方法を検討するだけでは十分ではありません。次のコンテンツでは、ツールを選択する前にツールプロバイダーからどのような技術的パラメータを理解する必要があるかを詳しく紹介し、合理的な判断を下せるようにします。

(著作権はDigital Forest Website Analysis Blogに帰属します。転載は歓迎しますが、出典を明記してください。)

オリジナルリンク: http://blog.digitalforest.cn/wangzhanfenxi-shujushouji


原題: ウェブサイト分析データ収集方法の詳細説明: ウェブログ JS タグとパケットスニファー

キーワード: ウェブサイト分析、データ収集方法、詳細な形式、ウェブ、ログ、タグ、パケットスニッフィング、レビュー、ウェブマスター、ウェブサイトのプロモーション、収益化

<<:  ウェブマスターと一緒に歩き、タオバオアフィリエイトコンテストがウェブマスターにもたらす機会を確認します

>>:  Webmaster.com の毎日のレポート: 独身の日に大手 e コマース企業 7 社が競い合う; Xiaomi が有料プランを開始

推薦する

6.28百度Kステーション事件から、サイトタイトルは自然に書くべきだと学んだ

最近、Baidu K Stationは私に大きな影響を与えました。昨日、2つの新しいドメイン名を登録...

Alibaba Cloud は安定性向上のため「カオスエンジニアリング」を導入。独自のクラウドは「ランダム破壊」後も正常に動作する

2018年の杭州雲奇カンファレンスで、アリババクラウドは素晴らしいショーを披露しました。観客によって...

クラウド ネイティブはどこにでもあります。デジタル変革で道に迷うことを避けるにはどうすればよいでしょうか?

現在、世界170か国以上が国家デジタル戦略を発表しています。あらゆる業界におけるデジタル変革の必要性...

ランキングを向上させる最善の方法は、ユーザーに真摯にアプローチすることです。

検索エンジンのコア アルゴリズムは、非常に複雑で理解するのが難しいと思われるため、すべての検索最適化...

CEOがライブ配信で商品を販売:名声のためではなく「寿命を延ばすため」

数百万人のCEOを対象にした大規模な実験が行われている。当初は後方に部隊を展開していたCEOたちは、...

エッジ コンピューティングはますます普及していますが、クラウド コンピューティングはどうでしょうか?

クラウド コンピューティングのトレンドはまだ初期段階ですが、エッジ コンピューティングはどこから来る...

Baidu最適化の8つの重要なポイントについて簡単に説明します

最近、Baiduの計算ルールは大きく変更され、多くのSEO担当者を不安にさせていると言えます。しかし...

ftpit-2 USD/512 MB RAM/10 GB SSD/2 TB トラフィック/シカゴ

FtpIt は 1 月に設立され、これまでほぼ 1 年が経過しました。ニューヨーク、シカゴ、ロサンゼ...

ICBC、クイック決済の閉鎖に反応:アリペイが協力すれば影響なし

新浪科技は3月25日夜、「中国工商銀行が段階的に即時決済サービスを停止する」との噂に対し、中国工商銀...

2020年第4四半期のクラウドインフラ支出は400億ドルに迫る

Canalys の新しいデータによると、クラウド インフラストラクチャへの支出は 2020 年第 4...

#ストレージ サーバー# host.ag-Bulgaria/E5-2430 v2/16g メモリ/4x2T ハード ディスク

ブルガリアで年に設立されたhost.agを紹介します。サーバーレンタル事業(オランダとブルガリアのデ...

GPU クラウド サーバーを AI インフラストラクチャに統合するにはどうすればよいでしょうか?

GPU クラウド サーバーは、グラフィック プロセッシング ユニットを利用して高性能タスクを処理する...

WeChat電子商取引で眠れないのは誰ですか? WeChatはタオバオストアをターゲットにしているのではなく、Tmallを模倣しようとしている

昨日(5月29日)午後、WeChatは公式サイトで新しいWeChatストア機能を発表しました。認証に...

実践経験のまとめ: フォーラムの宣伝方法

この昆山ウェブサイト最適化ブログでは、ウェブサイト最適化と SEO の基本知識についてすでにたくさん...

企業ウェブサイトの運営とプロモーションモデル:O2Oを選択することは後退となる可能性がある

インターネットで生き残りたいなら、インターネット思考が必要です。多くの企業ウェブサイトは、インターネ...