Google AnalyticsとBaidu Statisticsの原理の分析

Google AnalyticsとBaidu Statisticsの原理の分析

Google AnalyticsとBaidu Statisticsの統計データには違いがあり、その差は非常に大きいです。根本的な理由は、データ統計の原理とメカニズムが異なるためです。以下は、Google Analytics と Baidu Statistics の主な分析です。

百度統計の動作原理の分析

Baidu Statistics が提供する JS は、実際にはページにコード hm.baidu.com/h.js を導入します。コードの内容は、それに続くパラメータによって異なります。h.js? に続くパラメータは、Baidu Statistics での ID です。

h.js コードを取得すると、Baidu Statistics は「HMACCOUNT」という名前の Cookie をブラウザに書き込みます。この Cookie の有効期限は 2038 年なので、ブラウザの Cookie をクリアしない限り、基本的に期限切れになることはありません。

h.js がダウンロードされると、そのスクリプトが実行され、画面サイズ、色深度、フラッシュ バージョン、ユーザー言語など、ブラウザー関連の情報やアクセス ソースが取得されます。

js コードから、すべてのパラメータに「cc、cf、ci、ck、cl、cm、cp、cw、ds、ep、et、fl、ja、ln、lo、lt、nv、rnd、sb、se、si、st、su、sw、sse、v」が含まれていることがわかります。これらのパラメータの意味は次のとおりです。

cc: わからない、通常は1

cf: URLパラメータhmsrの値

ci: URLパラメータhmciの値

ck: クッキーをサポートするかどうか 1:0

cl: 色深度(「32 ビット」など)

cm: URLパラメータhmmdの値

cp: URLパラメータhmplの値

cw: URLパラメータhmkwの値

ds: 画面サイズ(例: '1024×768')

ep: 初期値は '0' で、ページの滞在時間を反映する時間変数です。形式は、おおよそ次のようになります: 現在の時間 - 読み込み時間 + "," + 別の非常に小さな時間値

et: 初期値は '0' です。ep 時間変数が 0 でない場合は、別の値になります。

fl: フラッシュバージョン

ja:javaは1:0をサポートします

ln: 言語 zh-cn

lo: 不明、通常は 0

lt: 最初のリクエストには含まれない日付time.time()(「1327847756」など)

nv: 不明、通常は 1 または 0

rnd: ランダムな10桁の数字

sb: 360seブラウザの場合、値は「17」になります

se: 検索エンジンに関連する

si: 統計コードID

st:

su: 前のページ document.referrer

sw: わかりません。おそらく検索エンジンに関連しているのでしょう。通常は空です。

sse: わかりません。おそらく検索エンジンに関連しているのでしょう。通常は空です。

v: 統計コードのバージョン。現在の値は「1.0.17」です。

これらすべてのパラメータが設定されている場合(一部のパラメータには値が割り当てられていません)、値が割り当てられているパラメータをフィルタリングし、それらを hm.baidu.com/hm.gif のパラメータとして使用して、次のような URL を組み立てます:http://upload.chinaz.com//?cc=1&ck=1&cl=32-bit& ds=1366×768&ep=0&et=0&fl=11.0&ja=1&ln=zh-cn。次に画像をリクエストします。

Baidu 統計サーバーはこのリクエストを受信し、画像の URL に添付されたパラメータから関連情報を取得して、訪問者のアクセス履歴を記録します。ユーザーがページを閉じると、hm.gif のリクエストもトリガーされますが、このプロセスはすべてのブラウザおよびすべての閉じるアクションでサポートされているわけではありません。

Wireshark (ネットワーク パケット キャプチャ ツール) を使用してテストすると、ブラウザーがサーバーに合計 4 つのリクエストを送信していることがわかります。

js スクリプトをリクエストします。

読み込みが完了すると、リクエストが行われ、パラメータが渡されます

ページを終了する際にリクエストが行われ、パラメータが渡されます。上記と比較すると、epパラメータが変更されていることがわかります。

Baidu Statistics は Cookie に基づいています。js スクリプトが要求されると、永続的な Cookie がコンピューターに保存され、ユーザー ID として機能します。同時に、終了時にパラメータ ep が初期の 0 から「7289%2C115」に変化し、終了後は「7289, 115」になることがわかりました。これらは 2 つのミリ秒単位、つまり 7.2 秒と 0.1 秒です。同時に、lt パラメータ (time、javascript: (new Date).getTime()) は、hm.gif の最初の 2 つのリクエストでは変更されません。 rnd 乱数は毎回変わります。

Google アナリティクスの仕組み

ユーザーが Google アナリティクスの統計コードを含むページにアクセスすると、このコードはユーザーのブラウザによって実行されます。このコードの目的は、閲覧したページの URL、ブラウザの種類、オペレーティング システム、システム言語、画面解像度など、訪問者に関する情報を収集することです。

GA 統計コードは、この訪問者情報を Cookie に保存します。Cookie は、ローカルに保存され、訪問した Web サイトに関連付けられた短いテキストです。Cookie は、ユーザーが初めて訪問したのか、複数回訪問したのか、ページの参照元、その後のページ閲覧情報などを判断するために使用されます。

最後に、収集されたすべての情報は Google Analytics データ サーバーに送信されます。このプロセスは非常に巧妙です。サーバー ログ ファイルにすべてのファイル リクエスト情報が記録されることはわかっています。Google Analytics がデータを収集する方法は、サーバーから透明な 1×1 GIF 画像ファイルをリクエストすることです。このファイル リクエストとリクエスト時間はサーバー ログに記録され、ファイル リクエスト情報には、GA 統計コードによって収集されたデータと Cookie 情報が含まれます。このように、この GIF 画像がリクエスト アプリケーションを受け取るたびに、訪問者のアクセス情報が Google Analytics データ サーバーによって収集されます。

ただし、Google アナリティクスは 1 つの gif リクエストのみを送信しますが、複数の gif リクエストが送信されることもよくあります。 gif 画像をカウントできない場合、GA は他の gif リクエストを送信します。

要約:

ウェブ分析の第一人者である Avinash 氏は、データの精度が 90% であれば、タイムリーにアクションを起こすことができる、とかつて言っていました。重要なのは、傾向を把握し、行動を起こし、時間をかけてテストと最適化を行えることです。

<<:  nofollow タグはウェブマスターの外部リンクにどれくらいの時間を浪費するのでしょうか?

>>:  ウェブサイトの外部リンク構築を最適化し、フォーラムリソースを活用するための 5 つの戦略

推薦する

2013 トピック: SEO を通じてウェブサイトのランキングを向上させる方法

今日は、SEO 最適化を通じてウェブサイトのインクルージョンとランキングを向上させる方法についてお話...

クラウド移行戦略のベストプラクティスを実装する方法

クラウド コンピューティング テクノロジーは、組織にオンデマンドのテクノロジー リソースを提供するこ...

外部リンクの効果を高めるにはどうすればいいでしょうか?

外部リンクはオフサイト最適化効果を実現するための主な方法の1つと言えます。さらに、関連する外部リンク...

dotblock-サンノゼ(サンノゼ)コンピュータルームKVM仮想VPS評価

dotblock.com は HostRocket.com (1999 年設立、仮想ホスティング、リ...

ウェブサイトのコンテンツ内のアンカーテキスト内部リンクの目的は何ですか?

SEO 担当者なら誰でも、競合他社のサイトを頻繁に注目していると思います。それらのサイトでは、ほぼす...

servercheap-$4.5/kvm/2g メモリ/25g SSD/2T トラフィック/コアサイト コンピュータ ルーム

servercheap.net は、新しい KVM 仮想 VPS で、coresite のシカゴ デ...

cyberlinkhk: 香港独立サーバー(サイトクラスター付き)、CN2 GIA ネットワーク、368 元/月、e3-1230/8g メモリ/240gSSD/10M 帯域幅

Cyber​​linkhk(香港サイバーリンクネットワーク)は現在、香港の通常の独立サーバー、香港の...

フォレスター、ガートナー、IDCが2022年の最もホットな4つのトレンドを予測

3 大調査コンサルティング組織である Forrester、Gartner、IDC は、毎年末にトレン...

高品質な外部リンクを構築する方法についての簡単な説明

みなさんこんにちは。私はハルビンバーチャルアンドリアルウェブサイトデザインです。今日は、高品質の外部...

SEOを行う際の初心者の心構えについて

初心者が SEO を学ぶ場合、初期段階では必ず何らかの問題が発生します。ここでは初心者として、初心者...

マルチクラウド アーキテクチャを正しく選択するにはどうすればよいでしょうか? 3つの要素が不可欠

クラウドコスト管理会社 Yotascale の創設者兼 CEO である Asim Razzaq 氏は...

インターネットの巨人と草の根の関係

インターネットの巨人と草の根の個人ウェブマスターは、インターネットの両極であると言えます。一方には背...

インターネット マーケティングの 6 つのマーケティング武器

オンラインマーケティングの実施方法、オンラインマーケティングの実施方法、この記事では、一般的に使用さ...