Google AnalyticsとBaidu Statisticsの原理の分析

Google AnalyticsとBaidu Statisticsの原理の分析

Google AnalyticsとBaidu Statisticsの統計データには違いがあり、その差は非常に大きいです。根本的な理由は、データ統計の原理とメカニズムが異なるためです。以下は、Google Analytics と Baidu Statistics の主な分析です。

百度統計の動作原理の分析

Baidu Statistics が提供する JS は、実際にはページにコード hm.baidu.com/h.js を導入します。コードの内容は、それに続くパラメータによって異なります。h.js? に続くパラメータは、Baidu Statistics での ID です。

h.js コードを取得すると、Baidu Statistics は「HMACCOUNT」という名前の Cookie をブラウザに書き込みます。この Cookie の有効期限は 2038 年なので、ブラウザの Cookie をクリアしない限り、基本的に期限切れになることはありません。

h.js がダウンロードされると、そのスクリプトが実行され、画面サイズ、色深度、フラッシュ バージョン、ユーザー言語など、ブラウザー関連の情報やアクセス ソースが取得されます。

js コードから、すべてのパラメータに「cc、cf、ci、ck、cl、cm、cp、cw、ds、ep、et、fl、ja、ln、lo、lt、nv、rnd、sb、se、si、st、su、sw、sse、v」が含まれていることがわかります。これらのパラメータの意味は次のとおりです。

cc: わからない、通常は1

cf: URLパラメータhmsrの値

ci: URLパラメータhmciの値

ck: クッキーをサポートするかどうか 1:0

cl: 色深度(「32 ビット」など)

cm: URLパラメータhmmdの値

cp: URLパラメータhmplの値

cw: URLパラメータhmkwの値

ds: 画面サイズ(例: '1024×768')

ep: 初期値は '0' で、ページの滞在時間を反映する時間変数です。形式は、おおよそ次のようになります: 現在の時間 - 読み込み時間 + "," + 別の非常に小さな時間値

et: 初期値は '0' です。ep 時間変数が 0 でない場合は、別の値になります。

fl: フラッシュバージョン

ja:javaは1:0をサポートします

ln: 言語 zh-cn

lo: 不明、通常は 0

lt: 最初のリクエストには含まれない日付time.time()(「1327847756」など)

nv: 不明、通常は 1 または 0

rnd: ランダムな10桁の数字

sb: 360seブラウザの場合、値は「17」になります

se: 検索エンジンに関連する

si: 統計コードID

st:

su: 前のページ document.referrer

sw: わかりません。おそらく検索エンジンに関連しているのでしょう。通常は空です。

sse: わかりません。おそらく検索エンジンに関連しているのでしょう。通常は空です。

v: 統計コードのバージョン。現在の値は「1.0.17」です。

これらすべてのパラメータが設定されている場合(一部のパラメータには値が割り当てられていません)、値が割り当てられているパラメータをフィルタリングし、それらを hm.baidu.com/hm.gif のパラメータとして使用して、次のような URL を組み立てます:http://upload.chinaz.com//?cc=1&ck=1&cl=32-bit& ds=1366×768&ep=0&et=0&fl=11.0&ja=1&ln=zh-cn。次に画像をリクエストします。

Baidu 統計サーバーはこのリクエストを受信し、画像の URL に添付されたパラメータから関連情報を取得して、訪問者のアクセス履歴を記録します。ユーザーがページを閉じると、hm.gif のリクエストもトリガーされますが、このプロセスはすべてのブラウザおよびすべての閉じるアクションでサポートされているわけではありません。

Wireshark (ネットワーク パケット キャプチャ ツール) を使用してテストすると、ブラウザーがサーバーに合計 4 つのリクエストを送信していることがわかります。

js スクリプトをリクエストします。

読み込みが完了すると、リクエストが行われ、パラメータが渡されます

ページを終了する際にリクエストが行われ、パラメータが渡されます。上記と比較すると、epパラメータが変更されていることがわかります。

Baidu Statistics は Cookie に基づいています。js スクリプトが要求されると、永続的な Cookie がコンピューターに保存され、ユーザー ID として機能します。同時に、終了時にパラメータ ep が初期の 0 から「7289%2C115」に変化し、終了後は「7289, 115」になることがわかりました。これらは 2 つのミリ秒単位、つまり 7.2 秒と 0.1 秒です。同時に、lt パラメータ (time、javascript: (new Date).getTime()) は、hm.gif の最初の 2 つのリクエストでは変更されません。 rnd 乱数は毎回変わります。

Google アナリティクスの仕組み

ユーザーが Google アナリティクスの統計コードを含むページにアクセスすると、このコードはユーザーのブラウザによって実行されます。このコードの目的は、閲覧したページの URL、ブラウザの種類、オペレーティング システム、システム言語、画面解像度など、訪問者に関する情報を収集することです。

GA 統計コードは、この訪問者情報を Cookie に保存します。Cookie は、ローカルに保存され、訪問した Web サイトに関連付けられた短いテキストです。Cookie は、ユーザーが初めて訪問したのか、複数回訪問したのか、ページの参照元、その後のページ閲覧情報などを判断するために使用されます。

最後に、収集されたすべての情報は Google Analytics データ サーバーに送信されます。このプロセスは非常に巧妙です。サーバー ログ ファイルにすべてのファイル リクエスト情報が記録されることはわかっています。Google Analytics がデータを収集する方法は、サーバーから透明な 1×1 GIF 画像ファイルをリクエストすることです。このファイル リクエストとリクエスト時間はサーバー ログに記録され、ファイル リクエスト情報には、GA 統計コードによって収集されたデータと Cookie 情報が含まれます。このように、この GIF 画像がリクエスト アプリケーションを受け取るたびに、訪問者のアクセス情報が Google Analytics データ サーバーによって収集されます。

ただし、Google アナリティクスは 1 つの gif リクエストのみを送信しますが、複数の gif リクエストが送信されることもよくあります。 gif 画像をカウントできない場合、GA は他の gif リクエストを送信します。

要約:

ウェブ分析の第一人者である Avinash 氏は、データの精度が 90% であれば、タイムリーにアクションを起こすことができる、とかつて言っていました。重要なのは、傾向を把握し、行動を起こし、時間をかけてテストと最適化を行えることです。

<<:  nofollow タグはウェブマスターの外部リンクにどれくらいの時間を浪費するのでしょうか?

>>:  ウェブサイトの外部リンク構築を最適化し、フォーラムリソースを活用するための 5 つの戦略

推薦する

#Dry Goods# spryservers: Phoenix\Dallas の VPS および専用サーバーは、購入すると無料で入手できます。

現在から 11 月 27 日まで、Spryservers は特別プロモーションを実施しています。ドメ...

2022年のクラウドコンピューティング業界の5つの主要な発展トレンド

過去18か月間、COVID-19パンデミックの発生は世界の経済と社会に大きな変化をもたらし、クラウド...

Pinduoduoがハイラインを制覇?

沈没市場に関して言えば、Pinduoduo は間違いなくこの用語の代表です。長い間「沈没」を続けてき...

Kubernetes リソースの管理: 留意すべき 5 つのポイント

[[340175]]この記事はWeChat公式アカウント「Xintai Cloud Service」...

2019年に注目すべきクラウド移行の機会

クラウド コンピューティングの開発は現在、新たな段階に達しており、多くの企業がコア エンタープライズ...

B2C電子商取引はどこへ向かうのか:将来的にはC2Bモデルへと移行する

著者: 江 啓平B2C電子商取引分野では、領土をめぐる競争が激化しており、天猫、JD.com、蘇寧が...

DevOps チームが Kubernetes のパフォーマンスを向上させる方法

著者 |サミュエル・アデバヨ徐潔成編纂現在でも、Kubernetes は開発者にとって最も需要のある...

10.1サイトの変更から医療ウェブサイトの最適化の経験のまとめ

中秋節と国慶節の連休のため、筆者は家に帰り、作業中の新しいウェブサイトを一時的に脇に置きました。4日...

タオバオ、JD.com、Dangdangは食用塩を緊急に棚から撤去、独占的利益によるものと疑われる

食用塩のオンライン販売が禁止される! 記者は情報筋から、タオバオが最近、すべてのオンラインストアに今...

SEOには粘り強さが必要であり、SEOにはより細心の注意が必要である

SEO 業界には、ある信念が広まっています。この信念は、テクノロジーでもルールでもなく、粘り強さです...

Kubescape で Kubernetes を保護する方法

Kubernetes は強力ですが、複雑でもあります。クラスターを攻撃に対して脆弱な状態にしておくこ...

VDI デスクトップ仮想化の 4 つのプロトコル - 仮想化の悪魔の四分円

世界的に、デスクトップ仮想化市場の主なプレーヤーは、Citrix (市場シェア 46%)、VMwar...

tmhhostはどうですか? US AS9929+デュアルISP住宅IPシリーズVPSレビュー

tmhhostはどうですか? tmhhost トリプルネットワーク as9929 シリーズはいかがで...

派手な仮面を脱ぎ捨て、ウェブサイトの信頼性と人気の秘密を明らかにします

Baidu Kステーション事件は終わってからかなり経っているが、多くのウェブマスターは事件のことを考...

Travel Frog、Jump Jump、これらのゲームがなぜこんなに人気があるのでしょうか?

近頃、日本のゲーム「旅蛙」が中国人の社交界を席巻している。本を読み、食べ、眠り、旅をするカエルの話で...