Google AnalyticsとBaidu Statisticsの原理の分析

Google AnalyticsとBaidu Statisticsの原理の分析

Google AnalyticsとBaidu Statisticsの統計データには違いがあり、その差は非常に大きいです。根本的な理由は、データ統計の原理とメカニズムが異なるためです。以下は、Google Analytics と Baidu Statistics の主な分析です。

百度統計の動作原理の分析

Baidu Statistics が提供する JS は、実際にはページにコード hm.baidu.com/h.js を導入します。コードの内容は、それに続くパラメータによって異なります。h.js? に続くパラメータは、Baidu Statistics での ID です。

h.js コードを取得すると、Baidu Statistics は「HMACCOUNT」という名前の Cookie をブラウザに書き込みます。この Cookie の有効期限は 2038 年なので、ブラウザの Cookie をクリアしない限り、基本的に期限切れになることはありません。

h.js がダウンロードされると、そのスクリプトが実行され、画面サイズ、色深度、フラッシュ バージョン、ユーザー言語など、ブラウザー関連の情報やアクセス ソースが取得されます。

js コードから、すべてのパラメータに「cc、cf、ci、ck、cl、cm、cp、cw、ds、ep、et、fl、ja、ln、lo、lt、nv、rnd、sb、se、si、st、su、sw、sse、v」が含まれていることがわかります。これらのパラメータの意味は次のとおりです。

cc: わからない、通常は1

cf: URLパラメータhmsrの値

ci: URLパラメータhmciの値

ck: クッキーをサポートするかどうか 1:0

cl: 色深度(「32 ビット」など)

cm: URLパラメータhmmdの値

cp: URLパラメータhmplの値

cw: URLパラメータhmkwの値

ds: 画面サイズ(例: '1024×768')

ep: 初期値は '0' で、ページの滞在時間を反映する時間変数です。形式は、おおよそ次のようになります: 現在の時間 - 読み込み時間 + "," + 別の非常に小さな時間値

et: 初期値は '0' です。ep 時間変数が 0 でない場合は、別の値になります。

fl: フラッシュバージョン

ja:javaは1:0をサポートします

ln: 言語 zh-cn

lo: 不明、通常は 0

lt: 最初のリクエストには含まれない日付time.time()(「1327847756」など)

nv: 不明、通常は 1 または 0

rnd: ランダムな10桁の数字

sb: 360seブラウザの場合、値は「17」になります

se: 検索エンジンに関連する

si: 統計コードID

st:

su: 前のページ document.referrer

sw: わかりません。おそらく検索エンジンに関連しているのでしょう。通常は空です。

sse: わかりません。おそらく検索エンジンに関連しているのでしょう。通常は空です。

v: 統計コードのバージョン。現在の値は「1.0.17」です。

これらすべてのパラメータが設定されている場合(一部のパラメータには値が割り当てられていません)、値が割り当てられているパラメータをフィルタリングし、それらを hm.baidu.com/hm.gif のパラメータとして使用して、次のような URL を組み立てます:http://upload.chinaz.com//?cc=1&ck=1&cl=32-bit& ds=1366×768&ep=0&et=0&fl=11.0&ja=1&ln=zh-cn。次に画像をリクエストします。

Baidu 統計サーバーはこのリクエストを受信し、画像の URL に添付されたパラメータから関連情報を取得して、訪問者のアクセス履歴を記録します。ユーザーがページを閉じると、hm.gif のリクエストもトリガーされますが、このプロセスはすべてのブラウザおよびすべての閉じるアクションでサポートされているわけではありません。

Wireshark (ネットワーク パケット キャプチャ ツール) を使用してテストすると、ブラウザーがサーバーに合計 4 つのリクエストを送信していることがわかります。

js スクリプトをリクエストします。

読み込みが完了すると、リクエストが行われ、パラメータが渡されます

ページを終了する際にリクエストが行われ、パラメータが渡されます。上記と比較すると、epパラメータが変更されていることがわかります。

Baidu Statistics は Cookie に基づいています。js スクリプトが要求されると、永続的な Cookie がコンピューターに保存され、ユーザー ID として機能します。同時に、終了時にパラメータ ep が初期の 0 から「7289%2C115」に変化し、終了後は「7289, 115」になることがわかりました。これらは 2 つのミリ秒単位、つまり 7.2 秒と 0.1 秒です。同時に、lt パラメータ (time、javascript: (new Date).getTime()) は、hm.gif の最初の 2 つのリクエストでは変更されません。 rnd 乱数は毎回変わります。

Google アナリティクスの仕組み

ユーザーが Google アナリティクスの統計コードを含むページにアクセスすると、このコードはユーザーのブラウザによって実行されます。このコードの目的は、閲覧したページの URL、ブラウザの種類、オペレーティング システム、システム言語、画面解像度など、訪問者に関する情報を収集することです。

GA 統計コードは、この訪問者情報を Cookie に保存します。Cookie は、ローカルに保存され、訪問した Web サイトに関連付けられた短いテキストです。Cookie は、ユーザーが初めて訪問したのか、複数回訪問したのか、ページの参照元、その後のページ閲覧情報などを判断するために使用されます。

最後に、収集されたすべての情報は Google Analytics データ サーバーに送信されます。このプロセスは非常に巧妙です。サーバー ログ ファイルにすべてのファイル リクエスト情報が記録されることはわかっています。Google Analytics がデータを収集する方法は、サーバーから透明な 1×1 GIF 画像ファイルをリクエストすることです。このファイル リクエストとリクエスト時間はサーバー ログに記録され、ファイル リクエスト情報には、GA 統計コードによって収集されたデータと Cookie 情報が含まれます。このように、この GIF 画像がリクエスト アプリケーションを受け取るたびに、訪問者のアクセス情報が Google Analytics データ サーバーによって収集されます。

ただし、Google アナリティクスは 1 つの gif リクエストのみを送信しますが、複数の gif リクエストが送信されることもよくあります。 gif 画像をカウントできない場合、GA は他の gif リクエストを送信します。

要約:

ウェブ分析の第一人者である Avinash 氏は、データの精度が 90% であれば、タイムリーにアクションを起こすことができる、とかつて言っていました。重要なのは、傾向を把握し、行動を起こし、時間をかけてテストと最適化を行えることです。

<<:  nofollow タグはウェブマスターの外部リンクにどれくらいの時間を浪費するのでしょうか?

>>:  ウェブサイトの外部リンク構築を最適化し、フォーラムリソースを活用するための 5 つの戦略

推薦する

純粋なコンテンツプラットフォームは衰退し、自社制作コンテンツが増加している

まず、最近の事実をいくつか紹介します。 1. Youku は 2013 年第 4 四半期も依然として...

COPE この SEO テクニックとは何ですか?

数日前、海外の SEO ブログで新しい技術を紹介する記事を見ました。そこには「Create Once...

Docker Compose ファイルを構築するにはどうすればいいですか?

[51CTO.com クイック翻訳] Docker Compose は、マルチコンテナ Docker...

Yunzhi.com で構築された新しい Web サイトは、Baidu のトップページに 2 か月間掲載されています。

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています新しいウェ...

Beisen PaaSプラットフォームは、企業がカスタマイズされたHRアプリケーションを迅速に構築できるようにします。

[51CTO.comよりオリジナル記事] 最近、「テクノロジーが才能を実現する」をテーマにしたiTa...

蘇寧の「コンセプト」電子商取引は本当に明るい未来をもたらすのだろうか?

中国電子商取引業界の異端児であるSuning.comについて言えば、多くの友人はそれを「裕福」、「勇...

Google+のコンテンツがGoogle検索に表示され始める

Google の検索結果は常にパーソナライズされています。Google アカウントにログインしていな...

kingservers: 米国 VPS (ロサンゼルス)/ロシア/オランダ、月額 4.6 ドルから、2G メモリ/2 コア/60GNVMe/無制限トラフィック

kingserversは2006年に設立されたロシアのサーバープロバイダーで、主にVPSと独立サーバ...

エッジコンピューティング: これがクラウドの終焉か?

エッジコンピューティングは現在重要です。このエキサイティングなコンセプトはすでに現実のものであり、モ...

董静怡氏:SEOは重要だが、中国では専門職にはなり得ない

SEOに携わっている私の友人の多くが、最近Baiduからの攻撃を経験したと思います。その中には、Ba...

感謝祭/ブラックフライデー/サイバーマンデースペシャル

親愛なるみんな、ホスティング業界で一年で最も待ち望まれている日がやってきました。海外のホスティングベ...

重慶市、国内最大のハッカー集団を逮捕。月収10万元、数百万台のコンピューターを汚染

彼は月収10万元で数千万台のコンピューターを感染させ、ギャングが600万元以上の不法利益を上げるのを...

ブランドプロモーションとマーケティング丨ユーザーにブランドを覚えてもらうにはどうすればよいでしょうか?

次の 2 つのことを覚えておいてください。ファン・シャオチンはジャック・マーに似ているため、辺鄙な地...

Google の BERT アルゴリズム アップデートの完全な説明

Googleは2019年10月25日、クエリ(ユーザーの検索語句)の意味をより人間らしく理解し、検索...

新しいウェブサイトのターゲットキーワードのポジショニングで勝つ方法

ターゲット キーワードの配置とは、Web サイトのホームページのキーワードを配置することを意味します...