ウェブサイト分析におけるデータの統計的有意性検定

ウェブサイト分析におけるデータの統計的有意性検定

ウェブサイト分析では、ウェブサイト最適化テストを実行して、直帰率、注文購入率、ボタンクリック率など、さまざまなソリューションのコンバージョン率を比較することがよくあります。また、訪問者や顧客の詳細なデータパフォーマンスも記録されます。しかし、多くの場合、その差は非常に小さいため、現状を維持するか、新しい計画を完全に採用するかについて結論を出すのは困難です。したがって、両者の差が統計的に有意であるかどうかを判断することが重要になります。

この記事では主に、Excel で事前に記述された関数を使用してデータ有意性計算機を使用する方法と、SPSS を使用して詳細な顧客データに対して有意性テストを実行する方法という、2 つのデータ テスト方法について説明します。

1. Excelデータ重要度計算ツール

次のデータを想定する:

ソーシャルメディアソースの訪問、注文、注文購入率

YouTube250008903.56%

フェイスブック48002405%

次に、Avinash Kaushik が紹介した Excel データ有意性計算機を使用してテストします。詳細については、http://www.kaushik.net/avinash/excellent-analytics-tip1-statistical-significance/ を参照してください。

Excel ファイルはここからダウンロードできます: http://vdisk.weibo.com/s/cz9E6

データを入力して計算すると(テスト参加者数が分母、コンバージョン数が分子)、ボックスに「はい」と表示されるため、違いは顕著です。

上記の方法の原理は、2 つのデータ セット間の差がデータ信頼区間を超えると、データに有意な差が現れるというものです。

上記の方法は、2 つの比率を単純に比較するのに適しています。次に、より高度な内容、つまり 2 つのサンプルの平均を比較する SPSS の仮説検定の問題について説明しましょう。

2. 2つの独立したサンプルのT検定

SPSS で平均を比較する方法には次のものがあります。

仮説検定法のサンプル変数関係の例

平均(単一因子および二重因子)単一サンプル変数ウェブサイトアナリスト月額(給与、経験、勤務地)関係

1サンプルT検定 1サンプル変数自体 iPhone 本体の長さ

2つのサンプル変数、男性と女性の身長間の異なるプロモーションプログラムの効果に関する2つの独立したサンプルT検定

対応のあるサンプルのT検定 同じ母集団の異なる月の訪問者の購入行動 2サンプル変数

2 つの独立したサンプルの T 検定を紹介する前に、まずは最も単純なものから最も複雑なものまで、平均の比較について説明しましょう。

1. 平均値の検定

仮説検定の手順は、一般的に次の手順に分けられます。

1) 帰無仮説と対立仮説を決定する(帰無仮説とは、母集団の割合、平均、分布について何らかの仮定を立てることを意味する)

2) 検定統計量を選択する

3) 検定統計量の観測値の確率、P値を計算する

4) 有意水準 α が与えられた場合、P<α、つまり低確率イベントが発生する、つまり帰無仮説が発生する確率が非常に小さい場合は、帰無仮説は覆されます。P>α の場合は、帰無仮説が確立されます。

次の 2 つの状況を想定します。

1) 工場の品質管理者は、「製品の不良率はわずか 1/1000 です」と言います。そこで抜き取り検査を開始します。5 個中 2 個に不良品があることが判明し、問題が深刻であることがわかります。

1,000 個中、欠陥の最大数は 1 個ですが、現在は 2 個あるため、何かが起こる確率は極めて小さくなります。

欠陥の最大数に関する帰無仮説検定の結論

11/10002/5否定的

2) 工場の品質管理者は、「製品の不良率はわずか 1/100 です。抜き取り検査を開始したところ、5 個中 2 個に問題があることがわかりました。これは、問題がかなり深刻であることを意味します。」と言います。

1000 個のピース​​のうち、欠陥の最大数は 10 個です。現在、ピースは 2 個あり、検査するピースは 995 個あります。この場合、2 つの可能性があります。

*製品の不良率が1%を大幅に上回っており、品質管理者が誤解を招いています。

※万が一不良品を引いた場合、次の995個も不良品が出ることは稀です。

確率計算:

帰無仮説:つまり、製品の不良率が 1/100 であると仮定すると、5 つのサンプルのうち 2 つの不良品が見つかる確率は 0.088% です。

欠陥の最大数に関する帰無仮説検定の結論

101/1002/5 未定

5 個中 2 個をサンプリングした場合、その後の製品不良率が 1/100 未満になる確率は 0.088% です。5 個中 2 個をサンプリングした場合、その後の製品不良率が 1/100 を超える確率は 99.912% であり、つまり、元の仮説が発生する確率は <α です。α が 5% の場合、0.088%<5%、つまり、テストで低確率のイベントが発生し、当初は起こりそうにないことが起こると、元の仮説は覆されます。

注: データケースはLi Hongcheng先生のSPSSデータから取得されています。

2. 2つの独立したサンプルのT検定

2 つの独立したサンプルの T 検定は、2 つのサンプルの元となる母集団が互いに独立していることを意味し、その目的は、2 つの独立したサンプルの平均間に有意な統計的差異があるかどうかを分析することです。次のケースの背景は、さまざまな最適化ソリューションが訪問者の注文の価値にどのように影響するかです。

1. 前提条件:

2 つの独立したサンプルの T 検定を実行するには、次の条件を満たす必要があります。

1) 全体的な独立性

2) 人口は正規分布に従う

3) サンプルの分散は同じである

元データは以下のとおりです。

1. データ設定

1) 分析-記述統計-探索を選択

2) 訪問者の売上 (sales) を従属変数リストに入力し、さまざまなスキーム (テスト タイプ) を因子リストに入力します。

3) 「描画」をクリックし、ヒストグラムとテスト付き正規プロットをチェックします。

2. データレポート

下の図に示すように、2 つのソリューションごとに 200 個のサンプルがあります。

次の図から:

1) オプション0の平均販売額(1697)はオプション1の平均販売額(1570)より大きい

2) 両者の標準偏差はそれほど差がなく、標準偏差比 657/610 はほぼ 1 に等しくなります。

次の図は0スキームのヒストグラムです(正常かどうかを確認)

次の図はオプション1のヒストグラムです(正常かどうかを確認するため)

下の図から、0 スキームと 1 スキームの P 値 (sig) は両方とも 0.05 より大きいため、両方とも正常であることがわかります。

2. 2つの独立したサンプルに対するT検定の形式的分析

「分析」-「平均の比較」-「独立サンプルのT検定」をクリックします。

売上をテスト変数に、テストをグループ化変数に入力し、「グループの定義」をクリックして、それぞれ 0 と 1 を入力します。

2 つの独立したサンプル テストでは、等分散と不等分散の T テスト結果という 2 つの状況が想定されます。

分散方程式の Levene 検定の P 値は 0.94 で、0.1 より大きいため、2 つの独立したサンプルの分散が均質であることを示しており、等分散の仮定が選択されました。

分散が等しい場合、SIG(P値)は0.047となり、有意水準0.05を下回ります。これは、プラン1の消費量がプラン0の消費量と有意に異なり、プラン0がプラン1よりも統計的に有意であることを示しています。

注: 上記の SPSS データベースのデータは、Excel データをインポートすることによって生成されます。上記の Excel データは仮想的なものであり、rand() 関数によってランダムに生成できます。

以上がデータの統計的有意性の検証です。ビッグデータ時代の到来により、単純なウェブサイトのフロントエンドデータ分析は比較的簡単になり、顧客データや注文データの分析の需要が高まります。ツールの熟練度がすべてを整理するのに役立つことを願っています。

原文: 深センウェブサイト分析 http://www.szwebanalytics.com/data-analysis-excel-spss.html

原題: ウェブサイト分析におけるデータの統計的有意性検定

キーワード: ウェブサイト分析、分析、統計、学術的意義、重要性、検査、頻繁に行われる、ウェブマスター、ウェブサイトのプロモーション、収益化

<<:  分類とウェブサイトのキーワード品質管理がランキング獲得の鍵となる

>>:  IEに重大な脆弱性が見つかり、専門家は他のブラウザへの切り替えを促した。

推薦する

マイクロソフト: メタバースの無限の可能性を探り、デジタル技術で業界のアップグレードを強化

[51CTO.com からのオリジナル記事] 今最もホットな技術用語は何かと言えば、それは「メタバー...

日本のVPSおすすめ、(日本のクラウドホスト)おすすめ

日本 VPS (日本クラウドホスト): 日本は国際的な輸出帯域幅が大きく、ネットワークリソースが発達...

メガレイヤー香港サーバーはどうですか?香港の「国際帯域幅」を備えたサーバーを評価する

メガレイヤー香港サーバーはどうですか?メガレイヤーの国際帯域幅サーバーはどうですか? Megalay...

オンラインマーケティングにおけるよくある誤解についての2年間の経験

現在、インターネット上にはインターネットマーケティングに関する記事や研修が多すぎます。また、内容も多...

メモリ仮想化技術の具体的な2つの実装方法は何ですか?

メモリ仮想化技術の導入後、メモリ システムには 3 種類のアドレスが存在するようになりました。マシン...

中国のレンタカーウェブサイトのトラフィックシェアによるトップ10ランキング

ヒットワイズは3月4日、公式Weiboアカウントを通じて、中国レンタカーサイトのトラフィックシェア上...

訪問者を幸せにしましょう!ユーモラスなウェブデザインの例 20 選

「人生は孤独すぎる。一緒に暮らすのに面白い人を見つける必要がある。」 - 王暁波誰もがユーモラスなデ...

チケットを盗むソフトウェアに遭遇、12306 ウェブサイトは「ログインが遅い」状態が続く

モーニングポスト記者の沈良、張少潔、張静燕鉄道の春節旅行シーズンは昨日も引き続きチケット販売のピーク...

プロのSEO担当者の一日

夜も遅くなり、皆が寝静まった頃、私はコンピューターの前に一人座り、機械的にキーボードを叩き、クライア...

華俊:最年長ウェブマスターの過去と現在

彼は公務員でしたが、インターネット会社を設立しました。彼は49歳で、中国のインターネット上で最年長の...

Tudou.comは本日ナスダックから上場廃止、CEOの王偉氏が退任を発表

テンセントテクノロジーニュース(越谷小北)北京時間8月24日、海外メディアの報道によると、Youku...

SEO、SEM、WeChatパブリックアカウント運用を通じて正確なユーザーを獲得し、最大限のコンバージョンを達成する方法

SEOテクノロジーを使用して、予算ゼロで Web サイトの正確なトラフィックを 2 倍にするにはどう...

電子商取引における最も激しい2つの価格戦争のレビュー:サプライヤーとの対立が勃発

過去6か月間、私たちは電子商取引の価格戦争を経験してきました6 か月も経たないうちに、電子商取引企業...

ByteDanceはビッグVのLi Ziqiに数千万ドルを賭けている。その目的は何でしょうか?

Liziqiは幸運な人だと言う人が多すぎます。実際、李子奇の現在の状況は、最初から最も適切な道を選ん...

インターネットの未来はどうなるのか?「スーパーエンジン」がインターネットにインスピレーションを与える

ソン・ソンが描いた多くの人々、特にベテランネットユーザーは、1990年代初頭、中関村の街を歩いている...