ウェブサイト分析: Excel での高度なデータ分析 (パート 1)

ウェブサイト分析: Excel での高度なデータ分析 (パート 1)

Google Analytics、Adobe Sitecatalyst、Webtrends、Tencent Analysis、Baidu Statisticsなどのウェブサイト分析用の専門ツールに加えて、最もよく使用されるデータ処理ツールはExcelだと思います。Excelで最も基本的なことは、計算とグラフ作成です。もう少し高度なことは、関数とピボットテーブルの使用です。もちろん、VBAやマクロも思い浮かぶかもしれませんが、これらの高度な機能を使用する専門家はほとんどいないと推定されます。

では、高度なデータ分析、つまり専門的な統計分析方法や原則に関しては、SPSS や SAS などの専門的な分析ツールに頼らなければならないのでしょうか。低レベルから高レベルまでデータ分析のプロセスを引き継ぐことができるツールはあるのでしょうか。実は、そのようなツールは存在し、それが Excel のデータ分析機能です。最近最も人気のある 2 冊の Excel 本、「Who Says Newbies Can't Do Data Analysis」と「Let Excel Fly」では、この部分の内容は取り上げられていないようです。高度なデータ分析には、回帰分析、分散分析、T検定などの手法があります。これらの内容は、日常業務とは関係ないと思ってはいけません。実は、より上のレベルに進むと、MBAのコースにもこれらの内容が含まれます。そのため、遅かれ早かれ学ばなければならない内容なので、事前に学んでおくといいでしょう。以下の内容を確認してください。

使用する前に、まずExcelのデータ分析機能をインストールする必要があります。デフォルトでは、Excelにはこの拡張機能はインストールされていません。インストールは次のとおりです。

1) Office ボタンの上にマウスを移動し、[Excel のオプション] をクリックします。

2) [アドイン] を見つけて、管理セクションで [Excel アドイン] を選択し、[移動] をクリックします。

3) [分析ツールパック]を選択し、[OK]をクリックします。

4) インストール後、以下のように[データ]セクションに[データ分析]機能が表示されます。

インストールしたら、まずは回帰分析の内容について学んでみましょう。

1. 回帰分析

回帰分析を詳細に行う前に、まず回帰とは何かを理解する必要があります。実際、回帰現象は、英国の生物統計学者であるガルトンが親と子の遺伝的特徴を研究していたときに初めて発見されました。これは興味深い現象です。身長の遺伝的特徴は、「背の高い親の子供は平均よりも背が高いが、必ずしも親よりも背が高いわけではない。ある時点を超えると、平均身長に向かって「回帰」する」ことを示しています。 この効果は「中心への回帰」と呼ばれます。今日の回帰分析は、主に、ゴルトンの研究から導き出されたものなど、変数間の定量的な関係モデルを確立するための一連の方法と手順を指します。 ここで、独立変数は親の身長であり、従属変数は子の身長です。

Baidu 百科事典では、回帰分析を次のように定義しています。「回帰分析は、2 つ以上の変数間の相互依存的な定量的関係を決定する統計分析手法です。」広く使用されているもの:

1) 回帰分析は、関与する独立変数の数に応じて単変量回帰分析と多変量回帰分析に分けられます。

2) 独立変数と従属変数の関係の種類に応じて、線形回帰分析と非線形回帰分析に分けられます。

電子商取引の例を挙げます。電子商取引のコンバージョン率は一定で、ウェブサイトの訪問数は一般的に売上高に比例します。ここで、アクティビティ中の売上高を予測するには、以下に示すように、さまざまな訪問数での売上高に対応する標準曲線を確立する必要があります。

1. まず、散布図を使用してグラフを描きます。

2. トレンドラインを追加し、回帰分析式とR二乗値を表示します。

グラフから、R 2 乗値 = 0.9995 であり、傾向線が直線に収束していることがわかります。式は次のとおりです: y = 0.01028x-27.424

R 二乗値は 0 から 1 の間の数値です。トレンド ラインは、R 二乗値が 1 または 1 に近い場合に最も信頼性が高くなります。 R2 >0.99 であるため、これは非常に明らかな線形特性を持つ値であり、フィッティング ラインが実際のデータを 99.99% 以上説明およびカバーでき、一般性が良好で、優れた予測の役割を果たすことができることを意味します。

3. Excelのデータ分析機能を活用する

1) [データ分析]をクリックし、ポップアップ選択ボックスで[回帰]を選択して[OK]をクリックします。

2) [X値入力エリア]で訪問回数のセルを選択し、[Y値入力エリア]で売上金額のセルを選択し、残差、標準残差、残差プロット、線形近似プロット、正規確率プロットなど、以下に示すオプションをチェックします。

3) 残差と標準化残差は以下のとおりです。

4) 残差プロットは次のようになります。

残差グラフは、実際の値と予測値のギャップをグラフ化したものです。残差グラフの散布点が中心軸の両側に分布している場合、近似直線は妥当であり、予測が時々より多く、時々より少なくなることを示しており、これは概ね傾向と一致しています。ただし、すべてが上側または下側にある場合は機能しません。これは偏りがあるため、再処理する必要があります。

5) 以下は線形近似グラフである

線形フィッティング グラフでは、実際のデータ ポイントに加えて、フィッティングされた予測データ ポイントもあることがわかります。これらのパラメーターも上記の表に示されています。

6) 以下は正規確率プロットである

正規確率プロットは、通常、データ セットが正規分布に従うかどうかを確認するために使用されます。これは、実際の値と正規分布データ間の機能関係の散布図です。この値のセットが正規分布に従う場合、正規確率プロットは直線になります。回帰分析は必ずしも正規分布に従う必要はなく、ここでは単に正規分布に従っているだけです。

上記のデータ テーブルとグラフは、y=0.01028x-27.424 という式が信頼性の高い予測曲線であることを示しています。イベント中のトラフィックが 500,000 回であると仮定すると、次の図に示すように、予測される売上は 51,373 になります。

再版する価値があると思われる場合は、その旨を明記してください。

<<:  Baidu の「ビッグアップデート」により、ユーザーエクスペリエンスが再び向上。Baidu 関連情報は 2 ページ目の上部に表示されます

>>:  WordPress: インターネットの母国語になる

推薦する

Douyuの成長戦略!

論文を提出する時間です。 2019年3月16日、 Douyuは2019年第4四半期および通年の監査対...

hostmada-3.4 USD/シンガポール/512 MB RAM/50 GB HDD/500 GB フロー

Hostmada は実はつい最近設立されました。 担当者自身も、cpanel パネルを備えた仮想ホス...

Harbor v2.9.0 のバージョン変更とオフライン展開

バージョンの変更1.1 更新内容セキュリティ センターの管理者ユーザーは、スキャン済みおよび未スキャ...

なぜウェブサイトは常にハッキングされるのでしょうか?

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス1: ブラックハット最適...

共同購入ウェブサイトは変化を求めている:マーケティングを放棄し、モバイル端末の市場シェアを獲得するための技術に注力

Manzuo.com の黒字化のニュースが出たちょうどその頃、24quan が無期限に営業を停止した...

反著作権侵害同盟は、百度が海賊版動画を部分的に削除したと発表

新浪科技報、11月18日朝のニュースによると、中国オンラインビデオ著作権侵害防止連盟は本日、そのテス...

知湖の進歩への道

最近、知乎は上場以来初の四半期報告書を発表した。公開データによると、最新の月間アクティブユーザー数は...

ハンハン氏による百度ライブラリに対する訴訟は、SEOにとって祝福か呪いか?

みなさんこんにちは。私はみなさんの古い友人、魏東東です。実際、業界が現在最も懸念しているのは、ハンハ...

PIAYUN:国慶節特別オファー、香港\米国クラウドサーバー、CN2回線、月額20元から、時間は2倍

今年の国慶節に向けて、Piayunは香港クラウドサーバーと米国クラウドサーバーの限定版をリリースしま...

2019年テンセントグローバルデジタルエコシステムカンファレンスが雲南省で開催され、エコシステムのアップグレードとデジタル時代の創造を目指す

5月21日、2019年テンセントグローバルデジタルエコシステムカンファレンスが昆明の滇池国際会議展示...

企業がハイブリッドクラウドの神話を払拭する方法

より汎用性の高いデータ ストレージと IT サービスの需要が高まり続ける中、パブリック クラウド プ...

「もしタオバオが鉄道の切符を販売できるようになったらどうなるだろう?」少なくとも予約で圧倒されることはないだろう。

電子商取引企業は概して「ダブルイレブン」オンラインショッピング戦争を生き延びた■ 春節の旅行ラッシュ...

クラウド サーバーのアプリケーションの利点を分析します。利点が何であるかをご存知ですか?

クラウドコンピューティングやモノのインターネットなどの新興技術の活発な発展に伴い、ますます多くの企業...

「映画とテレビ+ソーシャル」、網易クラウドが「微光」の新たな道を切り開く

2018年はソーシャル分野に資金が流入し、ソーシャルブームが起こりました。 2019年に入り、ソーシ...

Google検索ランキングのポイント

今日は、SEOにおけるGoogleランキングの重要なポイントについてお話ししましょう。ウェブサイトの...