Google Analytics、Adobe Sitecatalyst、Webtrends、Tencent Analysis、Baidu Statisticsなどのウェブサイト分析用の専門ツールに加えて、最もよく使用されるデータ処理ツールはExcelだと思います。Excelで最も基本的なことは、計算とグラフ作成です。もう少し高度なことは、関数とピボットテーブルの使用です。もちろん、VBAやマクロも思い浮かぶかもしれませんが、これらの高度な機能を使用する専門家はほとんどいないと推定されます。 では、高度なデータ分析、つまり専門的な統計分析方法や原則に関しては、SPSS や SAS などの専門的な分析ツールに頼らなければならないのでしょうか。低レベルから高レベルまでデータ分析のプロセスを引き継ぐことができるツールはあるのでしょうか。実は、そのようなツールは存在し、それが Excel のデータ分析機能です。最近最も人気のある 2 冊の Excel 本、「Who Says Newbies Can't Do Data Analysis」と「Let Excel Fly」では、この部分の内容は取り上げられていないようです。高度なデータ分析には、回帰分析、分散分析、T検定などの手法があります。これらの内容は、日常業務とは関係ないと思ってはいけません。実は、より上のレベルに進むと、MBAのコースにもこれらの内容が含まれます。そのため、遅かれ早かれ学ばなければならない内容なので、事前に学んでおくといいでしょう。以下の内容を確認してください。 使用する前に、まずExcelのデータ分析機能をインストールする必要があります。デフォルトでは、Excelにはこの拡張機能はインストールされていません。インストールは次のとおりです。 1) Office ボタンの上にマウスを移動し、[Excel のオプション] をクリックします。 2) [アドイン] を見つけて、管理セクションで [Excel アドイン] を選択し、[移動] をクリックします。 3) [分析ツールパック]を選択し、[OK]をクリックします。 4) インストール後、以下のように[データ]セクションに[データ分析]機能が表示されます。 インストールしたら、まずは回帰分析の内容について学んでみましょう。 1. 回帰分析 回帰分析を詳細に行う前に、まず回帰とは何かを理解する必要があります。実際、回帰現象は、英国の生物統計学者であるガルトンが親と子の遺伝的特徴を研究していたときに初めて発見されました。これは興味深い現象です。身長の遺伝的特徴は、「背の高い親の子供は平均よりも背が高いが、必ずしも親よりも背が高いわけではない。ある時点を超えると、平均身長に向かって「回帰」する」ことを示しています。 この効果は「中心への回帰」と呼ばれます。今日の回帰分析は、主に、ゴルトンの研究から導き出されたものなど、変数間の定量的な関係モデルを確立するための一連の方法と手順を指します。 ここで、独立変数は親の身長であり、従属変数は子の身長です。 Baidu 百科事典では、回帰分析を次のように定義しています。「回帰分析は、2 つ以上の変数間の相互依存的な定量的関係を決定する統計分析手法です。」広く使用されているもの: 1) 回帰分析は、関与する独立変数の数に応じて単変量回帰分析と多変量回帰分析に分けられます。 2) 独立変数と従属変数の関係の種類に応じて、線形回帰分析と非線形回帰分析に分けられます。 電子商取引の例を挙げます。電子商取引のコンバージョン率は一定で、ウェブサイトの訪問数は一般的に売上高に比例します。ここで、アクティビティ中の売上高を予測するには、以下に示すように、さまざまな訪問数での売上高に対応する標準曲線を確立する必要があります。 1. まず、散布図を使用してグラフを描きます。 2. トレンドラインを追加し、回帰分析式とR二乗値を表示します。 グラフから、R 2 乗値 = 0.9995 であり、傾向線が直線に収束していることがわかります。式は次のとおりです: y = 0.01028x-27.424 R 二乗値は 0 から 1 の間の数値です。トレンド ラインは、R 二乗値が 1 または 1 に近い場合に最も信頼性が高くなります。 R2 >0.99 であるため、これは非常に明らかな線形特性を持つ値であり、フィッティング ラインが実際のデータを 99.99% 以上説明およびカバーでき、一般性が良好で、優れた予測の役割を果たすことができることを意味します。 3. Excelのデータ分析機能を活用する 1) [データ分析]をクリックし、ポップアップ選択ボックスで[回帰]を選択して[OK]をクリックします。 2) [X値入力エリア]で訪問回数のセルを選択し、[Y値入力エリア]で売上金額のセルを選択し、残差、標準残差、残差プロット、線形近似プロット、正規確率プロットなど、以下に示すオプションをチェックします。 3) 残差と標準化残差は以下のとおりです。 4) 残差プロットは次のようになります。 残差グラフは、実際の値と予測値のギャップをグラフ化したものです。残差グラフの散布点が中心軸の両側に分布している場合、近似直線は妥当であり、予測が時々より多く、時々より少なくなることを示しており、これは概ね傾向と一致しています。ただし、すべてが上側または下側にある場合は機能しません。これは偏りがあるため、再処理する必要があります。 5) 以下は線形近似グラフである 線形フィッティング グラフでは、実際のデータ ポイントに加えて、フィッティングされた予測データ ポイントもあることがわかります。これらのパラメーターも上記の表に示されています。 6) 以下は正規確率プロットである 正規確率プロットは、通常、データ セットが正規分布に従うかどうかを確認するために使用されます。これは、実際の値と正規分布データ間の機能関係の散布図です。この値のセットが正規分布に従う場合、正規確率プロットは直線になります。回帰分析は必ずしも正規分布に従う必要はなく、ここでは単に正規分布に従っているだけです。 上記のデータ テーブルとグラフは、y=0.01028x-27.424 という式が信頼性の高い予測曲線であることを示しています。イベント中のトラフィックが 500,000 回であると仮定すると、次の図に示すように、予測される売上は 51,373 になります。 再版する価値があると思われる場合は、その旨を明記してください。 |
<<: Baidu の「ビッグアップデート」により、ユーザーエクスペリエンスが再び向上。Baidu 関連情報は 2 ページ目の上部に表示されます
2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています「QRコー...
2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています多くのウェ...
月収10万元の起業の夢を実現するミニプログラム起業支援プラン競争が激しいレッドオーシャンで生き残るの...
regxa (year~) は現在、イラク VPS、イラク サーバー (イラク独立サーバー/物理マシ...
バージョン1.0 2012.11.2怠け者なので、すでに誰かが完全に翻訳しています。PDFに変換して...
タイトル:実践丨銀行全体の集中的な運用保守を推進し、業務のデジタル変革を可能にする――中国中信銀行の...
Kubernetes についてある程度理解できたので、この記事では引き続きシステム レベルで Kub...
[[424251]] 5Gは新世代の情報通信技術の先導技術として、企業のデジタル変革とデジタルインフ...
[51CTO.comからのオリジナル記事] 過去2年間、「ソフトウェア定義データセンター」のハイパー...
Lian Xingchen が最近、ウェブマスターの友人たちとチャットしていたとき、友人たちが「ウェ...
テンセントは8月12日、2020年第2四半期および上半期の業績報告書を発表した。テンセントの2020...
5月11日、2019年広東省・香港・マカオ情報技術・セキュリティ技術セミナーと広東省サイバースペース...
医療ウェブサイトの最適化に関しては、競争が熾烈です。動画広告にしろ、ウェブサイトの最適化にしろ、競争...
今日お話しするドメイン名に関する内容は、SEO初心者がSEOにおける良いドメイン名の役割を十分に理解...
[[208888]]数年前に SaaS に対する資本の「注目」が何度か波及した後、その結果を確認する...