データ分析を行う際、トレンド分析、比較分析、セグメンテーション分析の 3 つの手法を主に使用します。しかし、もう 1 つよく使用する手法があります。それはクロス分析です。特に、データの異常をトラブルシューティングする場合、クロス分析は強力な威力を発揮します。ブログの更新頻度がそれほど頻繁ではないことを皆様に謝罪したいと思いますが、少なくとも毎月 1 つの記事を公開するように努めます。記事の品質が保証されることを願っています。ディスカッションのためにメッセージを残していただければ幸いです。興味深いトピックを開始し、Web サイトのデータ分析に関するアイデアを一緒に広げることができます。 クロスオーバー分析とは何ですか? クロス分析とは、異なる次元のデータをクロス表示し、多角的な複合分析を行う手法であり、独立した次元での分析では発見できない問題を補います。 クロス分析は多次元モデルとデータキューブに基づいており、特殊なセグメンテーション手法とも言えますが、セグメンテーションの概念とは少し異なります。ご興味がおありの方は、まず前回の記事「データキューブと OLAP」をお読みください。セグメンテーション方法は、同じディメンションの詳細な開発、つまり OLAP のドリルダウンに基づいています。たとえば、月次サマリー データをセグメント化して日次データを表示するのは時間ディメンションのセグメンテーションであり、省データ セグメント化して省内の各都市のデータを表示するのは地理的ディメンションに基づくドリルダウンです。クロス分析は、もはや 1 つのディメンションに限定されません。データ キューブと OLAP の記事のキューブと同様に、異なるディメンションの交差に基づいています。時間ディメンション、地域ディメンション、製品ディメンションを交差させて、各小さなキューブのデータ パフォーマンスを分析します。たとえば、上海での 3 月の電子製品の売上は、OLAP のスライス アンド ダイス操作を通じて確認できます。これにより、単一のディメンションでは見つけられない多くの問題を発見できます。したがって、クロス分析は、同じ次元内の細分化の垂直方向の拡張ではなく、異なる次元の水平方向の組み合わせとクロス分析に基づいています。 クロス分析プレゼンテーション クロス分析では、複数のディメンションを組み合わせて行います。チャートとテーブルの両方を表示できますが、チャートは表現できるデータが限られており、複数のディメンションの相互関係を示すのが容易ではないため、クロス分析ではあまり使用されません。代わりに、通常はテーブルが使用されます。私たちがよく目にする表は、通常、2 次元表と呼ばれます。一般的に、最初の列には日付などのディメンションが配置され、表のヘッダーにはさまざまなインジケーターがリストされます (実際、すべてのインジケーターは、特別なディメンション インジケーター ディメンションと見なすこともできます)。このように、行と列の 2 つのディメンションが、最も一般的な 2 次元表を構成します。 2 次元テーブルを拡張して、より豊富な次元を表示できます。 上の図は、複数のディメンションが行と列に階層的に配置された、典型的なテーブルベースの多次元クロス分析レイアウトです。インジケーターを 1 つだけ表示する場合には、ここでインジケーター ディメンションを表示する必要はありません。実際、Excel のピボット テーブルはクロス分析に強力なツールです。データ レポートとレポートの記事でピボット テーブルについて触れました。その記事のスクリーンショットに基づく元のデータは次のとおりです。上記のレイアウトに従って各ディメンションを表示すると、どのような効果が得られるでしょうか。 見た目も良く、表示される情報も非常に豊富です。左側には時間ディメンションと製品ディメンションが日単位で含まれており、細分化操作と同様に展開ボタンを使用して要約および展開できます。上部のヘッダーには、地域ディメンションと指標ディメンションが2層でリストされています。Excelのピボットテーブルには豊富な設定があり、デフォルトの表示は各ディメンションの要約データに基づいているため、「合計ポイント」の観点からデータを観察することができ、データ分析に非常に役立ちます。上記のピボットテーブルを使用してクロス分析を実行し、データに異常があるかどうかを確認します。 全体から詳細までの分析方法を使用して、まずは毎日の売上とコンバージョン率の集計データを確認することから始めます。製品ディメンションを折りたたんだ後、右端の指標集計列を観察して、毎日の集計データを確認できます。ある日の売上またはコンバージョン率が急激に低下した場合、さまざまなディメンションを組み合わせて問題の原因を見つけることができます。つまり、さまざまなディメンションの詳細データに基づいて、製品ディメンションを展開して、その日にどのタイプの製品が販売上の問題を抱えているかを観察し、次に地域ディメンションのクロスデータを組み合わせて、どのタイプの商品がどの省で販売上の問題を抱えているかを見つけることができます。これにより、詳細レベルで問題を効果的に特定できるため、問題をより適切に発見して解決できます。したがって、クロス分析は、実際には「分割して分析する」という本来の意図を反映しています。 上記の方法は、一般的によく使用される問題ベースの分析方法ですが、一度で問題を特定できることはほとんどありません。問題を特定するために、データベースを複数回クエリしたり、推測に基づいてダッシュボードでさまざまなレポートを表示したりすることがよくあります。ピボット テーブルのクロス分析と組み合わせると、1 つのレポートを使用して問題をすばやく特定できます。全体から詳細まで、ロジックは非常に明確で、問題が非常に正確かつ適切に特定されます。したがって、クロス分析を合理的に使用すると、問題をより効率的にトラブルシューティングできます。 クロス分析の基礎 ここで、クロス分析の基盤となる基本データモデルについてお話しする必要があります。基礎データモデルが適切に設計されていないと、上位レベルのクロス分析の実装が困難になったり、多次元クロス分析が制限されたりして、分析に限界が生じます。 技術的な観点から見ると、クロス分析は多次元モデルに基づいています。データの次元が豊富であればあるほど、より豊富で柔軟なクロス分析を実現でき、さまざまなクロス分析を通じてより効果的に問題を発見できます。ただし、それに応じて、各次元のクロス分析を可能な限り充実させるには、基礎となるモデルに対する要件が高くなります。したがって、基礎となるデータ モデルを適切に設計することが非常に重要です。データ キューブと OLAP の記事で、データ キューブを使用した簡単な例を見てみましょう。 ウェブサイト分析レポートに日付ディメンションと月単位の対応する指標のみが含まれている場合、データは月ごとに 1 つのレコードとして保存されます。ただし、このように高度に集約されたデータは分析に適していないことは明らかです。より詳細なデータを取得するには、上に示したようにデータ キューブを構築する必要があります。データ キューブを使用してデータの詳細を拡張する方法は 2 つあります。1 つは垂直拡張で、1 つのディメンションのセグメント化に基づいています。たとえば、1 か月を各日にセグメント化した場合、レコードは 30 レコードに拡張されます。もう 1 つは水平拡張で、複数のディメンションの交差です。これは、上記のキューブに製品ディメンションと地域ディメンションが追加されているのと同じです。このようにして保存されたデータは、元の単一の時間次元から、時間、製品、領域の 3 次元に拡張され、3 次元キューブで表示できる形式になります。もちろん、次元は 4 次元、5 次元、さらには N 次元まで拡張し続けることができ、理論的には可能です。ここでは、3 次元を例として取り上げるだけで十分です。データ ストレージの場合、水平方向の拡張と垂直方向の拡張の影響は同じです。レコード数は倍数で増加します。ここでの製品ディメンションが製品カテゴリであると仮定すると、製品カテゴリは 20 個あり、さらに 32 の州または市町村があり、垂直方向と水平方向の拡張後、元の 1 か月あたり 1 レコードは次のようになります。 1 × 30 × 20 × 32 = 19200 多次元モデルを構築する場合、多くの次元に含まれるデータの量は、上記の例ほど少なくはありません。Web サイト上の製品やページの数が数百、あるいは数千になる可能性があると想像してください。倍数に拡張されると、データ量は劇的に増加します。豊富な多次元キューブは分析を容易にしますが、データの保存とクエリに負担をかけることになります。 したがって、より豊富で柔軟な分析要件の実現は、より複雑な多次元モデルまたはデータ キューブに基づいて行われ、これによってシステム オーバーヘッドも増大します。 Google アナリティクスは、柔軟なデータ分析と複雑なデータ モデルの間で適切なバランスを実現しており、これが Google アナリティクスの強力な機能の基本的な保証となっています。GA の高度なセグメントとカスタム ダッシュボードは、他の同様の無料ウェブサイト分析ツールとは比べものになりません。そのため、他のほとんどのツールはウェブサイト データ統計ツールとしか見なされないのに対し、GA はウェブサイト データ分析ツールとして分類されています。 GA は、強力な基礎データ モデルと効率的なデータ計算および応答機能に基づいており、多くの分析機能を拡張できます。その多くはクロス分析を伴います。以下は、その 2 つの機能、セカンダリ ディメンションとピボットのスクリーンショットです。 Google アナリティクスの新バージョンには、多くの魅力的な機能が追加されました。セカンダリ ディメンションの機能は、旧バージョンから引き継がれています。上の図では、コンテンツ モジュールのページ レポートでトラフィック ソースが 2 番目のディメンションとして選択されています。このようにして、各ページのトラフィックがどこから来ているのか、ページ上の各トラフィック ソースのデータ パフォーマンスを確認できます。同時に、興味深い現象も見つかるかもしれません。たとえば、一部のページのトラフィックは基本的に 1 つのソースによってもたらされています。たとえば、私のブログの一部の記事は基本的に検索エンジン経由でもたらされていますが、他の記事は基本的に直接トラフィックによってもたらされています。 さまざまな GA レポートでは、右上隅で表示形式を選択できます。最後はピボットです。ピボットはテーブル ヘッダーを拡張し、他のディメンションを階層的に配置できます。たとえば、上の図では、ページとトラフィック ソースの交差点が引き続き使用され、ソース ディメンションがインジケーターの上に配置されています。同時に、GA は 2 つのディメンションに基づいて最大 2 つの指標の選択をサポートしています。ここでは、ページビューと直帰率を選択しました。これは、各ページのさまざまなトラフィック ソースによってもたらされる「量」と「質」を測定するためのもので、分析にも非常に役立ちます。 私たちは日常生活で多次元クロス分析をよく使います。クロス分析はトラブルシューティングや問題の特定に非常に有効なので、クロス分析を容易にするために、データをよりよい形で提示する方法を見つける必要があります。実は、ここで紹介したピボットテーブル法は最も一般的に使われており、比較的使いやすいのですが、そのような方法はあまりにも少ないです。クロス分析を提示するための、もっと効果的な方法はないでしょうか。 » この記事はBY-NC-SA契約を採用しています。転載の際は出典を明記してください: ウェブサイトデータ分析 » 「多次元クロス分析」 オリジナル: http://webdataanalysis.net/data-analysis-method/cross-analysis/ 原題: ウェブサイトデータ分析: 異常なウェブサイトデータをチェックするための多次元クロス分析 キーワード: ウェブサイト、多次元、部門横断、調査、異常、私たち、実施、ほとんどの場合、ウェブマスター、ウェブサイトのプロモーション、収益 |
>>: ミヨウとのインタビュー:ギャングとの対話:信仰には説明は不要
時代の発展とともに、あらゆる分野における競争はますます激しくなってきています。今日では、企業は製品で...
テクノロジーに関しては、業界の最新トレンドや新興分野についていくのは困難です。コンピューティングの種...
5月23日、広東省人民政府の指導の下、広東省経済情報化委員会とテンセントの主催により、2018年テン...
多くの初心者が SEO を学び始めると、タイトルを変更すると権威が下がったり、追い出されたりするので...
データによれば、クラウドに移行する企業がますます増えています。これらの企業は、サードパーティのインフ...
[51CTO.comからのオリジナル記事] エンタープライズITサービス分野では、ユーザーに「満足」...
数日前、dedioneは1Gbps帯域幅、無制限トラフィック、CN2 GIAネットワークを備えた2つ...
郭平先生の2回の授業を聞いて、私は深く感動しました。 SEO がこのようにできるとは思ってもいません...
[51CTO.comより引用] 2019年12月16日、中国電子技術標準化研究所が主催する「イノベー...
HEXONETからメールを受け取ったとき、インターネット上の混沌としたドメイン名サフィックスが登...
外部リンクはウェブサイトの最適化に欠かせない要素であるため、多くの友人が外部リンクに興味を持っている...
私たちは、農業事業が少々田舎っぽかったり、少々小規模であったりすることを恐れません。しかし、農業ビジ...
世界最大のクラウド サービス消費者の 1 つである米国証券取引委員会 (SEC) 傘下の規制機関であ...
オンラインストアのブランドは長期的な収益性の基盤となります。今日は、Weibo を活用してオンライン...
今日まで電子商取引が発展するにつれ、競争はますます激しくなってきています。電子商取引は、一般的にプラ...