ウェブログ分析の初心者向けガイド

ウェブログ分析の初心者向けガイド

ウェブサイトのログ分析は、経験豊富なウェブマスターにとっては非常に簡単です。彼らは、ログコードの確認からログ分析で見つかった問題の解決まで、すべてを知っています。実は、ウェブサイトのログ分析は難しくないのですが、初心者は意味が分からないため、問題があると考えてしまうのです。ウェブサイトのログをさらに読むと、その意味が理解できるようになります。ここでは、Lucky Racing Web サイトのログを例に、初心者にこの作業をすぐに開始する方法を説明します。

実は、コードはみんなが想像するほど難しくありません。私が初めて宝くじウェブサイトの最適化作業を行い、コードに触れたとき、こんなに難しいラッキーレース http://www.7ien.cn/xysc.aspx ウェブサイトのログコードを理解できるウェブマスターは本当にすごいと思いました。彼らに対する私の尊敬の念は言葉では言い表せません。しばらくウェブサイトのログを眺めていたら、彼らが優秀だったわけではなく、自分がまだ新人だったことに気づきました。自分で考えようとすると、Web サイトのログ分析を始めるのに長い時間がかかります。ここでは、私の経験をいくつか紹介します。初心者がすぐに始められるようになると思います。

1. 蜘蛛の名前の紹介

ウェブサイトのログでは、スパイダー名は通常、Baidu->baiduspider、Google->Googlebot、Msn->msnbot、Yahoo->Slurp、Yodao->YoudaoBot、Sogou->Sogou+get+spider のカテゴリに分類されます。ログで上記のクモの名前を検索すると、この種類のクモの移動痕跡が表示されます。

2. スパイダークロールリターンタイプ

スパイダーがクロールするとコードが返されます。** ステータスを確認することでクロール結果を確認できます。主な HTTP ステータス コードは次のとおりです。

(1)200コードは、スパイダークロールが正常であることを示す。

(2)304コードは、コンテンツが前回のクロール以降更新されていないことを示します。一般的に、Web サイトの画像はこの値を返すことが多いです。

(3)404コード:アクセスしたリンクは間違ったリンクです。この間違ったリンクは、元々存在していたが後に削除された Web ページからのものである可能性があります。一方、最初は存在しなかったが、他の誰かがリンクした Web ページからのものである可能性もあります。

(4)一時的なリダイレクトを示す302コード。

(5)301コードは永続的なリダイレクトを示します。

(6)500コードはプログラムエラーを示します。

3. ログコードの解釈

#ソフトウェア: Microsoft インターネット インフォメーション サービス 6.0

#バージョン: 1.0

#日付: 2013-12-22 16:00:39

#フィールド: 日付、時刻、s-サイト名、s-コンピュータ名、s-ip、cs-メソッド、cs-uri-stem、cs-uri-query、s-ポート、cs-ユーザー名、c-i​​p、cs-バージョン、cs(ユーザーエージェント)、cs(Cookie)、cs(リファラー)、cs-ホスト、sc-ステータス、sc-サブステータス、sc-win32-ステータス、sc-バイト、cs-バイト、所要時間

date はレコードのアクセス日を示します。

時間アクセス時間;

s-sitename は仮想ホストのエイリアスです。

s-ip 訪問者 IP;

cs-method はアクセス方法を示します。一般的な方法は 2 つあります。アクセスする URL を開くときのアクションである GET と、フォームを送信するときのアクションである POST です。

cs-uri-stem はアクセスするファイルです。

cs-uri-query は、asp file? の後に文字列 id=12 が続くなど、アクセス アドレスの追加パラメータを参照します。パラメータがない場合は、-; で表されます。

s-port アクセスするポート。

cs-username 訪問者名;

c-ip ソース IP;

cs (User-Agent) アクセス ソース。

sc-status ステータス、200 は成功、403 は権限なし、404 はページにアクセスできない、500 はプログラム エラーを意味します。

sc-substatus サーバーからクライアントに送信されたサイズ(バイト単位)。

cs – win32-status クライアントがサーバーに送信するサイズ(バイト単位)。

具体的な事例分析:

2013-12-22 18:47:12 W3SVC2137573334 D-901195C886694 119.147.151.150 GET /a.aspx id=2230&TypeId=91 80 - 123.125.71.28 HTTP/1.1 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) - - www.7ien.cn 200 0 0 59004 243 2250

このログは、Baiduspider: はスパイダー クロール タイプが Baidu スパイダーであることを示し、GET /a.aspx id=2230&TypeId=91 はスパイダー クロール ファイル名が a.aspx id=2230&TypeId=91 であることを示します。返される結果は 200 です。


元のタイトル: ウェブサイトログ分析の初心者向けガイド

キーワード: ウェブサイトログ分析、初心者向けガイド

<<:  SEOウェブサイト監査を開始する方法

>>:  ウェブサイトの最適化はユーザーエクスペリエンスを向上させるために最も重要なことです

推薦する

クラウドコンピューティングのコストが過剰にならないようにする6つの方法

「こんなに多くの時間とお金を無駄にしていたとは知りませんでした。」これはおそらく、最新のクラウド コ...

オンライン問題レビュー、JVM Fast Throw のストーリー

[[394549]]まず第一に、これは JVM の基盤となる最適化に関するいくつかの知識ポイントに関...

2021年CCF科学技術賞発表:アリババクラウドネットワークと液体冷却データセンターが2つの賞を受賞

中国コンピューター学会は10月14日、基本ソフトウェア、半導体、データセンターなどのコア技術分野を網...

[WOTD] テンセント楊文兵:PaaS をベースにした自動運用保守システムを迅速に構築

[51CTO.com からのオリジナル記事] ご存知のとおり、運用と保守は実際には反復的な労働を必要...

first-root: ドイツの VPS 業者、安価、1Gbps の帯域幅、大規模なトラフィック

first-root は 2011 年に設立されたドイツの企業です。主な事業はドイツの VPS で、...

Weibo マーケティングのやり方を聞かないでください。メディア マーケティングには 6 つのステップが必要です。

マーケティングは不思議なものだと言われています。長い髪と道教の僧侶の衣装(少なくともそのように見える...

皆さん、あなたのウェブサイトはユーザー向けに構築されていますか?

「ウェブマスターツール」はウェブマスターやSEO担当者にとって非常に馴染み深いものです。国内の有名な...

ウェブマスターが学ぶ価値のある、2012 年の口コミマーケティングの成功事例の一覧

口コミマーケティングは、マーケティングにおいて常に広く利用されてきました。社会化とインターネットが急...

ウェブサイトのトラフィックが消えてしまったら、新たな命を勝ち取るためにその源をたどる必要があります

インターネットの急速な発展に伴い、ウェブサイトのトラフィックはウェブサイトの存続にとって重要な要素と...

ザクロアルゴリズムに対処するためのいくつかの重要な対策

序文百度が発表したザクロアルゴリズムの詳細については、以前の記事ですでに紹介しました。ウェブマスター...

従来の企業はなぜ SEO を実施できないのでしょうか?

最近、李開復氏はWeiboで「伝統的な企業がインターネット企業を買収すると、消滅する」とコメントしま...

1984hosting: アイスランドのVPSおよび関連ホスティング製品を提供

2006 年に設立されたアイスランドのホスティング会社である 1984hosting は、主にドメイ...

Weiboマーケティングについて知っておくべきこと

中国市場を振り返ってみると、光り輝く星、Weibo マーケティングを見つけるのは難しくありません。過...

医療業界は 360 度検索から利益を得ることができますか?

医療業界はSEOマーケティングの大軍であり、インターネット上でのマーケティングとプロモーションの面で...