ウェブログ分析の初心者向けガイド

ウェブログ分析の初心者向けガイド

ウェブサイトのログ分析は、経験豊富なウェブマスターにとっては非常に簡単です。彼らは、ログコードの確認からログ分析で見つかった問題の解決まで、すべてを知っています。実は、ウェブサイトのログ分析は難しくないのですが、初心者は意味が分からないため、問題があると考えてしまうのです。ウェブサイトのログをさらに読むと、その意味が理解できるようになります。ここでは、Lucky Racing Web サイトのログを例に、初心者にこの作業をすぐに開始する方法を説明します。

実は、コードはみんなが想像するほど難しくありません。私が初めて宝くじウェブサイトの最適化作業を行い、コードに触れたとき、こんなに難しいラッキーレース http://www.7ien.cn/xysc.aspx ウェブサイトのログコードを理解できるウェブマスターは本当にすごいと思いました。彼らに対する私の尊敬の念は言葉では言い表せません。しばらくウェブサイトのログを眺めていたら、彼らが優秀だったわけではなく、自分がまだ新人だったことに気づきました。自分で考えようとすると、Web サイトのログ分析を始めるのに長い時間がかかります。ここでは、私の経験をいくつか紹介します。初心者がすぐに始められるようになると思います。

1. 蜘蛛の名前の紹介

ウェブサイトのログでは、スパイダー名は通常、Baidu->baiduspider、Google->Googlebot、Msn->msnbot、Yahoo->Slurp、Yodao->YoudaoBot、Sogou->Sogou+get+spider のカテゴリに分類されます。ログで上記のクモの名前を検索すると、この種類のクモの移動痕跡が表示されます。

2. スパイダークロールリターンタイプ

スパイダーがクロールするとコードが返されます。** ステータスを確認することでクロール結果を確認できます。主な HTTP ステータス コードは次のとおりです。

(1)200コードは、スパイダークロールが正常であることを示す。

(2)304コードは、コンテンツが前回のクロール以降更新されていないことを示します。一般的に、Web サイトの画像はこの値を返すことが多いです。

(3)404コード:アクセスしたリンクは間違ったリンクです。この間違ったリンクは、元々存在していたが後に削除された Web ページからのものである可能性があります。一方、最初は存在しなかったが、他の誰かがリンクした Web ページからのものである可能性もあります。

(4)一時的なリダイレクトを示す302コード。

(5)301コードは永続的なリダイレクトを示します。

(6)500コードはプログラムエラーを示します。

3. ログコードの解釈

#ソフトウェア: Microsoft インターネット インフォメーション サービス 6.0

#バージョン: 1.0

#日付: 2013-12-22 16:00:39

#フィールド: 日付、時刻、s-サイト名、s-コンピュータ名、s-ip、cs-メソッド、cs-uri-stem、cs-uri-query、s-ポート、cs-ユーザー名、c-i​​p、cs-バージョン、cs(ユーザーエージェント)、cs(Cookie)、cs(リファラー)、cs-ホスト、sc-ステータス、sc-サブステータス、sc-win32-ステータス、sc-バイト、cs-バイト、所要時間

date はレコードのアクセス日を示します。

時間アクセス時間;

s-sitename は仮想ホストのエイリアスです。

s-ip 訪問者 IP;

cs-method はアクセス方法を示します。一般的な方法は 2 つあります。アクセスする URL を開くときのアクションである GET と、フォームを送信するときのアクションである POST です。

cs-uri-stem はアクセスするファイルです。

cs-uri-query は、asp file? の後に文字列 id=12 が続くなど、アクセス アドレスの追加パラメータを参照します。パラメータがない場合は、-; で表されます。

s-port アクセスするポート。

cs-username 訪問者名;

c-ip ソース IP;

cs (User-Agent) アクセス ソース。

sc-status ステータス、200 は成功、403 は権限なし、404 はページにアクセスできない、500 はプログラム エラーを意味します。

sc-substatus サーバーからクライアントに送信されたサイズ(バイト単位)。

cs – win32-status クライアントがサーバーに送信するサイズ(バイト単位)。

具体的な事例分析:

2013-12-22 18:47:12 W3SVC2137573334 D-901195C886694 119.147.151.150 GET /a.aspx id=2230&TypeId=91 80 - 123.125.71.28 HTTP/1.1 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) - - www.7ien.cn 200 0 0 59004 243 2250

このログは、Baiduspider: はスパイダー クロール タイプが Baidu スパイダーであることを示し、GET /a.aspx id=2230&TypeId=91 はスパイダー クロール ファイル名が a.aspx id=2230&TypeId=91 であることを示します。返される結果は 200 です。


元のタイトル: ウェブサイトログ分析の初心者向けガイド

キーワード: ウェブサイトログ分析、初心者向けガイド

<<:  SEOウェブサイト監査を開始する方法

>>:  ウェブサイトの最適化はユーザーエクスペリエンスを向上させるために最も重要なことです

推薦する

vpsdime-7 USD/6 GB RAM/4 コア/30 GB ハードドライブ/2 TB トラフィック/4 GB ポート

vpsdime は最近立ち上げられた風変わりな VPS プロバイダーです。これは実際には、backu...

民間病院のWeiboマーケティングのやり方

インターネット マーケティングは常にソーシャル ネットワーキング プラットフォームと切り離せないもの...

これらの刺激的なコピーライティングのテクニックを学べば、あなたの心をつかめない人はいないでしょう。

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています人をからか...

crissic-シンプルな評価 (512m メモリ VPS)

Crissic の VPS は十分に安いですか?それはかなり多くのリソースですよね?価格と性能の比率...

Weiboは徐々に企業マーケティングの重要なプラットフォームになる

上海交通大学広報研究センターと世論研究室は共同で「2011年中国微博年次報告」を発表し、2011年の...

金曜日の百度の小規模アップデート後にウェブサイトのランキングが下がらないようにする方法

過去2回の金曜日の百度アップデートから判断すると、百度はこれまで通り金曜日に小規模なアップデートを実...

ブログマーケティングは衰退し、Weiboマーケティングは増加している

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスブログが誕生した当初は、...

akkocloud: サンノゼ cn2 gia vps、永久 20% オフ、40 元/KVM/768M メモリ/10gSSD/600g トラフィック

昨年、Host Catは300Mbpsの帯域幅を持つAkkocloudのドイツのcn2 vpsを導入...

26日午前、DNS障害によりCCTVやNetEaseなど有名サイトへのアクセスが不可能となった。

A5ウェブマスターネットワーク(admin5.com)は3月26日、多くのネットユーザーやウェブマス...

Baiduによるウェブサイトブロック後の開発戦略

Baidu は、目の中にある砂粒さえも許さない封建領主のようなものです。もしあなたが Baidu の...

クラウドコンピューティングの役割について合理的な見方を持つべきである

最近は何でもクラウドコンピューティングに関係しているようです。クラウド コンピューティングはあらゆる...

従来の集中型クラウド コンピューティング アーキテクチャに挑戦する、分散型クラウドの本質とは何でしょうか?

5Gとモノのインターネットの普及に伴い、従来の集中型クラウドコンピューティングアーキテクチャはますま...

中国のオンライン広告とマーケティングのトレンド分析!

具体的なブランドマーケティング事例の分析に基づき、ポストパンデミック時代の広告主や企業のマーケティン...

SEO 詐欺師が真実を明かさない理由 (パート 1)

この記事では、SEO オペレーターが非倫理的な行為に従事する動機について説明します。これは出産体験を...