ウェブログ分析の初心者向けガイド

ウェブログ分析の初心者向けガイド

ウェブサイトのログ分析は、経験豊富なウェブマスターにとっては非常に簡単です。彼らは、ログコードの確認からログ分析で見つかった問題の解決まで、すべてを知っています。実は、ウェブサイトのログ分析は難しくないのですが、初心者は意味が分からないため、問題があると考えてしまうのです。ウェブサイトのログをさらに読むと、その意味が理解できるようになります。ここでは、Lucky Racing Web サイトのログを例に、初心者にこの作業をすぐに開始する方法を説明します。

実は、コードはみんなが想像するほど難しくありません。私が初めて宝くじウェブサイトの最適化作業を行い、コードに触れたとき、こんなに難しいラッキーレース http://www.7ien.cn/xysc.aspx ウェブサイトのログコードを理解できるウェブマスターは本当にすごいと思いました。彼らに対する私の尊敬の念は言葉では言い表せません。しばらくウェブサイトのログを眺めていたら、彼らが優秀だったわけではなく、自分がまだ新人だったことに気づきました。自分で考えようとすると、Web サイトのログ分析を始めるのに長い時間がかかります。ここでは、私の経験をいくつか紹介します。初心者がすぐに始められるようになると思います。

1. 蜘蛛の名前の紹介

ウェブサイトのログでは、スパイダー名は通常、Baidu->baiduspider、Google->Googlebot、Msn->msnbot、Yahoo->Slurp、Yodao->YoudaoBot、Sogou->Sogou+get+spider のカテゴリに分類されます。ログで上記のクモの名前を検索すると、この種類のクモの移動痕跡が表示されます。

2. スパイダークロールリターンタイプ

スパイダーがクロールするとコードが返されます。** ステータスを確認することでクロール結果を確認できます。主な HTTP ステータス コードは次のとおりです。

(1)200コードは、スパイダークロールが正常であることを示す。

(2)304コードは、コンテンツが前回のクロール以降更新されていないことを示します。一般的に、Web サイトの画像はこの値を返すことが多いです。

(3)404コード:アクセスしたリンクは間違ったリンクです。この間違ったリンクは、元々存在していたが後に削除された Web ページからのものである可能性があります。一方、最初は存在しなかったが、他の誰かがリンクした Web ページからのものである可能性もあります。

(4)一時的なリダイレクトを示す302コード。

(5)301コードは永続的なリダイレクトを示します。

(6)500コードはプログラムエラーを示します。

3. ログコードの解釈

#ソフトウェア: Microsoft インターネット インフォメーション サービス 6.0

#バージョン: 1.0

#日付: 2013-12-22 16:00:39

#フィールド: 日付、時刻、s-サイト名、s-コンピュータ名、s-ip、cs-メソッド、cs-uri-stem、cs-uri-query、s-ポート、cs-ユーザー名、c-i​​p、cs-バージョン、cs(ユーザーエージェント)、cs(Cookie)、cs(リファラー)、cs-ホスト、sc-ステータス、sc-サブステータス、sc-win32-ステータス、sc-バイト、cs-バイト、所要時間

date はレコードのアクセス日を示します。

時間アクセス時間;

s-sitename は仮想ホストのエイリアスです。

s-ip 訪問者 IP;

cs-method はアクセス方法を示します。一般的な方法は 2 つあります。アクセスする URL を開くときのアクションである GET と、フォームを送信するときのアクションである POST です。

cs-uri-stem はアクセスするファイルです。

cs-uri-query は、asp file? の後に文字列 id=12 が続くなど、アクセス アドレスの追加パラメータを参照します。パラメータがない場合は、-; で表されます。

s-port アクセスするポート。

cs-username 訪問者名;

c-ip ソース IP;

cs (User-Agent) アクセス ソース。

sc-status ステータス、200 は成功、403 は権限なし、404 はページにアクセスできない、500 はプログラム エラーを意味します。

sc-substatus サーバーからクライアントに送信されたサイズ(バイト単位)。

cs – win32-status クライアントがサーバーに送信するサイズ(バイト単位)。

具体的な事例分析:

2013-12-22 18:47:12 W3SVC2137573334 D-901195C886694 119.147.151.150 GET /a.aspx id=2230&TypeId=91 80 - 123.125.71.28 HTTP/1.1 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) - - www.7ien.cn 200 0 0 59004 243 2250

このログは、Baiduspider: はスパイダー クロール タイプが Baidu スパイダーであることを示し、GET /a.aspx id=2230&TypeId=91 はスパイダー クロール ファイル名が a.aspx id=2230&TypeId=91 であることを示します。返される結果は 200 です。


元のタイトル: ウェブサイトログ分析の初心者向けガイド

キーワード: ウェブサイトログ分析、初心者向けガイド

<<:  SEOウェブサイト監査を開始する方法

>>:  ウェブサイトの最適化はユーザーエクスペリエンスを向上させるために最も重要なことです

推薦する

2019 WeChatオープンクラス:ミニプログラムとミニゲームのポイント!

2019年1月9日、毎年恒例のWeChatオープンクラスプロバージョンが再び始まりました。微信(ウィ...

SEOは単なるSEOではありません。もう一度考え直してください

SEO 担当者にとって、SEO (検索エンジン最適化) の概念とは何でしょうか? 多くの人は、SEO...

racknerd: 独立記念日、$17.4/KVM/1.74G メモリ/27g ハードディスク/4T トラフィック、ロサンゼルス最適化ネットワーク、60G 防御

racknerdが米国独立記念日に用意したプロモーションが販売中です。74で終わる比較的大きなトラフ...

30 日間のサークル オブ フレンズ マーケティング: 始めるのは簡単ですが、続けるのは難しいです。

9月12日に「WeChatモーメントマーケティングの5日間の実践ノ​​ート」という記事を書きました。...

インターネット詐欺は金を吸い取るブラックホールとなり、インターネットユーザーは年間300億元以上を失っている。

最も高価な航空券はいくらですか? 190 万元と聞いたら、きっと驚かれるでしょう。これは本当の話です...

中国デジタルヒューマン産業洞察レポート

デジタルヒューマンは、現実世界を仮想世界に反映したものとして、仮想世界の中核資産であり、メタバースの...

人気のオリンピックイベントからトラフィックを引き寄せる最速の方法

毎年開催されるオリンピックは誰もが注目するイベントです。昔は誰もがテレビで試合を観戦していましたが、...

マルチクラウド環境におけるクラウド最適化

従来のワークロードを最新化したいと考えている企業は、スケーラビリティとパフォーマンスを求めてクラウド...

クラウド コンピューティングにおける優れた予測のための CTO ガイド

このクラウド コンピューティング予測ガイドでは、最高技術責任者 (CTO) とクラウド コンピューテ...

firstbyteはどうですか?フィンランドのデータセンターのVPSの簡単なレビュー

firstbyteはどうですか? firstbyte フィンランド VPS はどうですか? Firs...

IBM、Power Rewards プログラムの移行サービス クレジットを 2 倍に

-- IBMの市場シェアは2009年第1四半期に4%増加し、2000年以降14%増加している。ニュー...

キーワード計画についてすべてのウェブマスターに警告する痛い経験

ウェブマスターのウェブサイトで最後にお会いしてから半月が経ちました。私の孟飛洋のウェブサイトは最近い...

エッジ コンピューティングとクラウド コンピューティング: 企業の接続デバイスにはどちらのソリューションが適していますか?

企業が何を構築しているかに関係なく、ある時点で、デバイスは重要な計算をクラウドで実行するべきか、それ...

独自のプライベートクラウドを構築するのは想像以上に複雑です

企業のクラウド移行は想像以上に複雑です。企業がクラウドに移行する際には、インフラストラクチャをアップ...