ETag の概要と SEO におけるその応用

ETag の概要と SEO におけるその応用

以前、「高性能ウェブサイト構築ガイド」でETagについて学んだことがありますが、実際に適用したことはありませんでした。昨晩、Baidu Webmaster Platform が ETag を強く推奨しているのを見て、突然、国家の使命を受けたような気がしました。

1. ETagとは何か

ETag は Entity Tag の略で、Web サーバーとブラウザーがキャッシュ コンポーネントの有効性を確認するために使用するメカニズムです。
ETag は、オブジェクトの変更時刻、オブジェクト サイズ、INode などの特性を組み合わせた文字列です。HTTP1.1 で導入され、Last-Modified と比較して最新の変更日付よりも柔軟なメカニズムを提供します。
ETag は現在、主に画像、JS、CSS ファイルなどの静的リソースに使用されています。

2. ETagの原則

ユーザーが HTTP リクエストを送信すると、ブラウザは If-None-Match ヘッダーを使用して ETag 値をサーバーに返します。ETag が一致する場合は 304 ステータス コードが返され、一致しない場合は 200 ステータス コードが返され、HTTP コンテンツが送信されます。
簡単な概略図は次のとおりです。

: ETag は、画像、JS、CSS ファイルなどの静的リソースで最もよく使用されます。 ETag は Web ページでも使用できると言われていますが、いくつかの大規模な Web サイトを観察したところ、ETag を使用しているサイトはなく、その理由はまだ不明です。

3. 遭遇した問題と解決策

3.1 クラスタリングによる精度の問題

ETag のデフォルトの形式は inode-size-timestamp です。つまり、クラスター内では、オブジェクトのサイズ、権限、タイムスタンプ、パスがすべて同じであっても、inode と ETag は異なります。つまり、同じコンポーネントであっても、クラスター内のあるノードから別のノードに切り替えると、ETag は異なります。
クラスター内に 10 台のサーバーがある場合、ETag マッチングの精度はわずか 10% になります。

3.2 解決策

クラスター問題を解決する方法はありますか?答えは「はい」です。ETag を変更する必要があります。inode を削除してサイズ + タイムスタンプを使用するか、タイムスタンプのみを使用することをお勧めします。
Baidu の担当者は、Apache などのサーバーに対する具体的な変更方法も提供しました。

3.3 費用の計算

コンピューティングがある限り、追加コストが発生します。ただし、Baidu が提供したテスト データによると、CPU 使用率は 1% ~ 3% 増加し、スループット率は基本的に変わらないため、許容範囲内です。

5. ETag が SEO に与える影響

ETag が適切に設定されていれば、サイトマップの利用率が大幅に向上します。 Baidu では、サイトごとにアクティブなクロールの数に制限があります。現在、クローラーはサイトマップ内で新しく追加された URL と変更されていない URL を正確に区別できず、サイトマップの利用率が低くなっています。クローラーは、何千年も更新されていないサイトマップ ファイルを毎日クロールしている一方で、新しく追加した URL のサイトマップはクロールされていない可能性があります。
ETag を使用すると、クローラーは 304 を返す変更されていないサイトマップ ファイルを直接スキップし、最近変更されたサイトマップを直接取得するため、サイトマップの利用率が向上します。

将来的にはサイトマップの権限が完全にオープンになると言われているため、ETag の適用はウェブマスターと Baidu の両方にとって非常に役立ちます。
注: ETag の設定はまだオンラインになっていないため、実際の戦闘データはありませんが、後で補足される予定です。

6. 参考文献

  • 高性能なウェブサイトを構築するためのガイド
  • Baidu ウェブマスター アカデミー - ETag の紹介と機能
  • Baidu Webmaster Academy - サイト サーバーの ETag を構成する方法
  • Baidu ウェブマスター アカデミー - ETag がサーバー パフォーマンスに与える影響

元のタイトル: ETag の概要と SEO での応用

キーワード: seo

<<:  Selenium+PhantomJS+Xpath で Web ページの JS コンテンツをクロールする

>>:  SEO 業務における Python の応用 - データ収集

推薦する

ステーショングループソフトウェアの詳細な説明は長く続くでしょうか?

みなさんこんにちは。私はみんなに愛され、花を咲かせるヤン・フェンショウです。今日はサイトクラスターと...

#11.11# cloudcone: 真新しい母鶏、高構成、低価格、年間 14 ドル、1G メモリ/1 コア/20g SSD/5T トラフィック

Cloudcone は、低価格で高構成の「Double Eleven」プロモーションを実施します。新...

ストレージ、ボリューム: zxhost-$7/kvm/2g メモリ/800g ハードディスク/500m 無制限トラフィック

一般的に、無制限のトラフィックを備えたストレージ型 VPS はほとんどありません。ここでは、ZXHO...

virmach - 年間 3 ドル / 256 MB メモリ / 15 GB SSD / 500 GB トラフィック / 1G ポート

virmach は常に人々に驚きをもたらします。数日前、同社は年間 5 ドルの VPS を開始しまし...

#おすすめ# 日本サーバー:3つのネットワークに直接接続、高速ソフトバンク回線、Windowsをサポート

bgpto は主に独立サーバーレンタルサービスを提供しており、データセンターはシンガポール、香港、日...

ITコミュニティサイトCSDNがシリーズA資金調達の完了を発表 - A5ウェブマスターネットワーク

新浪科技新聞10月23日午後、ITコミュニティサイトCSDNは本日、シリーズA資金調達を完了したと発...

私たちのウェブサイトをブランドウェブサイトにしましょう

金融チャンネルのビジネス戦争をご覧になったことがあるかどうかはわかりませんが、主に市場での戦争とビジ...

仮想ホスト、VPS(クラウドサーバー)、サーバー(専用サーバー、ベアメタルサーバー)の違いは何ですか?

よく苦笑したくなるような言葉を聞いたり見たりします。vps 仮想ホスト、vps クラウド サーバー、...

3つのアルゴリズムによる外部リンクの重要性の簡単な分析

Fuqing SEO は検索エンジンのアルゴリズムについて詳細な調査を実施したことはありませんし、詳...

ステーショングループ操作は不正行為ですか?

【はじめに】Pi Zirui の SEO に関する詳細な分析を読んで、いくつか考えました。SEO の...

2018 年のクラウド コンピューティングの 5 つの主要トレンドに備えていますか?

2017 年の最終四半期が進むにつれ、企業や IT の幹部は、2018 年のビジネス目標を達成するた...

いくつかのKステーションはSEO実践者の「未熟さ」を検出しました

8月25日から数日が経ちましたが、ウェブマスターグループでは依然として多くのウェブマスターが不満を漏...

Baidu の O2O の試み: 検索大手のモバイル インターネットに対する新しいロジック

百度のCEO、ロビン・リーは、この新たな戦いでも笑顔を保つことができるだろうか?(写真提供:テンセン...

Google Urchin 設定: プロファイルでサイトのすべてのサブドメインを追跡する

1 つの構成ファイルで Web サイトのすべてのサブドメインを追跡するにはどうすればよいでしょうか。...

イベントマーケティングを流行させる秘訣は何ですか?

バイラル記事には非常に良い格言があります。それは、「製品、アイデア、行動をウイルスのようにユーザーの...