ETag の概要と SEO におけるその応用

ETag の概要と SEO におけるその応用

以前、「高性能ウェブサイト構築ガイド」でETagについて学んだことがありますが、実際に適用したことはありませんでした。昨晩、Baidu Webmaster Platform が ETag を強く推奨しているのを見て、突然、国家の使命を受けたような気がしました。

1. ETagとは何か

ETag は Entity Tag の略で、Web サーバーとブラウザーがキャッシュ コンポーネントの有効性を確認するために使用するメカニズムです。
ETag は、オブジェクトの変更時刻、オブジェクト サイズ、INode などの特性を組み合わせた文字列です。HTTP1.1 で導入され、Last-Modified と比較して最新の変更日付よりも柔軟なメカニズムを提供します。
ETag は現在、主に画像、JS、CSS ファイルなどの静的リソースに使用されています。

2. ETagの原則

ユーザーが HTTP リクエストを送信すると、ブラウザは If-None-Match ヘッダーを使用して ETag 値をサーバーに返します。ETag が一致する場合は 304 ステータス コードが返され、一致しない場合は 200 ステータス コードが返され、HTTP コンテンツが送信されます。
簡単な概略図は次のとおりです。

: ETag は、画像、JS、CSS ファイルなどの静的リソースで最もよく使用されます。 ETag は Web ページでも使用できると言われていますが、いくつかの大規模な Web サイトを観察したところ、ETag を使用しているサイトはなく、その理由はまだ不明です。

3. 遭遇した問題と解決策

3.1 クラスタリングによる精度の問題

ETag のデフォルトの形式は inode-size-timestamp です。つまり、クラスター内では、オブジェクトのサイズ、権限、タイムスタンプ、パスがすべて同じであっても、inode と ETag は異なります。つまり、同じコンポーネントであっても、クラスター内のあるノードから別のノードに切り替えると、ETag は異なります。
クラスター内に 10 台のサーバーがある場合、ETag マッチングの精度はわずか 10% になります。

3.2 解決策

クラスター問題を解決する方法はありますか?答えは「はい」です。ETag を変更する必要があります。inode を削除してサイズ + タイムスタンプを使用するか、タイムスタンプのみを使用することをお勧めします。
Baidu の担当者は、Apache などのサーバーに対する具体的な変更方法も提供しました。

3.3 費用の計算

コンピューティングがある限り、追加コストが発生します。ただし、Baidu が提供したテスト データによると、CPU 使用率は 1% ~ 3% 増加し、スループット率は基本的に変わらないため、許容範囲内です。

5. ETag が SEO に与える影響

ETag が適切に設定されていれば、サイトマップの利用率が大幅に向上します。 Baidu では、サイトごとにアクティブなクロールの数に制限があります。現在、クローラーはサイトマップ内で新しく追加された URL と変更されていない URL を正確に区別できず、サイトマップの利用率が低くなっています。クローラーは、何千年も更新されていないサイトマップ ファイルを毎日クロールしている一方で、新しく追加した URL のサイトマップはクロールされていない可能性があります。
ETag を使用すると、クローラーは 304 を返す変更されていないサイトマップ ファイルを直接スキップし、最近変更されたサイトマップを直接取得するため、サイトマップの利用率が向上します。

将来的にはサイトマップの権限が完全にオープンになると言われているため、ETag の適用はウェブマスターと Baidu の両方にとって非常に役立ちます。
注: ETag の設定はまだオンラインになっていないため、実際の戦闘データはありませんが、後で補足される予定です。

6. 参考文献

  • 高性能なウェブサイトを構築するためのガイド
  • Baidu ウェブマスター アカデミー - ETag の紹介と機能
  • Baidu Webmaster Academy - サイト サーバーの ETag を構成する方法
  • Baidu ウェブマスター アカデミー - ETag がサーバー パフォーマンスに与える影響

元のタイトル: ETag の概要と SEO での応用

キーワード: seo

<<:  Selenium+PhantomJS+Xpath で Web ページの JS コンテンツをクロールする

>>:  SEO 業務における Python の応用 - データ収集

推薦する

史上最も包括的なAPPキャンパスチャネルプロモーション戦略:15のキャンパスプロモーション方法、あなたはいくつ知っていますか?

1.キャンパスチャンネルの定義キャンパス内での市場チャネルを開発する際、ほとんどのインターネット企業...

検索エンジン最適化のための最良の「対策」

すべてのものには限界があり、独自の発展と継続の法則があります。やり過ぎは許されません。これが限界であ...

shuhost: 香港サーバー20%割引、10M~30M帯域幅、e3シリーズは月額432元から、Windows+3IP内蔵

Shuhost Technology (shuhost) は、8 月に香港データセンターの独立サーバ...

Fanli.comが「Emperor's New Clothes」マーケティングをどのように実施しているかを分析する

いくつかの大規模なリベートサイトがねずみ講とみなされるにつれて、ますます多くの人々が詐欺であると信じ...

2013 年の百度による手動降格に SEO 担当者がどう対処するか

数日前、私は「企業ウェブサイトのマルチキーワードSEOは2013年に破滅する」というタイトルの記事を...

ByteDance が大手 Vs を買収、Bilibili はジレンマに陥っているのか?

ビリビリの人気科学分野の二大巨頭の一つ「ウィザードファイナンス」は6月14日、ビリビリからの撤退を発...

今後注目すべき6種類のSaaSアプリケーション

企業にとってのインターネットの重要性については、詳しく説明する必要はありません。企業はすでに「情報化...

virmach-VPS は年間 3 ドルから、512M メモリ Windows 8 は年間 8 ドルから

virmach.com、新しいコンピュータルームのマシンが使用されました。今回、virmachはドイ...

AWS NAT ゲートウェイの使用開始

AWS(Amazon Web Services)のクラウドコンピューティング分野において、NAT ゲ...

#ハロウィン# dedipath は全品 50% オフ、米国 10 か所のデータセンター、専用サーバー (最低 39 ドル) + VPS (最低 20 ドル/年) を提供しています

米国のサーバー販売業者 dedipath はハロウィーン プロモーションを開始し、米国の 10 のデ...

マルチクラウドが現実のものとなりました。マルチクラウド管理をより適切に実現するにはどうすればよいでしょうか?

歴史的な理由や規制上の要件により、現在多くの企業が複数のクラウドを構築しており、マルチクラウド管理の...

gadgedz-$3.75/KVM/1g メモリ/20g ハードディスク/1T トラフィック

gadgedzさん、私がこれを投稿した理由は、これがすごく安いからなんです、すごいんです!ざっと見た...

contabo: オブジェクト ストレージを追加しました。シングル 250G~25T、20% オフ、最低 $2.49、トラフィック無制限

contabo は、19 年間運営されているドイツの老舗データセンターとして、多くの方にご存じのはず...

ウェブサイトテンプレートの変更によるウェブサイトオーソリティの低下に関する推測と対策

最近、コンピュータテクノロジーフォーラムの降格についての説明や意見が出ています。私はSEOについてあ...