検索エンジン戦略会議が最近、寒いシカゴで開催されました。 Google の参加者の多くは、重複コンテンツに関する質問を常に受けます。このテーマに関しては、断片的で混乱した理解が数多くあることがわかりました。ここでこれを明確にしたいと思います。 検索エンジン戦略会議が最近、寒いシカゴで開催されました。 Google の参加者の多くは、重複コンテンツに関する質問を常に受けます。このテーマに関しては、断片的で混乱した理解が数多くあることがわかりました。ここでこれを明確にしたいと思います。 重複コンテンツとは何ですか? 重複コンテンツとは、一般的に、異なるドメイン名間に同一または類似のコンテンツが大量に存在することを指します。多くの場合、それは意図的ではないか、少なくとも悪意のあるものではありません。たとえば、一部のフォーラムではモバイル画面専用のページが生成され、ストアのアイテムは複数の異なる URL で表示され (場合によってはリンクも張られる) ます。しかし、場合によっては、検索エンジンのランキングを操作し、人気のあるクエリやロングテールクエリのトラフィックを増やすために、他のウェブサイトから大量のコンテンツをコピーするウェブサイトもあります。 重複コンテンツではないものは何ですか? Google には当サイト向けの使いやすい翻訳機能がありますが、当社のアルゴリズムでは、同じコンテンツの英語版とスペイン語版を重複コンテンツとは見なしません。同様に、あなたの記事内の他の記事からの短い引用が重複コンテンツとして識別されることを心配する必要はありません。 Google が重複コンテンツを気にするのはなぜですか? Google ユーザーは一般的に、Google を使用する際に多様で独創的なコンテンツを見たいと考えています。まったく同じ検索結果が大量に見つかったら、どれほど迷惑なことか想像がつきます。さらに、ウェブマスターは、example.com/contentredir?value=shorty-george〈=en のような複雑な URL を Google が配布することを望んでいません。彼らは、example.com/en/shorty-george.htm のような URL を好む傾向があります。 Googleは何をしたのでしょうか? Google はウェブをクロールして検索結果を取得する際、常に異なるコンテンツのページをインデックスして表示しようとします。このフィルタリングにより、たとえば、サイトに記事の通常バージョンと印刷バージョンがあり、robots.txt に noindex タグが設定されていない場合、Google は Google ユーザーに表示するバージョンを 1 つだけ選択します。まれに、コピーされたコンテンツを使用してランキングを操作し、Google ユーザーを欺こうとする試みがあった場合、Google は関連ページのインデックス作成とランキングを適切に調整します。もちろん、私たちはランキング調整よりもフィルタリングに重点を置くことを好みます...そのため、ほとんどの場合、最悪のシナリオは、元の作成者が望まないバージョンがインデックスに表示されるのを目にすることです。 ウェブマスターはどのようにしてコンテンツの重複問題に積極的に対処できるでしょうか? 検索エンジンのアクセスを適切にブロックする: アルゴリズムにファイルの「最適な」バージョンを決定させるのではなく、Google に優先バージョンを選択するように指示することもできます。たとえば、サイトの記事の印刷版をインデックスに登録したくない場合は、robots.txt ファイルにディレクトリ名または正規表現を記述して、Google がそれらの印刷版をクロールしないようにすることができます。 301 リダイレクトを使用する: ウェブサイトを再構築した場合は、元のウェブサイトの .htaccess で 301 リダイレクト (永続的なリダイレクト) を使用して、ユーザー、Google クローラー、その他の検索エンジン スパイダーをリダイレクトしてください。 リンクの一貫性を保つ: 内部リンクの一貫性を保つようにしてください。/page/、/page、/page/index.htm は使用しないでください。 トップレベル ドメインを使用する: 常に最も適切なバージョンのドキュメントを使用できるようにするには、可能な限り国固有のトップレベル ドメインを使用してください。 example.de は、example.com/de や de.example.com のような URL よりも、ドイツ語中心のコンテンツであることが Google にとって明らかに明確になります。 シンジケーションに注意してください: 他のサイトにコンテンツを提供する場合は、他のサイトの各記事に元の記事へのリンクを含めてください。注: ただし、クエリに対して Google は常に最も適切と思われるバージョン (サイトで禁止されていないバージョン) を表示しますが、それがユーザーの希望するバージョンであるとは限りません。 Google ウェブマスター ツールの優先ドメイン機能を使用する: 他のサイトが www 付きバージョンと www なしバージョンの両方を使用して URL にリンクしている場合は、Google ウェブマスター ツールを使用して、インデックスの作成方法をお知らせいただけます。 テンプレート ページの重複コンテンツを減らす: たとえば、著作権表示を例に挙げてみましょう。2 つのオプションがあります。1 つは、各ページの下部に長い著作権表示を配置することです。もう 1 つの方法は、専用の著作権に関する声明ページを設定し、各ページの下部に非常に短い要約を記述して、著作権に関する声明ページにリンクすることです。 元のタイトル: ウェブサイト上の重複コンテンツに対する Google の 10 の提案 キーワード: Google |
>>: 検索エンジンマーケティング (SEM) の 10 大原則
この記事を書く前に、著者は尋ねたいのですが、百度が現在何世代の検索エンジンサービス技術を使用している...
昨今、携帯電話はますます高性能になり、できることも増えています。携帯電話は今や私たちにとってスマート...
ユーザーが目にする製品インターフェースは、デザイナーが多大な労力をかけて作成したレンダリングではなく...
「IBMはOpenStack組織に加盟して以来、OpenStackエコシステムの構築に積極的に関わり...
CDN は通常、複数の地域にある複数のデータセンターにインターネット上で展開される大規模な分散システ...
rcp.net はブラックフライデーに日本 VPS のミニチュア版をリリースしました。デフォルトのネ...
よく使われる SEO ツールのリスト検索エンジンクロールコンテンツシミュレーター指定されたWebペー...
インターネットのグローバルモバイルアプリケーションビッグデータプラットフォーム「Diandian D...
最近、多くの友人が、外部リンクの構築を主張する多くのウェブサイトのランキングが実際に下がり、中にはB...
私は「インターネット」に少し遅れて参入しました。2006年末にインターネットを理解し始め、オープンソ...
アナリスト会社フォレスターによると、パブリッククラウドは本質的に柔軟性が高いため、革命的な世代のテク...
グローバル化されたテクノロジーは、グローバル化されたビジネスに根ざしています。 5段階の進化を経て、...
edgenat は、新学期期間中に特に素晴らしいプロモーションを実施します。香港 BGP 回線、韓国...
Google Analytics (GA) のトラフィック カバレッジには独自のルールがありますが、...
こんにちは、皆さん。私はルガです。今日は、クラウド ネイティブ エコシステムのコア テクノロジーであ...