Baidu のウェブサイトコンテンツの識別について

先月から旅行情報サイトを2つ作成しました。現在、サイトは充実しており、スナップショットもリアルタイムで更新されていますが、まだランキングにはなっていません。個人的に分析した結果、ウェブサイトのコンテンツに問題がある可能性があることがわかりました。そこで、今日はEryi.com（www.21w.cc）を例に、Baiduのウェブサイトコンテンツの認識の問題についてお話ししたいと思います。

1. 百度のウェブサイトコンテンツの独創性の評価

今年5月から、百度は百度オリジナル火星プロジェクトを開始しました。その明らかな兆候は、ページのインデックスの前に時間が追加されていることです。 Baiduの説明によれば、オリジナルコンテンツはユーザーのニーズを満たす限り優遇され、また、表示時にオリジナルコンテンツにはマークが付けられるとのこと。しかし、さまざまな分野のウェブマスターからの個人的なフィードバックに基づくと、私を含め、誰もがBaiduの独自の識別技術は進歩していないと感じています。

Eryi.com を例に挙げてみましょう。著者が書いたオリジナルの記事が含まれている場合もありますが、オリジナルコンテンツのマークはありません。また、オリジナルではない記事が転載されている場合もありますが、オリジナルコンテンツのマークがあります。もちろん、このような状況は、Baidu のデータベースがオリジナルコンテンツを識別するのに十分な力がなく、バックグラウンドコンテンツの比較遷移が十分に完璧ではないために発生する可能性があります。専門的な学術的観点からは、論文に他の論文と同じ単語が 30 個連続して含まれており、引用に参照マークが含まれていない場合、盗作とみなされる可能性があります。

グーグルの当初の計画は、百度の当初の火星計画に似ているが、長期間実行されても良い結果は得られていない。個人的には、現在ではコンテンツの認知度は百度の重みに大きく依存しており、記事の内容とはあまり関係がないのではないかと思います。

2. Baiduのウェブサイトコンテンツレイアウト形式の認識

皆さんもこんな経験があるかと思いますが、ウェブサイトを構築した後、ウェブサイトコレクション機能を使って他の関連ウェブサイトから情報を収集し、記事のフォーマットを加工してからウェブサイトに公開することができます。Baiduはそれをオリジナルコンテンツとしてマークすることもできます。

もともと、Baidu スパイダーがクロールする際、記事のメインコンテンツのみをクロールし、コード形式は破棄していました。しかし、一方で、Baidu はフォーマットを使用するブラックハット SEO テクニックを特定する必要があります。この観点から、Baidu は Web ページのコードを破棄せず、クロール中にテキストと一緒にコードをクロールします。

では、上記の分析から、既存の記事にいくつかの新しい形式とレイアウトを追加することで、記事の疑似オリジナリティを実現できるでしょうか? この問題に関してまだ完全な結論を出すことはできませんが、1つ確かなことは、ユーザーエクスペリエンスの要素を除外した後でも、記事のレイアウトは依然として Baidu のクロールに対して一定の影響を与えるということです。

3. Baidu のウェブサイトコンテンツページにおける時間の認識

Baidu のスナップショットが先行している、またはスナップショットが遅れているという 2 つの状況を見たことがあるかどうかはわかりませんが、実際の操作中にこの状況がまだ存在することがわかりました。まず、この 2 つの現象について説明します。

Baidu スナップショットは時間が進んでいます。つまり、Baidu スナップショットの時間が現在の時間を超えています。たとえば、今日は 2013 年 9 月 12 日ですが、Web サイトには 2014 年 9 月 12 日の Web ページスナップショットがあります。 Baidu スナップショットの遅延は、まさに関連しています。たとえば、2013 年 9 月 12 日に記事を公開した場合、Baidu の現在の処理によると、Baidu スナップショットは 2013 年 9 月 12 日になるはずですが、現在のスナップショットの時間は 2012 年 9 月 12 日であり、スナップショットの時間では、Web サイトはまだオンラインになっていません。これはどのような状況ですか?

分析と照合の結果、Baidu の Web ページのクロールと時間の処理に問題があることが判明しました。たとえば、記事が 2013 年 9 月 12 日に公開されたが、この記事の公開日が 2012 年 9 月 12 日と記載されている場合、スナップショットの遅延が発生する可能性があります。スナップショット先読みはその逆を行います。もちろん、この状況は可能性に過ぎず、必ずしもそうとは限りません。これにより、Baidu のインデックスにいくつかの問題があることも明らかになりました。興味のある学生は実際に試してみて、スナップショットの時間やキーワードのランキングを調べることができます。

この記事は最初に A5 で公開されました。転載の際は出典を明記してください: 21w.cc http://www.21w.cc。ありがとう。

原題: Baidu のウェブサイトコンテンツの識別について

キーワード: オリジナル、Baidu、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<: 模倣は相手から学ぶことにも有効である

>>: 人生を心配することなくSEO外部リンクで良い仕事をし、学習体験はとてもシンプルです