Baidu のウェブサイトコンテンツの識別について

Baidu のウェブサイトコンテンツの識別について

先月から旅行情報サイトを2つ作成しました。現在、サイトは充実しており、スナップショットもリアルタイムで更新されていますが、まだランキングにはなっていません。個人的に分析した結果、ウェブサイトのコンテンツに問題がある可能性があることがわかりました。そこで、今日はEryi.com(www.21w.cc)を例に、Baiduのウェブサイトコンテンツの認識の問題についてお話ししたいと思います。

1. 百度のウェブサイトコンテンツの独創性の評価

今年5月から、百度は百度オリジナル火星プロジェクトを開始しました。その明らかな兆候は、ページのインデックスの前に時間が追加されていることです。 Baiduの説明によれば、オリジナルコンテンツはユーザーのニーズを満たす限り優遇され、また、表示時にオリジナルコンテンツにはマークが付けられるとのこと。しかし、さまざまな分野のウェブマスターからの個人的なフィードバックに基づくと、私を含め、誰もがBaiduの独自の識別技術は進歩していないと感じています。

Eryi.com を例に挙げてみましょう。著者が書いたオリジナルの記事が含まれている場合もありますが、オリジナル コンテンツのマークはありません。また、オリジナルではない記事が転載されている場合もありますが、オリジナル コンテンツのマークがあります。もちろん、このような状況は、Baidu のデータベースがオリジナルコンテンツを識別するのに十分な力がなく、バックグラウンド コンテンツの比較遷移が十分に完璧ではないために発生する可能性があります。専門的な学術的観点からは、論文に他の論文と同じ単語が 30 個連続して含まれており、引用に参照マークが含まれていない場合、盗作とみなされる可能性があります。

グーグルの当初の計画は、百度の当初の火星計画に似ているが、長期間実行されても良い結果は得られていない。個人的には、現在ではコンテンツの認知度は百度の重みに大きく依存しており、記事の内容とはあまり関係がないのではないかと思います。

2. Baiduのウェブサイトコンテンツレイアウト形式の認識

皆さんもこんな経験があるかと思いますが、ウェブサイトを構築した後、ウェブサイトコレクション機能を使って他の関連ウェブサイトから情報を収集し、記事のフォーマットを加工してからウェブサイトに公開することができます。Baiduはそれをオリジナルコンテンツとしてマークすることもできます。

もともと、Baidu スパイダーがクロールする際、記事のメインコンテンツのみをクロールし、コード形式は破棄していました。しかし、一方で、Baidu はフォーマットを使用するブラックハット SEO テクニックを特定する必要があります。この観点から、Baidu は Web ページのコードを破棄せず、クロール中にテキストと一緒にコードをクロールします。

では、上記の分析から、既存の記事にいくつかの新しい形式とレイアウトを追加することで、記事の疑似オリジナリティを実現できるでしょうか? この問題に関してまだ完全な結論を出すことはできませんが、1つ確かなことは、ユーザーエクスペリエンスの要素を除外した後でも、記事のレイアウトは依然として Baidu のクロールに対して一定の影響を与えるということです。

3. Baidu のウェブサイトコンテンツページにおける時間の認識

Baidu のスナップショットが先行している、またはスナップショットが遅れているという 2 つの状況を見たことがあるかどうかはわかりませんが、実際の操作中にこの状況がまだ存在することがわかりました。まず、この 2 つの現象について説明します。

Baidu スナップショットは時間が進んでいます。つまり、Baidu スナップショットの時間が現在の時間を超えています。たとえば、今日は 2013 年 9 月 12 日ですが、Web サイトには 2014 年 9 月 12 日の Web ページ スナップショットがあります。 Baidu スナップショットの遅延は、まさに関連しています。たとえば、2013 年 9 月 12 日に記事を公開した場合、Baidu の現在の処理によると、Baidu スナップショットは 2013 年 9 月 12 日になるはずですが、現在のスナップショットの時間は 2012 年 9 月 12 日であり、スナップショットの時間では、Web サイトはまだオンラインになっていません。これはどのような状況ですか?

分析と照合の結果、Baidu の Web ページのクロールと時間の処理に問題があることが判明しました。たとえば、記事が 2013 年 9 月 12 日に公開されたが、この記事の公開日が 2012 年 9 月 12 日と記載されている場合、スナップショットの遅延が発生する可能性があります。スナップショット先読みはその逆を行います。もちろん、この状況は可能性に過ぎず、必ずしもそうとは限りません。これにより、Baidu のインデックスにいくつかの問題があることも明らかになりました。興味のある学生は実際に試してみて、スナップショットの時間やキーワードのランキングを調べることができます。

この記事は最初に A5 で公開されました。転載の際は出典を明記してください: 21w.cc http://www.21w.cc。ありがとう。


原題: Baidu のウェブサイトコンテンツの識別について

キーワード: オリジナル、Baidu、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  模倣は相手から学ぶことにも有効である

>>:  人生を心配することなくSEO外部リンクで良い仕事をし、学習体験はとてもシンプルです

推薦する

タオバオSEOは検索マーケティング業界から注目を集めている

報告書によると、2012年にタオバオの店舗総数は500万を超えた。タオバオ店舗の総数が増加するにつれ...

生放送後半の交通パスワード

ライブ配信もしているが、なぜ新東方の農産物が話題となり、「1セントの漬魚」が世論の注目を集めたのか?...

ウェブサイトのおすすめ: オンラインマーケットプレイス Ubokia では、買い手が何を売るかを決めることができます

オンラインで何かを購入したいときは、通常、検索、調査、比較に多くの時間と労力を費やします。オフライン...

中央調達データベースリストの最終候補に選ばれたH3C PaaSクラウドサービスの背後にあるハードパワーとは

近年、第14次5カ年計画以降、全国でデジタル政府構築が本格化しており、2035年までの長期目標では「...

コンテンツ更新に関する誤解の例

Baidu がウェブサイトのコンテンツの取り締まりを開始して以来、コンテンツの更新は多くのウェブマス...

SEO最適化: 最適化するキーワードの選び方

SEO 最適化検索エンジン最適化は SEO とも呼ばれます。SEO 最適化のプロセスでは、適切なキー...

日本のVPSおすすめ、(日本のクラウドホスト)おすすめ

日本 VPS (日本クラウドホスト): 日本は国際的な輸出帯域幅が大きく、ネットワークリソースが発達...

chicagovps 最後の狂気 (SSD 付き)

chicagovps からメールを受け取りました。今年も終わりに近づいていますが、chicagovp...

NAIYUN:中秋節期間限定38%オフ、香港/アメリカ/セラ高防御クラウドサーバー/CN2/9929/4837/専用サーバー/海外電子商取引/TikTok専用サーバー/AIGC/CDN

Naiyun の最新の中秋節と国慶節特別オファーが始まりました: クラウド サーバーの月額支払いは ...

普通の H5 ゲームでは、なぜユーザーはプレイをやめられなくなるのでしょうか?

ゲームというと、誰もが思い浮かべるのはおそらくHonor of Kings 、 League of ...

vikinglayer -$7/KVM/4G メモリ/90g SSD/4T トラフィック/ダラス

vikinglayer は drserver.net のサブブランドです。1999 年から運営されて...

Sihua TechnologyのCao Jingtao氏:クラウドコンピューティング時代のストレージ戦略の分析

[51CTO.com からのオリジナル記事] 今日、クラウド コンピューティングは IT 業界全体の...

クラウド コンピューティング: 浮き沈みの中でもクラウドですべてを実現

10 年以上にわたる技術の進化を経て、クラウド コンピューティングは徐々にテクノロジー界で最も注目さ...

最適なクラウド バックアップ ソリューションを選択する方法

ますます多くの企業が、主要なグローバル クラウド コンピューティング プロバイダーを利用して実稼働ア...