Python Baiduランキング一括クエリツール【7月17日改良版】

Python Baiduランキング一括クエリツール【7月17日改良版】


以前にも同じ機能を持つツールを作成したことがありますが、その機能は極めて単純で、推測の結果のように見えます。数日前に考え直し、ランキングだけでなくランディングページのURLやタイトルなども表示するランダムUAなどの実用的な機能をいくつか追加しました。はるかに強力に見えます。では、早速コードを紹介します。

 )'、 'Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1;+.NET+CLR+2.0.50727;+.NET+CLR+3.0.4506.2152;+.NET+CLR+3.5.30729)'、'Mozilla/5.0+(Windows+NT+5.1)+AppleWebKit/537.1+(KHTML,+like+Gecko)+Chrome/21.0.1180.89+Safari/537.1'、'Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1)'、'Mozilla/5.0+(Windows+NT+6.1;+rv:11.0)+Gecko/20100101+Firefox/11.0'、 getLastURL(rawurl): #リダイレクトがある場合の最終 URL を取得します r = request.get(rawurl) return r.urldef getAtext(atext): #<a> と <div> を含むテキストを取得します,2})&nbsp;</a>') match = pat.findall(t) cacheDate = match[0] return cacheDatedef getRank(checkWord, domain): #main line checkWord = checkWord.replace('\n', '') checkWord = decodeAnyWord(checkWord) baiduURL = createURL(checkWord) cont = getContent(baiduURL) soup = BeautifulSoup.BeautifulSoup(cont) results = soup.findAll('table', {'class': 'result'}) #このページ内のすべての結果を検索 for result in results: checkData = unicode(result.find('span', {'class': 'g'})) if re.compile(r'^[^/]*%s.*?' %domain).match(checkData.replace('<b>', '').replace('</b>', '')): #修正 nowRank = result['id'] #ドメイン情報に一致する場合の順位を取得 resLink = result.find('h3').a resURL = resLink['href'] domainURL = getLastURL(resURL) #対象URLを取得 resTitle = getAtext(unicode(resLink)) #対象ページのタイトルを取得rescache = result.find('span', {'class': 'g'}) cacheDate = getCacheDate(unicode(rescache)) # 対象ページのキャッシュ日付を取得します res = u'%s, 第%s名, %s, %s, %s' % (checkWord, nowRank, resTitle, cacheDate, domainURL) return res.encode('gb2312') break else: return '>100'domain = 'www.baidu.com' # 検索するドメインを設定します。print getRank('百度', domain) 

原題: Python Baidu ランキング一括クエリツール [7 月 17 日改良版]

キーワード: python

<<:  SEOにはプロダクト思考を活用する

>>:  モバイル向けに最適化されたウェブサイトに関する Google の推奨事項

推薦する

ウェブサイトのコンテンツを更新する必要があるのはなぜですか?

なぜ Web サイトのコンテンツを更新する必要があるのでしょうか? 多くの人は、更新されたときにのみ...

パブリッククラウドのプライバシーに関して、知っておくべき問題

パブリッククラウドとプライベートクラウドの使用に関する議論が激しくなっています。ほとんどの企業がパブ...

インターネットでお金を稼ぐ方法(I):インターネットの収益モデルの分析

端午節の休暇中、私はとても快適に休んでいました。仕事のことを考えず、外にも出かけませんでした。スーパ...

WeChatロケーションマーケティングの現状と解決策の分析

Weiboマーケティングが増加しており、WeChatマーケティングも本格化しています。しかし、大金を...

内部リンクはどのようにすればよいでしょうか?

今日の SEO 最適化は過去とは大きく異なります。もはや、外部リンクを投稿したり、記事を書いたり、内...

ウェブサイト編集者のための高品質なオリジナル記事の更新方法

企業にとって、質の高いオリジナル記事は非常に重要ですが、それをどのように更新するかは、Webサイトの...

淘宝網の店主2人が海外購入による脱税で上海で有罪判決

新華社によると、上海第一中級人民法院は昨日、タオバオの店主2人が海外で大量の商品を購入して脱税し、一...

王同福氏による SEO に関する最初の会議を聞く (パート 2)

5月26日、筆者は「SEOについて議論する王通と傅偉の初会合を聞いて思ったこと(第1部)」という記事...

#おすすめ# bluehost - 45% オフ/仮想ホスト/無料ドメイン名/無制限のウェブサイト構築、大手ブランドのクラシックホスト

毎年恒例の 11 月が到来し、Bluehost はすでに仮想ホスティングの 55% 割引 (元の価格...

リモートワークとクラウドコンピューティングはさまざまなエンドポイントセキュリティの問題をもたらす

最近の Syxsense Synergy イベントでは、サイバーセキュリティの専門家がエンドポイント...

Bilibiliの崩壊で何が失われたのか?

インターネットに浸透した集団として、インターネット サーフィンはほとんどの人にとって日常的な行動にな...

ウェブサイトの SEO プロセスにおける 4 つの危険な時期に対処する方法

通常のウェブサイト最適化方法でも、不正なウェブサイト最適化方法でも、新しいサイトを立ち上げた後のレビ...

honoridc-¥13.59/128Mメモリ/4gハードディスク/200gトラフィック/ロサンゼルス/シンガポール

honoridc は最近設立された中国の企業です。現在、OpenVZ 仮想化に基づく VPS を運営...

認定ホスティング - 月額 33 ドル / E3-1230 V2 / 8G RAM / 500G HDD / 無料 cpanel

CertifiedHosting は、1999 年に設立されたと主張する老舗のホスティング プロバイ...