Python Baiduランキング一括クエリツール【7月17日改良版】

Python Baiduランキング一括クエリツール【7月17日改良版】


以前にも同じ機能を持つツールを作成したことがありますが、その機能は極めて単純で、推測の結果のように見えます。数日前に考え直し、ランキングだけでなくランディングページのURLやタイトルなども表示するランダムUAなどの実用的な機能をいくつか追加しました。はるかに強力に見えます。では、早速コードを紹介します。

 )'、 'Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1;+.NET+CLR+2.0.50727;+.NET+CLR+3.0.4506.2152;+.NET+CLR+3.5.30729)'、'Mozilla/5.0+(Windows+NT+5.1)+AppleWebKit/537.1+(KHTML,+like+Gecko)+Chrome/21.0.1180.89+Safari/537.1'、'Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1)'、'Mozilla/5.0+(Windows+NT+6.1;+rv:11.0)+Gecko/20100101+Firefox/11.0'、 getLastURL(rawurl): #リダイレクトがある場合の最終 URL を取得します r = request.get(rawurl) return r.urldef getAtext(atext): #<a> と <div> を含むテキストを取得します,2})&nbsp;</a>') match = pat.findall(t) cacheDate = match[0] return cacheDatedef getRank(checkWord, domain): #main line checkWord = checkWord.replace('\n', '') checkWord = decodeAnyWord(checkWord) baiduURL = createURL(checkWord) cont = getContent(baiduURL) soup = BeautifulSoup.BeautifulSoup(cont) results = soup.findAll('table', {'class': 'result'}) #このページ内のすべての結果を検索 for result in results: checkData = unicode(result.find('span', {'class': 'g'})) if re.compile(r'^[^/]*%s.*?' %domain).match(checkData.replace('<b>', '').replace('</b>', '')): #修正 nowRank = result['id'] #ドメイン情報に一致する場合の順位を取得 resLink = result.find('h3').a resURL = resLink['href'] domainURL = getLastURL(resURL) #対象URLを取得 resTitle = getAtext(unicode(resLink)) #対象ページのタイトルを取得rescache = result.find('span', {'class': 'g'}) cacheDate = getCacheDate(unicode(rescache)) # 対象ページのキャッシュ日付を取得します res = u'%s, 第%s名, %s, %s, %s' % (checkWord, nowRank, resTitle, cacheDate, domainURL) return res.encode('gb2312') break else: return '>100'domain = 'www.baidu.com' # 検索するドメインを設定します。print getRank('百度', domain) 

原題: Python Baidu ランキング一括クエリツール [7 月 17 日改良版]

キーワード: python

<<:  SEOにはプロダクト思考を活用する

>>:  モバイル向けに最適化されたウェブサイトに関する Google の推奨事項

推薦する

Azure Stack HCI と Azure Stack を混同しないでください。

[51CTO.com クイック翻訳] マイクロソフトは先週、Azure Stack HCI のリリー...

V5Net: 物理マシンプロモーション、香港 CN2 サーバー 30% オフ、香港インターナショナル + 香港ハイディフェンス + 韓国 BGP 20% オフ

v5server は現在、香港データセンターの専用サーバーを 30% 割引で提供しています。このサー...

かつては数百万の価値があったヤオミンのドメイン名が、現在わずか90元で販売されているが、誰も興味を持っていない

かつては数百万の価値があったヤオ・ミンのドメイン名は、現在、わずか90元で所有者の手の中で朽ち果てて...

元斉森林のブランドマーケティングを説明する12,000語

飲料業界の専門家とコミュニケーションをとる過程で、私たちは一連の興味深い視点を観察しました。巨大飲料...

ウェブサイトがブロックされた後、トラフィックが減少するのではなく増加したのはなぜですか?

皆さんとコミュニケーションをとるためにA5に記事を書いてから、かなり長い時間が経ちました。私の心の中...

ウェブサイト分析: 高性能 JavaScript テンプレート エンジンの原理の分析

Webの発展に伴い、フロントエンドアプリケーションはますます複雑になり、バックエンドをベースにしたJ...

推奨: HostMist - $10/年/128MB RAM/15GB HDD/200GB トラフィック/ロサンゼルス/アトランタ

2009 年に設立されたこの VPS 企業 Hostmist は、価格を値下げし、プロモーションを行...

SaaS グローバル コンプライアンス チェックリスト

[[427611]] [51CTO.com クイック翻訳]周知のとおり、Software as a ...

#購入# justg: 南アフリカ cn2 gia VPS、「Naifei」をサポート、100M 帯域幅、$19.99/年、KVM/512M メモリ/1 コア/10gSSD/500G トラフィック

JustG は、南アフリカ CN2 GIA VPS をしばらく前からリリースしています。帯域幅は 1...

ウェブサイトでデータ分析を行う方法

サイトを取得すると、通常、どのように始めればよいかわかりません。外部リンクやコンテンツを作成する必要...

inxy: 超低コストの「総合的な」CDN プロバイダー、アジア、ヨーロッパ、アメリカをカバーするプロフェッショナルな POP ノード

2005年に設立されたinxyは、11のコンピュータルームでVPS、24のコンピュータルームで独立サ...

レンタカー業界のソフト記事マーケティングで注意すべき点

レンタカー業界は昔から伝統的な業界です。伝統的な業界の伝統的なマーケティング手法を放棄してはなりませ...

現状から判断すると!今日、SEO はどのような点に重点を置くべきでしょうか?

ウェブサイトの SEO に関しては、Baidu がアルゴリズムの更新、最適化、アップグレードを続けて...

Discuz!社長チェン・リャン:マイクロコミュニティをうまく運営する鍵は、適切なポジショニングを見つけることです

成都ビジネスデイリーのマイクロコミュニティ「紅星制作チーム」は、立ち上げ以来、数万回の訪問と多くのア...

ウェブサイトの重さについて考える

ウェブサイトの重みの定義は何ですか?多くの SEO 担当者がウェブサイトの重みについて議論しています...