使用python爬取微博評(píng)論:本文首發(fā)于《凹凸數(shù)讀》,關(guān)注后臺(tái)回復(fù)“源碼”獲取相關(guān)python代碼2019年5月27日凌晨,翟天臨又上了熱搜。我們爬取了翟天臨2月道歉微博下的30萬(wàn)余條評(píng)論,看看畢業(yè)生們是如何吐槽他的?本文首發(fā)于《凹凸數(shù)讀》,關(guān)注后臺(tái)回復(fù)“源碼”獲取相關(guān)python代碼
系統(tǒng) 2019-09-27 17:53:21 1945
python一直對(duì)中文支持的不好,最近老遇到編碼問(wèn)題,而且?guī)缀鯖](méi)有通用的方案來(lái)解決這個(gè)問(wèn)題,但是對(duì)常見(jiàn)的方法都試過(guò)之后,發(fā)現(xiàn)還是可以解決的,下面總結(jié)了常用的支持中文的編碼問(wèn)題(這些方法中可能其中一個(gè)就能解決問(wèn)題,也可能是多個(gè)組合)。(1)、首先,要保證文件的開(kāi)頭要加上編碼設(shè)置來(lái)說(shuō)明文件的編碼復(fù)制代碼代碼如下:#encoding=utf-8(2)、然后,在連接數(shù)據(jù)的連接參數(shù)里加上字符集說(shuō)明查詢(xún)出的結(jié)果的編碼,這個(gè)不加的后果可能是查詢(xún)出的漢字字符都是問(wèn)號(hào)復(fù)制代
系統(tǒng) 2019-09-27 17:53:20 1945
??近期涉及到了關(guān)于doc文檔讀取的處理,也查了很久,為了便于大家使用,故集大成一下。Doc文檔讀取有如下幾種:1、從doc讀取文本目前沒(méi)有找到直接的方式,一般是先轉(zhuǎn)為docx文件在處理。所使用工具為doc2doc(批量時(shí)可用),或人工另存處理。2、從docx讀取文本一般使用python-docx庫(kù)的方法,但只支持創(chuàng)建新文檔和讀取一些基本的文件數(shù)據(jù),如文件大小和文件標(biāo)題,不支持正文讀取。或直接從docx中讀取xml的方法。3、從pdf讀取文本一般使用pdf
系統(tǒng) 2019-09-27 17:53:01 1945
本文實(shí)例講述了Python的批量遠(yuǎn)程管理和部署工具Fabric用法。分享給大家供大家參考。具體如下:Fabric是Python中一個(gè)非常強(qiáng)大的批量遠(yuǎn)程管理和部署工具,常用于在多個(gè)遠(yuǎn)程PC上批量執(zhí)行SSH任務(wù).常見(jiàn)的使用方法大概總結(jié)如下:1.首先,要將批量執(zhí)行的任務(wù)寫(xiě)入到一個(gè)fabfile.py中,復(fù)制代碼代碼如下:#-*-coding:utf-8-*-fromfabric.apiimportrun,local,roles,env,cdenv.hosts=[
系統(tǒng) 2019-09-27 17:52:48 1945
運(yùn)行多進(jìn)程每個(gè)子進(jìn)程的內(nèi)存空間是互相隔離的進(jìn)程之間數(shù)據(jù)不能共享的互斥鎖但是進(jìn)程之間都是運(yùn)行在一個(gè)操作系統(tǒng)上,進(jìn)程之間數(shù)據(jù)不共享,但是共享同一套文件系統(tǒng),所以訪(fǎng)問(wèn)同一個(gè)文件,或同一個(gè)打印終端,是可以的,而共享帶來(lái)的是競(jìng)爭(zhēng),競(jìng)爭(zhēng)帶來(lái)的結(jié)果就是錯(cuò)亂#并發(fā)運(yùn)行,效率高,但競(jìng)爭(zhēng)同一打印終端,帶來(lái)了打印錯(cuò)亂frommultiprocessingimportProcessimporttimedeftask(name):print("%s1"%name)time.slee
系統(tǒng) 2019-09-27 17:52:42 1945
通過(guò)可變參數(shù)計(jì)算n個(gè)數(shù)的乘積:代碼如下:list=[]defthe_input(count=eval(input("輸入乘數(shù)的總個(gè)數(shù):"))):foriinrange(count):N=eval(input("依次輸入乘數(shù):"))list.append(N)print("一共有",count,"個(gè)要相乘的數(shù)")print("把這些乘放在列表里面:",list)the_input()defget_mul(*num):sum=1forninnum:sum=su
系統(tǒng) 2019-09-27 17:52:31 1945
3.4.5斷言斷言(assertions)的使用方式類(lèi)似于if語(yǔ)句,只是在不滿(mǎn)足條件時(shí),會(huì)直接拋出異常。類(lèi)似于下面的if語(yǔ)句(偽代碼)ifnotcondition:#如果不滿(mǎn)足條件,會(huì)直接拋出異常,程序會(huì)中斷crashprogram那么究竟為什么需要這樣的代碼呢?主要原因?yàn)樾枰獧z測(cè)程序在某個(gè)地方是否滿(mǎn)足條件,如果不滿(mǎn)足條件,應(yīng)該及時(shí)通知開(kāi)發(fā)人員,而不是將這些bug隱藏起來(lái),知道關(guān)鍵的時(shí)候在崩潰。其實(shí)在TDD中經(jīng)常使用斷言,TDD會(huì)在程序發(fā)現(xiàn)異常時(shí)執(zhí)行斷言,
系統(tǒng) 2019-09-27 17:52:20 1945
閑暇之余,在家里自建了個(gè)服務(wù)器,因?yàn)橛玫男^(qū)寬帶,IP位動(dòng)態(tài)分配。域名解析就是個(gè)問(wèn)題,我的域名一般停放在DNSPod下。DNSPod有提供修改的API,就用Python簡(jiǎn)單的實(shí)現(xiàn)了一下動(dòng)態(tài)解析。這樣,就不用安裝花生殼了。廢話(huà)不說(shuō),看代碼:#!/usr/bin/envpython#-*-coding:utf-8-*-importhttplib,urllib,urllib2importtimeimportsys,osimportreimportjsonuser
系統(tǒng) 2019-09-27 17:52:14 1945
本文實(shí)例講述了python日志logging模塊使用方法。分享給大家供大家參考,具體如下:一、從一個(gè)使用場(chǎng)景開(kāi)始開(kāi)發(fā)一個(gè)日志系統(tǒng),既要把日志輸出到控制臺(tái),還要寫(xiě)入日志文件importlogging#創(chuàng)建一個(gè)loggerlogger=logging.getLogger('mylogger')logger.setLevel(logging.DEBUG)#創(chuàng)建一個(gè)handler,用于寫(xiě)入日志文件fh=logging.FileHandler('test.log')
系統(tǒng) 2019-09-27 17:51:47 1945
2019-09-18-21:11:24(初學(xué)者不會(huì)學(xué)博客,望大家見(jiàn)諒見(jiàn)諒)今天學(xué)的內(nèi)容是有關(guān)list.、dict、set集合的使用方法和注意事項(xiàng)list和dict在循環(huán)中不可刪,而且list在迭代輸出時(shí)進(jìn)行刪除是會(huì)導(dǎo)致索引跟著改變所以一般list不在循環(huán)過(guò)程中進(jìn)行刪除list和dict要進(jìn)行刪除時(shí),應(yīng)該把要?jiǎng)h除的記錄到另一個(gè)列表中,然后在進(jìn)行刪除深淺拷貝:淺拷貝只拷貝第一層的內(nèi)容,而深拷貝是全部?jī)?nèi)容都進(jìn)行了拷貝下面是總結(jié)的內(nèi)容:一.重要知識(shí)點(diǎn)1.str.j
系統(tǒng) 2019-09-27 17:51:29 1945