好了,廢話少說(shuō),我們先看看幾個(gè)示例吧一、打開(kāi)一個(gè)網(wǎng)頁(yè)獲取所有的內(nèi)容復(fù)制代碼代碼如下:fromurllibimporturlopendoc=urlopen("http://www.baidu.com").read()printdoc二、獲取Http頭復(fù)制代碼代碼如下:fromurllibimporturlopendoc=urlopen("http://www.baidu.com")printdoc.info()printdoc.info().getheade
系統(tǒng) 2019-09-27 17:48:28 1938
前一段時(shí)間一直在研究如何用python抓取搜索引擎結(jié)果,在實(shí)現(xiàn)的過(guò)程中遇到了很多的問(wèn)題,我把我遇到的問(wèn)題都記錄下來(lái),希望以后遇到同樣問(wèn)題的童鞋不要再走彎路。1.搜索引擎的選取選擇一個(gè)好的搜索引擎意味著你能夠得到更準(zhǔn)確的搜索結(jié)果。我用過(guò)的搜索引擎有四種:Google、Bing、Baidu、Yahoo!。作為程序員,我首選Google。但當(dāng)我看見(jiàn)我最愛(ài)的Google返回給我的全是一堆的js代碼,根本沒(méi)我想要的搜索結(jié)果。于是我轉(zhuǎn)而投向了Bing的陣營(yíng),在用過(guò)一段
系統(tǒng) 2019-09-27 17:48:21 1938
引言logging的基本用法網(wǎng)上很多,這里就不介紹了。在引入正文之前,先來(lái)看一個(gè)需求:假設(shè)需要將某功能封裝成類庫(kù)供他人使用,如何處理類庫(kù)中的日志?數(shù)年前在一個(gè)C#開(kāi)發(fā)的項(xiàng)目中,我用了這樣的方法:定義一個(gè)logging基類,所有需要用到日志的類都繼承這個(gè)基類,這個(gè)基類中定義一個(gè)LogHandler事件,該事件用于實(shí)現(xiàn)具體的記錄日志動(dòng)作,同時(shí)可以通過(guò)將類A的LogHandler委托掛到類B的LogHandler上,實(shí)現(xiàn)將兩個(gè)類的日志信息添加到一起。自從看了py
系統(tǒng) 2019-09-27 17:47:37 1938
windows10:1,先要pip安裝pydotplus和graphviz:pipinstallpydotpluspipinstallgraphviz2,www.graphviz.org下載msi文件并安裝。3,系統(tǒng)環(huán)境變量path中增加兩項(xiàng):C:\ProgramFiles(x86)\Graphviz2.38\binC:\ProgramFiles(x86)\Graphviz2.38#確認(rèn)graphviz是安裝在上面路徑當(dāng)中。4,python中使用方法:fr
系統(tǒng) 2019-09-27 17:47:26 1938
分析分析網(wǎng)站尋找需要的網(wǎng)址用谷歌瀏覽器摁F12打開(kāi)開(kāi)發(fā)者工具,然后打開(kāi)斗魚(yú)顏值分類的頁(yè)面,如圖:在里面的請(qǐng)求中,最后發(fā)現(xiàn)它是以ajax加載的數(shù)據(jù),數(shù)據(jù)格式為json,如圖:圈住的部分是我們需要的數(shù)據(jù),然后復(fù)制它的網(wǎng)址為https://www.douyu.com/gapi/rknc/directory/yzRec/1,出于學(xué)習(xí)目的只爬取第一頁(yè)(減少服務(wù)器壓力)。然后把網(wǎng)址放到瀏覽器中測(cè)試是否可以訪問(wèn)。如圖:結(jié)果正常。分析json數(shù)據(jù),提取圖片鏈接最后分析發(fā)現(xiàn)
系統(tǒng) 2019-09-27 17:46:57 1938
如果給定的鍵在字典可用,has_key()方法返回true,否則返回false。語(yǔ)法以下是has_key()方法的語(yǔ)法:dict.has_key(key)參數(shù)key--這是要搜索在字典中的鍵。返回值此方法返回true,如果給定鍵在字典可用,否則返回false。例子下面的例子顯示了has_key()方法的使用。#!/usr/bin/pythondict={'Name':'Zara','Age':7}print"Value:%s"%dict.has_key('
系統(tǒng) 2019-09-27 17:46:48 1938
利用twitter/bootstrap,項(xiàng)目的基礎(chǔ)模板算是順利搞定。接下來(lái)開(kāi)始處理用戶中心。用戶中心主要包括用戶登陸、注冊(cè)以及頭像等個(gè)人信息維護(hù)。此前,用戶的注冊(cè)管理我一直使用django-registration。只是這個(gè)APP有些不思進(jìn)取,09年發(fā)布了0.8alpha版后就一直沒(méi)什么動(dòng)靜。這次決定嘗試另外一個(gè)用戶模塊組件django-userena。相比django-registration,django-userena的功能要完善的多。除基礎(chǔ)的登陸注
系統(tǒng) 2019-09-27 17:46:12 1938
pip版本問(wèn)題Youareusingpipversionxx.x.x,howeverversionxx.x.xisavailable.本質(zhì)是想告訴你,版本需要升級(jí)啦!下面介紹當(dāng)直接upgrade解決不了問(wèn)題是的“強(qiáng)硬”做法!準(zhǔn)備階段:先去【pip官網(wǎng)】下載最新的壓縮包!并解壓。sudoapt-getremovepython-pip#1.卸載舊版本sudopythonsetup.pyinstall#2.進(jìn)入壓縮包的解壓目錄執(zhí)行pip-V#3.看到版本號(hào)證明成
系統(tǒng) 2019-09-27 17:45:40 1938
int數(shù)字類型classint(object):"""int(x=0)->intorlongint(x,base=10)->intorlongConvertanumberorstringtoaninteger,orreturn0ifnoargumentsaregiven.Ifxisfloatingpoint,theconversiontruncatestowardszero.Ifxisoutsidetheintegerrange,thefunctionre
系統(tǒng) 2019-09-27 17:38:22 1938
1lambda函數(shù)函數(shù)格式是lambdakeys:express匿名函數(shù)lambda是一個(gè)表達(dá)式函數(shù),接受keys參數(shù),返回表達(dá)式的值。所以不用return,也沒(méi)有函數(shù)名,經(jīng)常用在需要key參數(shù)的函數(shù)中,比如sorted。2元組(),它是以逗號(hào)辨別的,而不是小括號(hào)。比如一個(gè)元素的元組新手經(jīng)常寫(xiě)成(12),其實(shí)他會(huì)被解釋成單個(gè)元素12.正確的寫(xiě)法應(yīng)該是(12,),在元素后面加上逗號(hào)。3模塊導(dǎo)入。比如importrandomprintrandom.choice
系統(tǒng) 2019-09-27 17:38:19 1938