綜述本系列文檔用于對Python爬蟲技術的學習進行記錄總結。Python版本是3.7.4urllib庫介紹它是Python內置的HTTP請求庫,也就是說我們不需要額外安裝即可使用,它包含四個模塊(主要對前三個模塊進行學習):request:它是最基本的HTTP請求模塊,我們可以用它來模擬發送一請求,就像在瀏覽器里輸入網址然后敲擊回車一樣,只需要給庫方法傳入URL還有額外的參數,就可以模擬實現這個過程了。error:異常處理模塊,如果出現請求錯誤,我們可以捕
系統 2019-09-27 17:54:27 1965
之前我在windows10系統上面安裝python3.7,雖然在windows上面安裝簡單,操作也方便,但是想要和linux的shell腳本交互就不方便了。因此,我決定在centos7上面也安裝上python最新版本在這期間,我踩了很多坑,也填了很多坑,后來幾乎要面臨崩潰了,期間發生了什么?別著急,耐心往下看!操作環境:CentOS7.464位一般安裝步驟1.下載python安裝包wgethttps://www.python.org/ftp/python/
系統 2019-09-27 17:53:50 1965
Python面向對象編程——綁定方法與非綁定方法一、類中定義的函數分成兩大類1、綁定方法(綁定給誰,誰來調用就自動將它本身當作第一個參數傳入1)綁定到類的方法:用classmethod裝飾器裝飾的方法。為類量身定制類.boud_method(),自動將類當作第一個參數傳入(其實對象也可調用,但仍將類當作第一個參數傳入)2)綁定到對象的方法:沒有被任何裝飾器裝飾的方法。為對象量身定制對象.boud_method(),自動將對象當作第一個參數傳入(屬于類的函數
系統 2019-09-27 17:53:30 1965
模塊:模塊就是一個python文件。模塊就是一個python文件。功能:1.可以提高文件的重復利用率。提高開發效率2.用于劃分程序結構。自定義模塊:模塊就是一個python文件而已,所有python代碼都可以放入模塊,實際開發中,模塊放入的內容都是重復利用率高的內容主要包含:1.為當前模塊專門定義的變量【其他語言一般都是常量】2.函數。3.類4.測試代碼注意:模塊的命名不要和內置模塊重名!測試代碼統一放到判斷當中if__name__=='__main__'
系統 2019-09-27 17:53:19 1965
一.如何調用deff1(arg1,arg2):print('f1',arg1,arg2)deff2(arg1):print('f2',arg1)deff3():print('f3')deff4():print('周期任務',int(time.time()))timer=TaskTimer()#把任務加入任務隊列timer.join_task(f1,[1,2],timing=15.5)#每天15:30執行timer.join_task(f2,[3],timi
系統 2019-09-27 17:53:12 1965
首先我們提到一個代碼塊的概念。在python中并沒有花括號來表示代碼塊這種規定。所以它有了一個新的規定:用縮進來表示代碼塊。(強制要求縮進)當然了,這對像我這種不縮進都要死的人,沒有任何壞處。所以我們來將一下if語句的模板。cgg=10ifcgg<=60:print("Youarerubbish")else:print("Youaregarbage")這就是最基本的if-else當然了,我們還有elseif,在python中用elif來表示。如:cgg=1
系統 2019-09-27 17:53:01 1965
今天接著跟大家總結Python爬蟲面試中常見的高頻面試題。有需要的伙伴用心看啦!1.Request中包含什么呢?1、請求方式:主要有GET和POST兩種方式,POST請求的參數不會包含在url里面2、請求URLURL:統一資源定位符,如一個網頁文檔、一張圖片、一個視頻等都可以用URL來唯一確定3、請求頭信息,包含了User-Agent(瀏覽器請求頭)、Host、Cookies信息4、請求體,GET請求時,一般不會有,POST請求時,請求體一般包含form-
系統 2019-09-27 17:52:44 1965
本文實例講述了Python多線程threading模塊用法。分享給大家供大家參考,具體如下:多線程-threadingpython的thread模塊是比較底層的模塊,python的threading模塊對thread做了一些包裝,可以更加方便的被使用。1.使用threading模塊單線程執行#coding=utf-8importtimedefsaySorry():print('跑一圈')time.sleep(1)if__name__=="__main__"
系統 2019-09-27 17:52:32 1965
一、定義函數def函數名():函數體代碼例:#定義函數defemail():print('sendemail')#調用執行函數email()二、函數的返回值defemail():print("sendemail")return"發送成功"#沒有return,默認返回Noneret=email()#函數return后面是什么值,ret等于返回值print(ret)注意:一旦遇到return,函數內部return以下的代碼不再執行。三、函數的普通參數defem
系統 2019-09-27 17:51:12 1965
fromhttps://blog.csdn.net/mighty13/article/details/78147357Python處理時間和時間戳的內置模塊就有time,和datetime兩個,本文先說time模塊。關于時間戳的幾個概念時間戳,根據1970年1月1日00:00:00開始按秒計算的偏移量。時間元組(struct_time),包含9個元素。time.struct_time(tm_year=2017,tm_mon=10,tm_mday=1,tm_
系統 2019-09-27 17:50:56 1965