爬蟲即網絡爬蟲,英文是WebSpider。翻譯過來就是網絡上爬行的蜘蛛,如果把互聯網看作一張大網,那么爬蟲就是在大網上爬來爬去的蜘蛛,碰到想要的食物,就把他抓取出來。我們在瀏覽器中輸入一個網址,敲擊回車,看到網站的頁面信息。這就是瀏覽器請求了網站的服務器,獲取到網絡資源。那么,爬蟲也相當于模擬瀏覽器發送請求,獲得到HTML代碼。HTML代碼里通常包含了標簽和文字信息,我們就從中提取到我們想要的信息。通常爬蟲是從某個網站的某個頁面開始,爬取這個頁面的內容,找
系統 2019-09-27 17:51:07 1611
之前學習C語言的時候,語法之類的都不是很懂,但是已經知道3個情況---流程1.順序編寫(一步一步下去)執行按照上到下;2.判斷編寫。(就是如果符合什么條件,就做什么。。。。)3.循環編寫。(符合特定條件,進行重復的事情)###到了python,我們上一個課,說了if,這里說循環;你不是要問順序不說嗎?自己腦補一下(不需要理會任何條件的,一個個代碼執行下去,不是順序?)for循環和while循環--------------------------------
系統 2019-09-27 17:51:03 1611
計算機之所以能做很多自動化的任務,因為它可以自己做條件判斷。比如,輸入用戶年齡,根據年齡打印不同的內容,在Python程序中,可以用if語句實現:age=20ifage>=18:print'yourageis',ageprint'adult'print'END'注意:==Python代碼的縮進規則==。具有相同縮進的代碼被視為代碼塊,上面的3,4行print語句就構成一個代碼塊(但不包括第5行的print)。如果if語句判斷為True,就會執行這個代碼塊。
系統 2019-09-27 17:51:01 1611
Python這門解釋性語言也有專門的線程模型,Python虛擬機使用GIL(GlobalInterpreterLock,全局解釋器鎖)來互斥線程對共享資源的訪問,但暫時無法利用多處理器的優勢。在Python中我們主要是通過thread和threading這兩個模塊來實現的,其中Python的threading模塊是對thread做了一些包裝的,可以更加方便的被使用,所以我們使用threading模塊實現多線程編程。這篇文章我們主要來看看Python對多線程
系統 2019-09-27 17:50:59 1611
lxml是python的一個解析庫,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高XPath,全稱XMLPathLanguage,即XML路徑語言,它是一門在XML文檔中查找信息的語言,它最初是用來搜尋XML文檔的,但是它同樣適用于HTML文檔的搜索XPath的選擇功能十分強大,它提供了非常簡明的路徑選擇表達式,另外,它還提供了超過100個內建函數,用于字符串、數值、時間的匹配以及節點、序列的處理等,幾乎所有我們想要定位的節點,都可
系統 2019-09-27 17:50:58 1611
time庫是Python中處理時間的標準庫計算機時間的表達提供獲取系統時間并格式化輸出功能提供系統級精確計時功能,用于程序性能分析time庫包括三類函數時間獲取:time()ctime()gmtime()時間格式化:strftime(0strptime()程序計時:sleep(),perf_counter()時間獲取time()獲取當前時間戳,即計算機內部時間值,浮點數importtimetime.time();#運行結果#1568855802.08770
系統 2019-09-27 17:50:57 1611
Python:1.print()函數:打印字符串2.raw_input()函數:從用戶鍵盤捕獲字符3.len()函數:計算字符長度4.format(12.3654,'6.2f'/'0.3%')函數:實現格式化輸出5.type()函數:查詢對象的類型6.int()函數、float()函數、str()函數等:類型的轉化函數7.id()函數:獲取對象的內存地址8.help()函數:Python的幫助函數9.s.islower()函數:判斷字符小寫10.s.spp
系統 2019-09-27 17:50:54 1611
首先globals()和locals()是作用于作用域下的內置函數,所以我將它們分為作用域類型的內置函數1.作用域相關:1)globals()#返回全局作用域中的所有名字2)locals()#返回本地作用域中的所有名字可能對于這個作用域相關的內置函數,大家一接觸都會很懵,這個東西是干什么的?它怎么用?今天小編就給大家來解釋一下,首先我們來先看下官方的解釋:globals()——獲取全局變量的字典locals()——獲取執行本方法所在命名空間內的局部變量的字
系統 2019-09-27 17:50:51 1611
Python窗體輸入、展示并存儲數據利用python的tkinter進行窗體開發,可以實現輸入框,以及利用get函數獲取輸入框的數據,并將這些數據存儲到本地,如果利用數據庫,也可以把窗體獲取的數據導入到數據庫中fromtkinterimport*importtkinter.messageboxasmessageboxroot=Tk()root.title("信息輸入框")root.geometry('300x300')input1=Label(root,t
系統 2019-09-27 17:50:46 1611
1.今日內容1.1函數的參數*的魔性用法函數形參最終順序1.2名稱空間全局名稱空間,局部名稱空間,內置名稱空間取值順序與加載順序作用域內置函數:globals()locals()1.3高階函數(函數的嵌套)1.4關鍵字:globalnonlocal2.內容詳細2.1函數的參數昨天我們從形參角度,講了兩種參數,一個是位置參數,位置參數主要是實參與形參從左至右一一對應,一個是默認值參數,默認值參數,如果實參不傳參,則形參使用默認參數。那么無論是位置參數,還是默
系統 2019-09-27 17:50:44 1611