之前想爬取一些淘寶的數據,后來發現需要登錄,找了很多的資料,有個使用request的sessions加上cookie來登錄的,cookie的獲取在登錄后使用開發者工具可以找到。不過這個登錄后獲得的網頁的代碼是靜態的,獲取動態網頁還得另尋他法,一般需要的數據可以在網頁的源碼中得到,但是你知道的,有些動態加載的就不是那么簡單了,而且我發現這樣獲得的源碼中,有些想要獲取的數據的格式是經過改動的,比如我要某個商品的具體鏈接,發現并不能直接使用。總體而言,這是一次失
系統 2019-09-27 17:54:47 1936
創建列表復制代碼代碼如下:sample_list=['a',1,('a','b')]Python列表操作復制代碼代碼如下:sample_list=['a','b',0,1,3]得到列表中的某一個值復制代碼代碼如下:value_start=sample_list[0]end_value=sample_list[-1]刪除列表的第一個值復制代碼代碼如下:delsample_list[0]在列表中插入一個值復制代碼代碼如下:sample_list[0:0]=['
系統 2019-09-27 17:53:48 1936
enumerate函數用于遍歷序列中的元素以及它們的下標。enumerate函數說明:函數原型:enumerate(sequence,[start=0])功能:將可循環序列sequence以start開始分別列出序列數據和數據下標即對一個可遍歷的數據對象(如列表、元組或字符串),enumerate會將該數據對象組合為一個索引序列,同時列出數據和數據下標。舉例說明:存在一個sequence,對其使用enumerate將會得到如下結果:startsequenc
系統 2019-09-27 17:53:38 1936
Python中,隊列是線程間最常用的交換數據的形式。Queue模塊是提供隊列操作的模塊,雖然簡單易用,但是不小心的話,還是會出現一些意外。創建一個“隊列”對象importQueueq=Queue.Queue(maxsize=10)Queue.Queue類即是一個隊列的同步實現。隊列長度可為無限或者有限??赏ㄟ^Queue的構造函數的可選參數maxsize來設定隊列長度。如果maxsize小于1就表示隊列長度無限。將一個值放入隊列中q.put(10)調用隊列對
系統 2019-09-27 17:53:36 1936
Python面向對象編程——異常處理一、什么是異常異常就是程序運行時發生錯誤的信號(在程序出現錯誤時,則會產生一個異常,若程序沒有處理它,則會拋出該異常,程序的運行也隨之終止),在python中,錯誤觸發的異常如下:而錯誤分成兩種1、語法錯誤(這種錯誤,根本過不了python解釋器的語法檢測,必須在程序執行前就改正)#語法錯誤示范一if#語法錯誤示范二deftest:pass#語法錯誤示范三classFoopass#語法錯誤示范四print(haha)2、
系統 2019-09-27 17:53:13 1936
如下所示:#coding:utf-8importbinasciia='worker'#先把worker轉換成二進制數據然后在用十六進制表示b=binascii.b2a_hex(a)printb#與b2a_hex相反printbinascii.a2b_hex(b)#這個功能和b2a_hex()一樣c=binascii.hexlify(a)printc#這個功能和a2b_hex()一樣printbinascii.unhexlify(c)######運行結果##
系統 2019-09-27 17:52:56 1936
在學習過程中,把開發過程中重要的一些內容備份一下,下面內容是關于python實現中文繁體和中文簡體之間的相互轉換的內容,應該是對碼農們有所好處。#轉換繁體到簡體line=Converter('zh-hans').convert(line.decode('utf-8'))line=line.encode('utf-8')#轉換簡體到繁體line=Converter('zh-hant').convert(line.decode('utf-8'))line=li
系統 2019-09-27 17:52:50 1936
3.4.5斷言斷言(assertions)的使用方式類似于if語句,只是在不滿足條件時,會直接拋出異常。類似于下面的if語句(偽代碼)ifnotcondition:#如果不滿足條件,會直接拋出異常,程序會中斷crashprogram那么究竟為什么需要這樣的代碼呢?主要原因為需要檢測程序在某個地方是否滿足條件,如果不滿足條件,應該及時通知開發人員,而不是將這些bug隱藏起來,知道關鍵的時候在崩潰。其實在TDD中經常使用斷言,TDD會在程序發現異常時執行斷言,
系統 2019-09-27 17:52:20 1936
#下載一個網頁importrequestsimportreurl='https://www.biquge5200.cc/14_14621/'#模擬瀏覽器發送http請求response=requests.get(url)#編碼方式response.encoding='utf-8',如果下載下來的網頁內容有中文亂碼現象就需要加上這一句話#網頁源碼html=response.text#[0]取列表下第0個元素.#eg:title的輸出結果為:['斗神狂飆無彈窗
系統 2019-09-27 17:52:18 1936
walker經常用到當前時間和相對時間,用來統計程序執行的效率,簡單記一下,便于copy。相對時間>>>importtime#相對時間>>>startTime=time.time()>>>'%.2fs'%(time.time()-startTime)'24.51s'格式化當前時間#格式化當前時間>>>time.strftime('%Y-%m-%d%H:%M:%S',time.localtime())'2016-01-0510:34:06'時間戳與時間的轉換
系統 2019-09-27 17:50:52 1936