問題提出:有時候我們采集網頁,處理完畢后將字符串保存到文件或者寫入數據庫,這時候需要制定字符串的編碼,如果采集網頁的編碼是gb2312,而我們的數據庫是utf-8的,這樣不做任何處理直接插入數據庫可能會亂碼(沒測試過,不知道數據庫會不會自動轉碼),我們需要手動將gb2312轉換成utf-8。首先我們知道,python里的字符默認是ascii碼,英文當然沒問題啦,碰到中文的時候立馬給跪。不知道你還記不記得,python里打印中文漢字的時候需要在字符串前面加u
系統 2019-09-27 17:48:17 1898
2019中國好聲音火熱開播,作為一名“假粉絲”,這一季每一期都刷過了,尤其剛播出的第六期開始正式的battle。視頻視頻看完了,那看下大家都是怎樣評論的。1.網頁分析部分本文爬取的是騰訊視頻評論,第六期的評論地址是:http://coral.qq.com/4093121984每頁有10條評論,點擊“查看更多評論”,可將新的評論加載進來,通過多次加載,可以發現我們要找的評論就在以v2開頭的js類型的響應中。請求為GET請求,地址是http://coral.q
系統 2019-09-27 17:48:03 1898
背景最近在計劃明年從北京rebase到深圳去,所以最近在看深圳的各個方面。去年在深圳呆過一段時間,印象最深的是,深圳總是突然就下雨,還下好大的雨。對于我這種從小在南方長大但是后面又在北京呆了2年多的人來說,熟悉而又無奈。今天早上本來想隨便瀏覽瀏覽一個天氣網站,看看深圳的歷史天氣如何的,但是,一不小心發現,這家網站竟然直接能用API來抓數據,這~~~還不抓一波,省的自己一個月一個月地看。先上最后的效果圖:所有的code都在我的GitHub上:boydfd下面
系統 2019-09-27 17:47:57 1898
身體是革命的本錢,身體健康了我們才有更多精力做自己想做的事情,追求女神,追求夢想。然而程序員是一個苦比的職業,大部分時間都對著電腦,我現在頸椎就不好了,有時候眼睛還疼,我還沒20阿,傷心...于是乎寫了一個小程序,指定時間會打開瀏覽器播放一段音樂,提醒我們休息一會兒,防止我們猝死,說多了都是淚。較基礎,適合python新手及對python感興趣的同學閱讀。我們來理一遍這個程序,大概功能是:我們設置一個時間,時間到了以后會打開瀏覽器播放一段音頻。1。等待2。
系統 2019-09-27 17:47:25 1898
本文講述了一個python查找webshell腳本的代碼,除了查找webshell功能之外還具有白名單功能,以及發現惡意代碼發送郵件報警等功能,感興趣的朋友可以自己測試一下看看效果。具體的功能代碼如下:#!/usr/bin/envpython#-*-coding:utf-8-*-importosimportsysimportreimportsmtplib#設定郵件fromaddr="smtp.qq.com"toaddrs=["voilet@qq.com"]
系統 2019-09-27 17:47:03 1898
truncate()方法截斷該文件的大小。如果可選的尺寸參數存在,該文件被截斷(最多)的大小。大小默認為當前位置。當前文件位置不改變。注意,如果一個指定的大小超過了文件的當前大小,其結果是依賴于平臺。注意:此方法不會在當文件工作在只讀模式打開。語法以下是truncate()方法的語法:fileObject.truncate([size])參數size--如果可選參數存在,文件被截斷(最多)的大小。返回值此方法不返回任何值。例子下面的例子顯示truncate
系統 2019-09-27 17:46:23 1898
Python的MySQLdb模塊是Python連接MySQL的一個模塊,默認查詢結果返回是tuple類型,只能通過0,1..等索引下標訪問數據默認連接數據庫:復制代碼代碼如下:MySQLdb.connect(host=host,user=user,passwd=passwd,db=db,port=port,charset='utf8')查詢數據:復制代碼代碼如下:cur=conn.cursor()cur.execute('selectb_idfromblo
系統 2019-09-27 17:46:17 1898
django使用app機制來實現組件的重用,充分的利用已有的app可以極大的簡化開發工作。目前django下的app雖然還不夠豐富,卻也還是有部分不錯的。django-tagging就是一個不錯的app。現在tag的應用非常廣泛,tag基本上成了各網站的必備項目之一,django-tagging就是一個提供tag功能的app。django-tagging提供的功能非常豐富,使用起來卻十分簡單。下面我就介紹一些常用的用法,讓大家對該app有個基本的了解,更詳
系統 2019-09-27 17:46:09 1898
很多時候我們需要過濾掉標點符號等特殊字符,網上雖然有一堆的方法,但是都沒有找到一個非常滿意的,有些過濾不了中文的標點符號,有些過濾不了英文的標點符號,有些過濾不全。最后通過查看正則表達式文檔,發現一個高效的辦法,一行代碼就能搞定:defreplace_all_blank(value):"""去除value中的所有非字母內容,包括標點符號、空格、換行、下劃線等:paramvalue:需要處理的內容:return:返回處理后的內容"""#\W表示匹配非數字字母
系統 2019-09-27 17:46:03 1898
Python引入了一個機制:引用計數。引用計數python內部使用引用計數,來保持追蹤內存中的對象,Python內部記錄了對象有多少個引用,即引用計數,當對象被創建時就創建了一個引用計數,當對象不再需要時,這個對象的引用計數為0時,它被垃圾回收。總結一下對象會在一下情況下引用計數加1:1.對象被創建:x=42.另外的別人被創建:y=x3.被作為參數傳遞給函數:foo(x)4.作為容器對象的一個元素:a=[1,x,'33']引用計數減少情況1.一個本地引用離
系統 2019-09-27 17:45:58 1898
本文實例講述了Python中__call__的用法,分享給大家供大家參考之用。具體方法如下:先來看看如下示例代碼:#call.py一個class被載入的情況下。classNext:List=[]def__init__(self,low,high):forNuminrange(low,high):self.List.append(Num**2)def__call__(self,Nu):returnself.List[Nu]如果這樣使用:b=Next(1,7)
系統 2019-09-27 17:45:55 1898
C語言中三目運算符復制代碼代碼如下:expression?expr1:expr2;//expression為真則取表達式expr1的值,否則取expr2的值python三目實現方法:(1)expr=判斷表達式andexpr1orexpr2判斷表達式為真,此時如果expr1為真則expr=expr1,為假則變成Falseorexpr2,expr=expr2.判斷表達式為假,則演變成Falseorexpr2,此時expr=expr2.只要表達式expr1,ex
系統 2019-09-27 17:45:34 1898
本文實例為大家分享了pythonopenCV獲取人臉部分并存儲的具體代碼,供大家參考,具體內容如下#-*-coding:utf-8-*-importcv2importosimporttimeimportbase64importnumpyasnpsave_path='E:\\opencv\\2018-04-24OpenCv\\RAR\\savetest'faceCascade=cv2.CascadeClassifier('./haarcascade_fron
系統 2019-09-27 17:45:26 1898
在業務穩定性要求比較高的情況下,運維為能及時發現問題,有時需要對應用程序的日志進行實時分析,當符合某個條件時就立刻報警,而不是被動等待出問題后去解決,比如要監控nginx的$request_time和$upstream_response_time時間,分析出最耗時的請求,然后去改進代碼,這時就要對日志進行實時分析了,發現時間長的語句就要報警出來,提醒開發人員要關注,當然這是其中一個應用場景,通過這種監控方式還可以應用到任何需要判斷或分析文件的地方,所以今天
系統 2019-09-27 17:38:40 1898
字符串中字符大小寫的變換1.str.lower()//小寫>>>'SkatE'.lower()'skate'2.str.upper()//大寫>>>'SkatE'.upper()'SKATE'3.str.swapcase()//大小寫互換>>>'SkatE'.swapcase()'sKATe'4.str.title()//首字母大寫,其余的小寫>>>'SkatE'.title()'Skate'字符串在輸出時的對齊1.str.ljust(width,[fil
系統 2019-09-27 17:38:38 1898