一、字符編碼簡史:美國:1963年ASCII(包含127個字符占1個字節(jié))中國:1980年GB2312(收錄7445個漢字,包括6763個漢字和682個其它符號)1993年GB13000(收錄20902個漢字)1995年GBK1.0(收錄21003個漢字)2000年GB18030(收錄70244個漢字)世界:1991年unicode(‘萬國碼'也就統(tǒng)一編碼,通常占2字節(jié),復(fù)雜的漢字占4字節(jié))UTF-8(可變長的字符編碼)二、python中的編碼解碼應(yīng)用Py
系統(tǒng) 2019-09-27 17:53:49 1938
代碼如下所示:#-*-coding:-*-importioLIMIT=150000file_count=0url_list=[]withio.open('D:\DB_NEW_bak\DB_NEW_20171009_bak.sql','r',encoding='utf-16')asf:forlineinf:url_list.append(line)iflen(url_list)
系統(tǒng) 2019-09-27 17:53:40 1938
divmod(a,b)函數(shù)中文說明:divmod(a,b)方法返回的是a//b(除法取整)以及a對b的余數(shù)返回結(jié)果類型為tuple參數(shù):a,b可以為數(shù)字(包括復(fù)數(shù))版本:在python2.3版本之前不允許處理復(fù)數(shù),這個大家要注意一下英文說明:Taketwo(noncomplex)numbersasargumentsandreturnapairofnumbersconsistingoftheirquotientandremainderwhenusinglon
系統(tǒng) 2019-09-27 17:53:37 1938
在之前學(xué)習(xí)的RDD和DataFrame數(shù)據(jù)集主要處理的是離線數(shù)據(jù),隨著時代發(fā)展進(jìn)步,我們會發(fā)現(xiàn)越來越多數(shù)據(jù)是在源源不斷發(fā)回到數(shù)據(jù)中心,同時需要立刻響應(yīng)給用戶,這樣的情況我們就會用到實(shí)時處理,常用的場景有實(shí)時顯示某商場一小時人流密度、實(shí)時顯示當(dāng)天火車站人口總數(shù)等等。接下來從實(shí)時數(shù)據(jù)源說起,實(shí)時數(shù)據(jù)源主要有:FileSourceSocketSourceFlumeSourceKafkaSourceFileSource指的是文件作為數(shù)據(jù)來源,常用的有本地文件fil
系統(tǒng) 2019-09-27 17:52:32 1938
print("我想打印一個字符串%s"%123)print("我想打印一個字符串",123)print("我想打印一個字符串{}".format(123))這三個輸出有什么區(qū)別喃?Python中一個數(shù)據(jù)是否可以迭代(能否使用For)isinstance(需要判斷的數(shù)據(jù),Iterable)查看返回值,true則可以迭代,false不能迭代。如果創(chuàng)建一個可以迭代的對象?必須實(shí)現(xiàn)__iter__()方法在__iter__方法中需要返回一個具有__iter__方法
系統(tǒng) 2019-09-27 17:52:09 1938
python安裝教程,分享給大家。一、安裝python1、首先進(jìn)入網(wǎng)站下載:點(diǎn)擊打開鏈接(或自己輸入網(wǎng)址),進(jìn)入之后如下圖,選擇圖中紅色圈中區(qū)域進(jìn)行下載。2、下載完成后如下圖所示3、雙擊exe文件進(jìn)行安裝,如下圖,并按照圈中區(qū)域進(jìn)行設(shè)置,切記要勾選打鉤的框,然后再點(diǎn)擊Customizeinstallation進(jìn)入到下一步:4、對于上圖中,可以通過Browse進(jìn)行自定義安裝路徑,也可以直接點(diǎn)擊Install進(jìn)行安裝,點(diǎn)擊install后便可以完成安裝了。5、
系統(tǒng) 2019-09-27 17:51:44 1938
Python中的上下文管理器withexpression[astarget]:with-body上下文管理器是為with語句而生。只要實(shí)現(xiàn)了上下文管理器協(xié)議__enter__與__exit__,就可以使用with語句。__enter__通常執(zhí)行一些初始化操作,并且該函數(shù)的返回值會賦值給可選的astarget中的target變量。__exit__執(zhí)行資源清理工作。它接收三個參數(shù),異常類型,異常實(shí)例,和異常棧,根據(jù)這些異常信息,__exit__可以選擇進(jìn)行相應(yīng)
系統(tǒng) 2019-09-27 17:51:21 1938
本篇文章介紹如何使用xlrd來讀取Excel表格中的內(nèi)容,xlrd是第三方庫,所以在使用前我們需要安裝xlrd。另外我們一般會使用xlwt來寫Excel,所以下一篇文章我們會來介紹如何使用xlwt來寫Excel。xlrd下載:xlrd0.8.0安裝xlrd安裝xlrd,只需運(yùn)行setup即可,另外你也可以直接解壓縮到你的project中,也可以直接用xlrd的API獲取Excel,這里稱之為workbook復(fù)制代碼代碼如下:open_workbook(fi
系統(tǒng) 2019-09-27 17:51:03 1938
計(jì)算機(jī)之所以能做很多自動化的任務(wù),因?yàn)樗梢宰约鹤鰲l件判斷。比如,輸入用戶年齡,根據(jù)年齡打印不同的內(nèi)容,在Python程序中,可以用if語句實(shí)現(xiàn):age=20ifage>=18:print'yourageis',ageprint'adult'print'END'注意:==Python代碼的縮進(jìn)規(guī)則==。具有相同縮進(jìn)的代碼被視為代碼塊,上面的3,4行print語句就構(gòu)成一個代碼塊(但不包括第5行的print)。如果if語句判斷為True,就會執(zhí)行這個代碼塊。
系統(tǒng) 2019-09-27 17:51:01 1938
Python這門解釋性語言也有專門的線程模型,Python虛擬機(jī)使用GIL(GlobalInterpreterLock,全局解釋器鎖)來互斥線程對共享資源的訪問,但暫時無法利用多處理器的優(yōu)勢。在Python中我們主要是通過thread和threading這兩個模塊來實(shí)現(xiàn)的,其中Python的threading模塊是對thread做了一些包裝的,可以更加方便的被使用,所以我們使用threading模塊實(shí)現(xiàn)多線程編程。這篇文章我們主要來看看Python對多線程
系統(tǒng) 2019-09-27 17:50:59 1938