下面是split截取獲得>>>str='http://manualfile.s3.amazonaws.com/pdf/gti-chis-1-user-9fb-0-7a05a56f0b91.pdf'>>>printstr.split()['http://manualfile.s3.amazonaws.com/pdf/gti-chis-1-user-9fb-0-7a05a56f0b91.pdf']>>>printstr.split('/')['http:','
系統(tǒng) 2019-09-27 17:48:21 1955
問(wèn)題提出:有時(shí)候我們采集網(wǎng)頁(yè),處理完畢后將字符串保存到文件或者寫(xiě)入數(shù)據(jù)庫(kù),這時(shí)候需要制定字符串的編碼,如果采集網(wǎng)頁(yè)的編碼是gb2312,而我們的數(shù)據(jù)庫(kù)是utf-8的,這樣不做任何處理直接插入數(shù)據(jù)庫(kù)可能會(huì)亂碼(沒(méi)測(cè)試過(guò),不知道數(shù)據(jù)庫(kù)會(huì)不會(huì)自動(dòng)轉(zhuǎn)碼),我們需要手動(dòng)將gb2312轉(zhuǎn)換成utf-8。首先我們知道,python里的字符默認(rèn)是ascii碼,英文當(dāng)然沒(méi)問(wèn)題啦,碰到中文的時(shí)候立馬給跪。不知道你還記不記得,python里打印中文漢字的時(shí)候需要在字符串前面加u
系統(tǒng) 2019-09-27 17:48:17 1955
0x00:使用xpath進(jìn)行網(wǎng)頁(yè)解析#coding:utf-8importrequestsimportosimportrefromlxmlimportetreeimporttimedefget_title(title):#獲取標(biāo)題,創(chuàng)建文件path=r"./Pic/"+titleifos.path.exists(path):#文件夾存在,返回returnpathelse:os.makedirs(path)#創(chuàng)建空文件夾returnpathdefpic_ge
系統(tǒng) 2019-09-27 17:48:14 1955
API:statuses/public_timeline返回最新的200條公共微博,返回結(jié)果非完全實(shí)時(shí)CODE:#!/usr/bin/python#-*-coding:utf-8-*-'''Createdon2014-7-3@author:guaguastd@name:statuses_public_timeline.py'''defpublic_timeline(weibo_api,count):#public_timeline=weibo_api.st
系統(tǒng) 2019-09-27 17:48:06 1955
最近開(kāi)發(fā)Erlang,對(duì)其字符串處理能力無(wú)言至極,于是決定把它和python聯(lián)合起來(lái),打造一個(gè)強(qiáng)力的分布式系統(tǒng),等將來(lái)需要系統(tǒng)級(jí)開(kāi)發(fā)時(shí),我再把C++/C組合進(jìn)來(lái).首先參考了Erlang官方文檔和http://blog.developers.api.sina.com.cn/?tag=erlang以及http://kazmier.net/computer/port-howto/.研讀了將近24個(gè)小時(shí),才終于完全把問(wèn)題解決.起名為town,town在英文里表示集
系統(tǒng) 2019-09-27 17:48:01 1955
題目描述請(qǐng)實(shí)現(xiàn)一個(gè)函數(shù)用來(lái)找出字符流中第一個(gè)只出現(xiàn)一次的字符。例如,當(dāng)從字符流中只讀出前兩個(gè)字符"go"時(shí),第一個(gè)只出現(xiàn)一次的字符是"g"。當(dāng)從該字符流中讀出前六個(gè)字符“google"時(shí),第一個(gè)只出現(xiàn)一次的字符是"l"。輸出描述:如果當(dāng)前字符流沒(méi)有存在出現(xiàn)一次的字符,返回#字符。思路用兩個(gè)列表,一個(gè)用來(lái)保存所有的字符,一個(gè)用來(lái)保存只出現(xiàn)一次的字符,算法#-*-coding:utf-8-*-classSolution:#返回對(duì)應(yīng)chardef__init__
系統(tǒng) 2019-09-27 17:47:35 1955
1、介紹itertools是python的迭代器模塊,itertools提供的工具相當(dāng)高效且節(jié)省內(nèi)存。使用這些工具,你將能夠創(chuàng)建自己定制的迭代器用于高效率的循環(huán)。-無(wú)限迭代器itertools包自帶了三個(gè)可以無(wú)限迭代的迭代器。這意味著,當(dāng)你使用他們時(shí),你要知道要的到底是最終會(huì)停止的迭代器,還是需要無(wú)限地迭代鞋去。(1)count(初值=0,步長(zhǎng)=1):count迭代器會(huì)返回從傳入的起始參數(shù)開(kāi)始的均勻間隔的數(shù)值。count也可以接收指定的步長(zhǎng)參數(shù)。我們來(lái)看一
系統(tǒng) 2019-09-27 17:47:20 1955
read()方法讀取文件size個(gè)字節(jié)大小。如果讀取命中獲得EOF大小字節(jié)之前,那么它只能讀取可用的字節(jié)。語(yǔ)法以下是read()方法的語(yǔ)法:fileObject.read(size);參數(shù)size--這是可以從文件中讀取的字節(jié)數(shù)。返回值此方法返回讀取字符串中的字節(jié)數(shù)。例子下面的例子顯示了read()方法的使用。#!/usr/bin/python#Openafilefo=open("foo.txt","rw+")print"Nameofthefile:",f
系統(tǒng) 2019-09-27 17:46:26 1955
用于記錄自己寫(xiě)的,或?qū)W習(xí)期間看到的不錯(cuò)的,小程序,持續(xù)更新......****************************************************************【例001】計(jì)算:1-2+3-4..+199-200值復(fù)制代碼代碼如下:#encoding=utf-8#計(jì)算1-2+3-4..+199-200值#1+3+5+7+...199#-2-4-6...-200sum1=0sum2=0foriinrange(1,200,
系統(tǒng) 2019-09-27 17:46:02 1955
一、枚舉與字典類型字典類型的缺點(diǎn):1.值可變2.沒(méi)有防止相同標(biāo)簽的功能枚舉的特點(diǎn):1.枚舉類的值不可以被外界更改2.不能存在相同的標(biāo)簽,但允許不同標(biāo)簽存在相同的枚舉值,即后者相當(dāng)于前者的別名3.枚舉值可以是任意類型4.枚舉標(biāo)簽盡量用大寫(xiě)fromenumimportEnum#普通類classdict():green=1green=2red=3dict.red=4print(dict.red)>>>4classVIP(Enum):RED=1GREEN=2YEL
系統(tǒng) 2019-09-27 17:45:52 1955