最簡(jiǎn)單的網(wǎng)頁(yè)取源(不用模擬瀏覽器的情況)1importrequests2defgetHTML(url):3try:4r=requests.get(url,timeout=30)5r.raise_for_status()6r.encoding='utf-8'7returnr.text8except:9return""10url="http://baidu.com"11print(getHTML(url))
系統(tǒng) 2019-09-27 17:50:19 1997
一、緣起前不久,我在翻譯GuidovanRossum(Python之父)的文章時(shí),給他留言,申請(qǐng)非商業(yè)用途的翻譯授權(quán)。過程中起了點(diǎn)小誤會(huì),略去不表,最終的結(jié)果是:他的文章以CCBY-NC-SA4.0許可協(xié)議進(jìn)行授權(quán)。部分對(duì)話如下:CC協(xié)議是一種授權(quán)許可協(xié)議,我曾看到過幾次,但了解不多,所以便查閱了相關(guān)的內(nèi)容。本文主要是作個(gè)記錄,既是加深自己的理解,也給有需要的同學(xué)一個(gè)參考。二、著作權(quán)、著佐權(quán)與自由版權(quán)對(duì)于知識(shí)產(chǎn)權(quán),通常有如下幾種說法:AllRightsRe
系統(tǒng) 2019-09-27 17:50:18 1997
Pandas類似R語言中的數(shù)據(jù)框(DataFrame),Pandas基于Numpy,但是對(duì)于數(shù)據(jù)框結(jié)構(gòu)的處理比Numpy要來的容易。1.Pandas的基本數(shù)據(jù)結(jié)構(gòu)和使用Pandas有兩個(gè)主要的數(shù)據(jù)結(jié)構(gòu):Series和DataFrame。Series類似Numpy中的一維數(shù)組,DataFrame則是使用較多的多維表格數(shù)據(jù)結(jié)構(gòu)。Series的創(chuàng)建>>>importnumpyasnp>>>importpandasaspd>>>s=pd.Series([1,2,3
系統(tǒng) 2019-09-27 17:50:11 1997
隨機(jī)森林算法python實(shí)現(xiàn)瞎BB代碼導(dǎo)入數(shù)據(jù)切分訓(xùn)練集測(cè)試集找到最有用的幾個(gè)屬性根據(jù)上面的代碼更改屬性參數(shù)組合遍歷找最優(yōu)隨機(jī)森林樣本數(shù)據(jù)瞎BB1.實(shí)現(xiàn)根據(jù)樣本數(shù)據(jù)(用眼距離distance、最長(zhǎng)持續(xù)用眼時(shí)長(zhǎng)duration、總用眼時(shí)長(zhǎng)total_time、戶外運(yùn)動(dòng)時(shí)長(zhǎng)outdoor、用眼角度angle、健康環(huán)境光照用眼比例proportion)判別是否需要近視預(yù)警2.樣本實(shí)在太少,結(jié)果還行,原理都是一樣的代碼導(dǎo)入數(shù)據(jù)importpandaspatient
系統(tǒng) 2019-09-27 17:50:08 1997
一、ConfigParser簡(jiǎn)介ConfigParser是用來讀取配置文件的包。配置文件的格式如下:中括號(hào)“[]”內(nèi)包含的為section。section下面為類似于key-value的配置內(nèi)容。復(fù)制代碼代碼如下:[db]db_host=127.0.0.1db_port=22db_user=rootdb_pass=rootroot[concurrent]thread=10processor=20中括號(hào)“[]”內(nèi)包含的為section。緊接著section為
系統(tǒng) 2019-09-27 17:50:05 1997
1.下載地址https://www.python.org/,目前版本是https://www.python.org/downloads/release/python-373/,https://www.python.org/downloads/release/python-2715/。2.依次完成v2版本和v3版本的安裝,安裝是勾選pip和安裝環(huán)境變量。3.進(jìn)入v2版本的安裝目錄,重命名python為python24.cmd進(jìn)入v2版本的scripts目錄,
系統(tǒng) 2019-09-27 17:49:49 1997
簡(jiǎn)單的說,Python是一個(gè)“優(yōu)雅”、“明確”、“簡(jiǎn)單”的編程語言。學(xué)習(xí)曲線低,非專業(yè)人士也能上手開源系統(tǒng),擁有強(qiáng)大的生態(tài)圈解釋型語言,完美的平臺(tái)可移植性支持面向?qū)ο蠛秃瘮?shù)式編程能夠通過調(diào)用C/C++代碼擴(kuò)展功能代碼規(guī)范程度高,可讀性強(qiáng)目前幾個(gè)比較流行的領(lǐng)域,Python都有用武之地。云基礎(chǔ)設(shè)施-Python/Java/GoDevOps-Python/Shell/Ruby/Go網(wǎng)絡(luò)爬蟲-Python/PHP/C++數(shù)據(jù)分析挖掘-Python/R/Scala
系統(tǒng) 2019-09-27 17:49:25 1997
Django里面集成了SQLite的數(shù)據(jù)庫(kù),對(duì)于初期研究來說,可以用這個(gè)學(xué)習(xí)。第一步,創(chuàng)建數(shù)據(jù)庫(kù)就涉及到建表等一系列的工作,在此之前,要先在cmd執(zhí)行一個(gè)命令:pythonmanage.pymigrate這個(gè)命令就看成一個(gè)打包安裝的命令,它會(huì)根據(jù)mysite/settings.py的配置安裝一系列必要的數(shù)據(jù)庫(kù)表第二步,我們要建立一個(gè)Model層,修改demo/model.py:fromdjango.dbimportmodelsclassQuestion(m
系統(tǒng) 2019-09-27 17:49:15 1997
本書特色在數(shù)據(jù)規(guī)模急速膨脹的大數(shù)據(jù)時(shí)代,數(shù)據(jù)挖掘這項(xiàng)甄別重要數(shù)據(jù)的核心技術(shù)正發(fā)揮越來越重要的作用。它將賦予你解決實(shí)際問題的“超能力”:預(yù)測(cè)體育賽事結(jié)果、精確投放廣告、根據(jù)作品的風(fēng)格解決作者歸屬問題,等等。本書使用簡(jiǎn)單易學(xué)且擁有豐富第三方庫(kù)和良好社區(qū)氛圍的Python語言,由淺入深,以真實(shí)數(shù)據(jù)作為研究對(duì)象,真刀實(shí)槍地向讀者介紹Python數(shù)據(jù)挖掘的實(shí)現(xiàn)方法。通過本書,讀者將邁入數(shù)據(jù)挖掘的殿堂,透徹理解數(shù)據(jù)挖掘基礎(chǔ)知識(shí),掌握解決數(shù)據(jù)挖掘?qū)嶋H問題的最佳實(shí)踐!理解
系統(tǒng) 2019-09-27 17:49:13 1997
詞云是一種非常漂亮的可視化展示方式,正所謂一圖勝過千言萬語,詞云在之前的項(xiàng)目中我也有過很多的使用,可能對(duì)于我來說,一種很好的自我介紹方式就是詞云吧,就像下面這樣的:個(gè)人覺還是會(huì)比枯燥的文字語言描述性的介紹會(huì)更吸引人一點(diǎn)吧。今天不是說要怎么用詞云來做個(gè)人介紹,而是對(duì)工作中使用到比較多的詞云計(jì)較做了一下總結(jié),主要是包括三個(gè)方面:1、諸如上面的簡(jiǎn)單形式矩形詞云2、基于背景圖片數(shù)據(jù)來構(gòu)建詞云數(shù)據(jù)3、某些場(chǎng)景下不想使用類似上面的默認(rèn)的字體顏色,這里可以自定義詞云的字
系統(tǒng) 2019-09-27 17:48:59 1997