GBDT,梯度提升樹屬于一種有監督的集成學習方法,與之前學習的監督算法類似,同樣可以用于分類問題的識別和預測問題的解決。該集成算法體現了三個方面的又是,分別是提升Boosting、梯度Gradient、決策樹DecisionTree。“提升”是指將多個弱分類器通過線下組合實現強分類器的過程;“梯度”指的是在Boosting過程中求解損失函數時增加了靈活性和便捷性,“決策樹”是指算法所使用的弱分類器為CART決策樹,該決策樹具有簡單直觀、通俗易懂的特性。GB
系統 2019-09-27 17:53:34 2717
最近在做python的web開發(原諒我的多變,好東西總想都學著。。。node.js也是),不過過程中總遇到些問題,不管是web.py還是django,開發起來確實沒用php方便,畢竟存在的時間比較短,很多不完善的地方。比如我在調試php中最常用的函數,var_dump,在python里找不到合適的替代函數。php中var_dump是一個特別有用的函數,它可以輸出任何變量的值,不管你是一個對象還是一個數組,或者只是一個數。它總能用友好的方式輸出,我調試的時
系統 2019-09-27 17:52:52 2717
提高性能有如下方法1、Cython,用于合并python和c語言靜態編譯泛型2、IPython.parallel,用于在本地或者集群上并行執行代碼3、numexpr,用于快速數值運算4、multiprocessing,python內建的并行處理模塊5、Numba,用于為cpu動態編譯python代碼6、NumbaPro,用于為多核cpu和gpu動態編譯python代碼為了驗證相同算法在上面不同實現上的的性能差異,我們先定義一個測試性能的函數defperf_
系統 2019-09-27 17:55:29 2716
蘇寧的爬取和京東的爬取是一樣的,方法類似這是爬取京東的例子:https://blog.csdn.net/Dream____Fly/article/details/99698222現在分析蘇寧的首頁,這個頁面還算比較這個很容易獲取,獲取之后在前面拼接https就行了到這里就可以看代碼操作了:importrequestsfrombs4importBeautifulSoupheaders={'User-Agent':'Mozilla/5.0(WindowsNT1
系統 2019-09-27 17:53:18 2716
image前言學過Python數據分析的朋友都知道,在可視化的工具中,有很多優秀的三方庫,比如matplotlib,seaborn,plotly,Boken,pyecharts等等。這些可視化庫都有自己的特點,在實際應用中也廣為大家使用。plotly、Boken等都是交互式的可視化工具,結合Jupyternotebook可以非常靈活方便地展現分析后的結果。雖然做出的效果非常的炫酷,比如plotly,但是每一次都需要寫很長的代碼,一是麻煩,二是不便于維護。我
系統 2019-09-27 17:51:06 2716
我終于從武漢回來了,又困又累,兩天來每天8小時睡眠,確實是耽誤了博客進度,傷心的是我曬黑了,所以今天才想起來更新博客。I.我最喜愛的python集成開發環境我用過的python集成開發環境有pycharm,visualstudio,eclipse+pydev,Eric,spyder,Ipython和vscode,碼到這兒我笑了,因為那個集成開發環境太多了,每個人都有自己的習慣,都有自己喜愛的IDE,不需要我推薦的。寫這篇博客完全是為了強推我的女神級IDE:
系統 2019-09-27 17:57:18 2714
1.幀差法原理移動偵測即是根據視頻每幀或者幾幀之間像素的差異,對差異值設置閾值,篩選大于閾值的像素點,做掩模圖即可選出視頻中存在變化的楨。幀差法較為簡單的視頻中物體移動偵測,幀差法分為:單幀差、兩楨差、和三楨差。隨著幀數的增加是防止檢測結果的重影。2.算法思路文章以截取視頻為例進行單幀差法移動偵測3.python實現代碼defthreh(video,save_video,thres1,area_threh):cam=cv2.VideoCapture(vid
系統 2019-09-27 17:48:28 2714
Python中的用于加密的函數位于hashlib,hmac模塊中,均為內置模塊。importhashlibimporthmachashlib模塊實現了md5,sha1,sha224,sha256,sha384,sha512等算法,可以通過hashlib.algorithms_available查看>>>importhashlib>>>hashlib.algorithms_available{'sha3_384','sha1','blake2s','dsaE
系統 2019-09-27 17:55:50 2713
fromCrypto.CipherimportAESfrombinasciiimportb2a_hex,a2b_hexclassAES_enc():def__init__(self,key,iv):self.block_size=AES.block_size#設置block_size的大小為16字節,也就是128位self.key=keyself.iv=ivself.mode=AES.MODE_CBC#采用CBC模式#加密時自動補全16位,填充內容是“16
系統 2019-09-27 17:55:13 2713
學習Python不久碰到過這個問題,記得當時沒查出是什么問題.剛剛無意中發現了這個問題的原因及解決方案,記錄一下.參考:https://juejin.im/post/5bc2bd3a5188255c94465d31第一種情況參考文章中介紹說產生這個問題的原因是因為創建了自定義的Logger對象后,又使用了logging中的日志輸出方法,這些方法使用的是默認配置的Logger對象,導致之后輸出的日志信息會重復。示例代碼:importlogging#日志管理l
系統 2019-09-27 17:50:07 2713
word2vec介紹word2vec官網:https://code.google.com/p/word2vec/word2vec是google的一個開源工具,能夠根據輸入的詞的集合計算出詞與詞之間的距離。它將term轉換成向量形式,可以把對文本內容的處理簡化為向量空間中的向量運算,計算出向量空間上的相似度,來表示文本語義上的相似度。word2vec計算的是余弦值,距離范圍為0-1之間,值越大代表兩個詞關聯度越高。詞向量:用DistributedRepres
系統 2019-09-27 17:48:08 2712
https://www.toutiao.com/a6697243469124993550/由于具備包括各種各樣的庫、社區等在內的多種特性,Python是目前最廣泛使用的語言之一。各種各樣的庫為神經網絡和深度學習的研究和開發提供了基礎的能力。這里我們列出七個最流行的Python神經網絡庫。TensorFlow:TensorFlow是一個開放源碼的軟件庫,具有靈活的體系結構使代碼能部署到一個或多個CPU或GPU,而無需重寫代碼。TensorFlow為C++、G
系統 2019-09-27 17:45:35 2712
如下所示:importrec=re.compile(r'\d')s='you1are2welcome'#用指定的內容,替換正則匹配的內容,也可以指定替換次數ret=c.sub('',s,1)print(ret)#處理函數接收一個參數(每次的匹配結果)defdeal(s):returnstr(int(s.group())*2)#可以認為干預替換過程,傳遞一個函數即可ret=re.sub(r'\d',deal,'you1are2welcome')print(r
系統 2019-09-27 17:47:07 2711
高級加密標準(英語:AdvancedEncryptionStandard,縮寫:AES),在密碼學中又稱Rijndael加密法,是美國聯邦政府采用的一種區塊加密標準。這個標準用來替代原先的DES,已經被多方分析且廣為全世界所使用。經過五年的甄選流程,高級加密標準由美國國家標準與技術研究院(NIST)于2001年11月26日發布于FIPSPUB197,并在2002年5月26日成為有效的標準。2006年,高級加密標準已然成為對稱密鑰加密中最流行的算法之一。--
系統 2019-09-27 17:56:50 2710
Python的兩種上傳圖片方式上傳至七牛云服務器上傳至自己服務器上傳至七牛云服務器代碼注釋寫的已經很清楚了,直接可以用access_key='替換成你的'#個人中心->密匙管理->SKsecret_key='替換成你的'#七牛空間名bucket_name='替換成你的'#臨時域名url='替換成你的'q=qiniu.Auth(access_key,secret_key)defqiniu_upload(key,localfile):token=q.uploa
系統 2019-09-27 17:47:29 2710