今天接到一個新的任務,要對一個140多M的csv文件進行數據處理,總共有170多萬行,嘗試了導入本地的MySQL數據庫進行查詢,結果用Navicat導入直接卡死....估計是XAMPP套裝里面全默認配置的MySQL性能不給力,又嘗試用R搞一下吧結果發現光加載csv文件就要3分鐘左右的時間,相當不給力啊,翻了翻萬能的知乎發現了Python下的一個神器包:Pandas(熊貓們?),加載這個140多M的csv文件兩秒鐘就搞定,后面的分類匯總等操作也都是秒開,太牛
系統 2019-09-27 17:52:33 1947
1.常用模塊#連接數據庫connect()函數創建一個新的數據庫連接對話并返回一個新的連接實例對象PG_CONF_123={'user':'emma','port':123,'host':'192.168.1.123','password':'emma','database':'dbname'}conn=psycopg2.connect(**PG_CONF_123)#打開一個操作整個數據庫的光標連接對象可以創建光標用來執行SQL語句cur=conn.cur
系統 2019-09-27 17:52:21 1947
yield的功能類似于return,但是不同之處在于它返回的是生成器。生成器生成器是通過一個或多個yield表達式構成的函數,每一個生成器都是一個迭代器(但是迭代器不一定是生成器)。如果一個函數包含yield關鍵字,這個函數就會變為一個生成器。生成器并不會一次返回所有結果,而是每次遇到yield關鍵字后返回相應結果,并保留函數當前的運行狀態,等待下一次的調用。由于生成器也是一個迭代器,那么它就應該支持next方法來獲取下一個值。基本操作#通過`yield`
系統 2019-09-27 17:52:18 1947
BeautifulSoup基礎實戰安裝:pipinstallbeautifulsoup4常用指令:frombs4importBeautifulSoupasbsimporturllib.requestdata=urllib.request.urlopen("https://www.cnblogs.com/mcq1999/").read().decode("utf-8","ignore")bs1=bs(data)print(bs1.prettify())#格式
系統 2019-09-27 17:50:47 1947
在基礎知識部分的最后一章《第十三章Python基礎篇結束章》的《第13.3節圖形界面開發tkinter》簡單介紹了Python內置圖形界面標準庫tkinter,當時特別強調tkinter沒有圖形開發的設計界面,使用復雜,且存在功能問題不推薦使用,將學習朋友推薦的PyQt。本章正式進入PyQt相關內容的學習,注意PyQt是GPL軟件(GPL是GNUGeneralPublicLicense的縮寫,是GNU通用公共授權非正式的中文翻譯),不適合用于商用開發。但P
系統 2019-09-27 17:50:44 1947
Python中定義函數有兩種方法,一種是用常規方式def定義,函數要指定名字,第二種是用lambda定義,不需要指定名字,稱為Lambda函數。Lambda函數又稱匿名函數,匿名函數就是沒有名字的函數,函數沒有名字也行?當然可以啦。有些函數如果只是臨時一用,而且它的業務邏輯也很簡單時,就沒必要非給它取個名字不可。好比電影里面的群眾演員,往往他們的戲份很少,最多是襯托主演,跑跑龍套,他們需要名字嗎?不需要,因為他們僅僅只是臨時出鏡,下次可能就用不著了,所以犯
系統 2019-09-27 17:50:41 1947
轉:https://www.jianshu.com/p/4be85de84d2a本機環境:Windows1064位Anacondapython3.7報錯信息:pipisconfiguredwithlocationsthatrequireTLS/SSL,howeverthesslmoduleinPythonisnotavailable.解決方法:原因:Anaconda環境變量未配置完全需要配置的環境變量:D:\ProgramData\Anaconda3D:\
系統 2019-09-27 17:50:37 1947
學了一個多月的python,做了一個小程序:python實現簡單成績錄入系統,實驗一下menu部分fromtkinterimport*#這是一個python模塊,python3中都有importtkinter.messagebox#這也是一個模塊fromfile_readimportreadfromfile_writeimportwriteclassstudent_main():#定義一個學生類def__init__(self):self.name=''s
系統 2019-09-27 17:50:34 1947
本文實例為大家分享了python監控nginx端口和進程狀態的具體代碼,供大家參考,具體內容如下#!/usr/local/bin/python#coding:utf-8importpsutilimportsysimportos#獲取主機名稱defhostname():sys=os.nameifsys=='nt':hostname=os.getenv('computername')returnhostnameelifsys=='posix':host=os.
系統 2019-09-27 17:50:28 1947
推薦系統的相關知識我們已在前文中提到,在這篇文章中,我們會介紹如何用Python來搭建一個簡單的推薦系統。本文使用的數據集是MovieLens數據集,該數據集由明尼蘇達大學的Grouplens研究小組整理。它包含1,10和2億個評級。Movielens還有一個網站,我們可以注冊,撰寫評論并獲得電影推薦。接下來我們就開始實戰演練。在這篇文章中,我們會使用Movielens構建一個基于item的簡易的推薦系統。在開始前,第一件事就是導入pandas和numPy
系統 2019-09-27 17:50:15 1947