?將一份一億多條數據的csv文件等分為10份,代碼如下所示:
import pandas as pd data = pd.read_csv('C:\\Users\\PycharmProjects\\SplitData\\data\\UserBehavior.csv') # 路徑則根據個人存放項目文件的習慣 num = 0 for i in range(1, 11): start = num num = num + int(data.shape[0] / 10) file = data.iloc[start:num,] file.to_csv("C:\\Users\\PycharmProjects\\SplitData\\newData\\" + str(i) + "_data.csv", index=False) # index=False是不想切分后的文件出現序號
注意:如果此時文件的路徑包含有中文,則必須改成以下的代碼:
import pandas as pd f = open('C:\\Users\\PycharmProjects\\數據切分\\data\\UserBehavior.csv') data = pd.read_csv(f) num = 0 for i in range(1, 11): start = num num = num + int(data.shape[0] / 10) file = data.iloc[start:num,] file.to_csv("C:\\Users\\PycharmProjects\\SplitData\\newData\\" + str(i) + "_data.csv", index=False)
但是使用這種方法調用文件進內存,加重了內存的負擔,兩次賦值相當于內存占用乘2,此方法不建議使用,還是將路徑改為英文名。
總結
以上所述是小編給大家介紹的Python 等分切分數據及規則命名的實例代碼,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網站的支持!
如果你覺得本文對你有幫助,歡迎轉載,煩請注明出處,謝謝!
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
