欧美三区_成人在线免费观看视频_欧美极品少妇xxxxⅹ免费视频_a级毛片免费播放_鲁一鲁中文字幕久久_亚洲一级特黄

工作中常用到的python數據處理

系統 1851 0

目錄

1.獲取工作目錄和設置工作目錄

2.獲取日期處理

3.列表的倒排序

4.使用apply處理 兩個值的代碼

5.斷言函數 assert

6.yield生成器

7.獲取程序運行時間?

8.動態生成變量

9.數據可持續化操作

10.數據運行時間2

11.創建目錄

12.刪除無用的數據

13.字符串格式化

14.zip自動生成字典

15.各種包的離線下載地址

16.路徑的設置

17.數據添加ignore_index的使用技巧

18.刪除nan的總結

?19.批量重命名

?20.nohup的使用

?21.reset_index的使用

1.獲取工作目錄和設置工作目錄

            
              import os
# 查看目錄下的文件
print(os.listdir(PATH) l
# 查看當前工作目錄
retval = os.getcwd()
print ("當前工作目錄為 %s" % retval)
# 修改當前工作目錄
os.chdir( path )
# 查看修改后的工作目錄
retval = os.getcwd()
            
          

2.獲取日期處理

            
              #獲取毫秒級別的時間
from  datetime  import  *   
dt = datetime.now()
dt.strftime('%Y-%m-%d-%H-%M-%S.%f') 


import time,datetime
#字符串轉化為時間類型
end_date = datetime.datetime.strptime('2018-07-01', '%Y-%m-%d')

# 獲取當前時間
today = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())  #方法一

from datetime import datetime, date, timedelta
# 今天
today = (datetime.today()).strftime('%Y%m%d') #方法2
print(today);
# 明天
data_next= (datetime.today() + timedelta(1)).strftime('%Y%m%d');
print(data_next);
# 30天后
data_30= (datetime.today() + timedelta(30)).strftime('%Y%m%d');
print(data_30);

train_periods = pd.read_csv('../input/periods_train.csv', parse_dates=['date_from', 'date_to'])
# 兩個日期差多少天
all_periods['days_up'] = all_periods['date_to'].dt.dayofyear - all_periods['date_from'].dt.dayofyear
            
          

3.列表的倒排序

            
              List= [1,2,3,4,5,6]
List[::-1] 
            
          

4.使用apply處理 兩個值的代碼

            
              import numpy as  np
import pandas as pd
df = pd.DataFrame ({
        'a' : np.random.randn(6),
        'b' : ['foo', 'bar'] * 3,
        'c' : np.random.randn(6)}
        )
print(df)
def my_test(a, b):
    return a + b
df['Value'] = df.apply(lambda row: my_test(row['a'], row['c']), axis=1)
print (df)
如何判斷True or False    np.NaN 默認為False
if  valus:
    print('yes')
else:
    print('no')
            
          

5.斷言函數 assert

            
              x = 23
assert x < 0
assert x%2== 0
            
          

?

6.yield生成器

            
               def fab(max): 
    n, a, b = 0, 0, 1 
    while n < max: 
        yield b 
            
          

7.獲取程序運行時間?

            
              import time
from datetime import timedelta

def get_time_dif(start_time):
    """獲取已使用時間"""
    end_time = time.time()
    time_dif = end_time - start_time
    return timedelta(seconds=int(round(time_dif)))

start_time = time.time()
main() # 運行程序
time_dif = get_time_dif(start_time)
print("Time usage:", time_dif)

# 時間的形式:Time usage: 0:09:35
            
          

8.動態生成變量

            
              names = locals()
for i in range(1, 5):
    names['x%s' % i] = i
    if i ==1:
        X_end  = names['x%s' % i]
    else:
        X_end  = X_end + names['x%s' % (i)]

            
          

9.數據可持續化操作

            
              import pickle
def main():
    hjp_list = [123, 456, 789, 'test']
    with open('hjp_list.pkl', 'wb') as pickle_file: # 導入本地
        pickle.dump(hjp_list, pickle_file)
    with open('hjp_list.pkl', 'rb') as pickle_file: # 加載本地數據
        my_new_list = pickle.load(pickle_file)
        print(my_new_list)
if __name__ == '__main__':
    main()
            
          

10.數據運行時間2

            
              #建模固定模塊
import gc
from contextlib import contextmanager
import time
@contextmanager
def timer(title):
    t0 = time.time()
    yield
    print("{}:使用時間為{:.0f}s".format(title, time.time() - t0))

#用法:
with timer("導入數據"):
   main()  '''這樣就可以看到這段代碼運行的時'''

            
          

11.創建目錄

            
              if not os.path.exists('gen_data'):
    os.mkdir('gen_data')
            
          

12.刪除無用的數據

            
              # 刪除缺失率超過90%的列
good_cols = list(train.columns)
for col in train.columns:
    rate = train[col].value_counts(normalize=True, dropna=False).values[0]
    if rate > 0.9:
        print(col)
            
          

13.字符串格式化

            
              name = 'hjp';name1 = 'python'
# 三種方式 推薦第三種
text1 = 'hello %s' %(name )
text2 = 'hello {}'.format(name )
text2 = 'hello {0},{1}'.format(name,name1  )
text3 = f'hello {name}'
            
          

14.zip自動生成字典

            
              x=['bob','tom','kitty']
y=[80,90,95]
d=dict(zip(x,y))
print(d)
            
          

15.各種包的離線下載地址

            
              各種包的下載地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/  在谷歌瀏覽器中下載
            
          

16.路徑的設置

            
              root_dir = 'data/cnews'

path_dir = os.path.join(base_dir, 'train.csv')
            
          

17.數據添加ignore_index的使用技巧

            
              data=pd.concat([train, test], ignore_index=True)
res = res.append(count, ignore_index=True)

            
          

18.刪除nan的總結

            
              #刪除NaN值得匯總

df.dropna()
df.dropna(axis='columns')
df.dropna(how='all')
df.dropna(thresh=2)
df.dropna(subset=['name', 'born'])
df.dropna(inplace=True)
            
          

?19.批量重命名

            
              #字段名稱重命名
print('Compute average')
avg_cc_bal = cc_bal.groupby('SK_ID_CURR').mean()
avg_cc_bal.columns = ['cc_bal_' + f_ for f_ in avg_cc_bal.columns]
            
          

20.nohup的使用

            
              1.例子:
nohup python test.py &
2.查看守護進程
ps -ef | grep python
3.kill進程
kill -s 9 xxxxx
            
          

?21.reset_index的使用

            
              reset_index(drop=True)
            
          

22.列表推導式的高級用法

            
              list_sample1 =[['我','喜歡','你'],['我','愛','你'],['我','疼著','你']]
flattened1 =[x for tup in list_sample1 for x in tup]

flist = [[x for x in tup] for tup in list_sample1 ]
            
          

23 linux 和window 系統路徑編輯統一問題

            
              import os
os.path.join('xxxx','xxxx','xxxx')
            
          

24.map和filter的用法

            
              seq =[1,2,3,4,5]
result =list(map(lambda var:var*2,seq))
print(result)

seq =[1,2,3,4,5]
result =list(filter(lambda var:var>2,seq))
print(result)
            
          

?


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 亚洲视频在线观看一区 | 色吧久久 | 2021国产精品自产拍在线观看 | 久色视频在线观看 | 午夜家庭影院 | 一级毛片视频播放 | 婷婷综合久久狠狠色99h | 成人毛片一区 | 欧美videosex性欧美成人 | 欧美综合网 | 色开心| 狠狠综合久久av一区二区小说 | 欧美性免费视频 | 韩漫重考生漫画画免费读漫画下拉式土豪漫 | 日韩免费视频 | www成人国产在线观看网站 | 中文无码日韩欧 | 精品在线观看 | 中文字字幕在线 | 国产成人免费永久播放视频平台 | 成人在线h | 乱码中文字幕人成在线 | 久久精品无码一区二区日韩av | xxxx亚洲| 麻豆精品传媒一二三区在线视频 | 日本在线免费观看 | 男女污污无遮挡免费观看 | 草草国产成人免费视频 | 小草社区影院 | 激情综合五月亚洲婷婷 | a毛片成人免费全部播放 | 荷兰欧美一级毛片 | 成人网在线免费观看 | 美女在线视频一区二区 | 深夜福利久久久 | 精品小视频 | 久久91综合国产91久久精品 | 免费国产一级特黄久久 | 26uuu天天夜夜综合 | 久草亚洲视频 | 欧美精品亚洲 |