本文主要是針對 cumsum函數的一些用法。具體應用場景看下面的數據集。
第一列是userID,第二列是安裝的時間,第三列是安裝的次數。
我們現在想做一件事情。就是統計用戶在某一天前累計的安裝次數。
譬如,對userID為20的用戶,問在16天前,其安裝次數為多少? 答案應該是4次。用python的實現也很簡單。
又譬如,userID為44在19天前安裝的次數,那就應該是1+3+1+1=6次。
具體代碼:(假設數據集為data)
由于是針對每個userID,所以是需要將userID劃分一下(這個方法在組內排序的時候有提到,可以參考前面的文章)。
所以才有下面這一句
groupby(['userID'])
然后,分完組后需要統計的Times,所以就是下面這一句
data['Times'].groupby(['userID'])
最后,我們需要的是累加量,所以,用cumsum()這個函數。
data['sum_Times']=data['Times'].groupby(['userID']).cumsum()
用得到的結果放在一列。
最后得到結果如下:
可以從sum_Times這列看到,每一個值都是相應userID在前一行的累加值。
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
