文章目錄
- Excel數據透視表操作
- 數據透視表基本原理
- python中使用pandas的pivot函數
數據透視表是數據分析時的大招,可快速分類統計需要二次加工的信息,并生成相應的統計結果。下面通過一個實例直觀體驗一下。
Excel數據透視表操作
現在我們需要統計一個銷售數據,想直到每種產品類別每個月的銷售額是多少:
當然,我們可以采用篩選的方法,逐一篩選出每個產品類型的數據并進行求和,然而這種操作可能會使你加班到深夜。那么使用excel數據透視表該怎么做呢?
把訂購日期放在行統計項中,產品類別放到列統計項中,值統計項中計算銷售額則可得到我們想要的結果。
數據透視表基本原理
根據如上例子,我們可以初步總結出數據透視表的原理:一般的數據統計表格可能只有一個維度,每一行的
列值
,這樣的數據就比較細節化,難以看出整體上的統計結果。數據透視表就是對
列值
進行重新組織分析,生成
三維度數據
,及
行
、
列
和
值列表
,用以展示我們關注的整體上的統計結果,行、列、值統計項都可以分層次統計多個條目。
python中使用pandas的pivot函數
python中pandas庫作為數據分析常用的庫,也提供了一個數據透視表操作的函數:pivot。
pivot方法可以接受三個參數:
processData = pd.pivot(index="string1",columns="string2",values="string3")
分別對應著數據透視表中的行、列、值項。
需要注意一點,在使用pivot方法的時候,原始數據集中不能存在存在重復條目,此時pivot函數無法確定數據透視表中的數值即會報錯ValueError: Index contains duplicate entries, cannot reshape。
【待補充】
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
