0,線性正相關(guān);r<0,線性負(fù)相關(guān);r=0,兩個變量之間不存在線性關(guān)系,并不代表兩個變量之間不存在任何關(guān)系。相關(guān)分析函數(shù)DataFrame.corr()Series.corr(other)函數(shù)說明:如果由數(shù)據(jù)框調(diào)用corr函數(shù),那么將會計算每個列兩兩之間" />

黄色网页视频 I 影音先锋日日狠狠久久 I 秋霞午夜毛片 I 秋霞一二三区 I 国产成人片无码视频 I 国产 精品 自在自线 I av免费观看网站 I 日本精品久久久久中文字幕5 I 91看视频 I 看全色黄大色黄女片18 I 精品不卡一区 I 亚洲最新精品 I 欧美 激情 在线 I 人妻少妇精品久久 I 国产99视频精品免费专区 I 欧美影院 I 欧美精品在欧美一区二区少妇 I av大片网站 I 国产精品黄色片 I 888久久 I 狠狠干最新 I 看看黄色一级片 I 黄色精品久久 I 三级av在线 I 69色综合 I 国产日韩欧美91 I 亚洲精品偷拍 I 激情小说亚洲图片 I 久久国产视频精品 I 国产综合精品一区二区三区 I 色婷婷国产 I 最新成人av在线 I 国产私拍精品 I 日韩成人影音 I 日日夜夜天天综合

Python中的相關(guān)分析correlation analysis的實現(xiàn)

系統(tǒng) 2318 0

相關(guān)分析(correlation analysis)

研究兩個或兩個以上隨機(jī)變量之間相互依存關(guān)系的方向和密切程度的方法。
線性相關(guān)關(guān)系主要采用皮爾遜(Pearson)相關(guān)系數(shù)r來度量連續(xù)變量之間線性相關(guān)強(qiáng)度;
r>0,線性正相關(guān);r<0,線性負(fù)相關(guān);
r=0,兩個變量之間不存在線性關(guān)系,并不代表兩個變量之間不存在任何關(guān)系。

Python中的相關(guān)分析correlation analysis的實現(xiàn)_第1張圖片

相關(guān)分析函數(shù)
DataFrame.corr()
Series.corr(other)

函數(shù)說明:
如果由數(shù)據(jù)框調(diào)用corr函數(shù),那么將會計算每個列兩兩之間的相似度
如果由序列調(diào)用corr方法,那么只是該序列與傳入的序列之間的相關(guān)度

返回值:
DataFrame調(diào)用;返回DataFrame

Series調(diào)用:返回一個數(shù)值型,大小為相關(guān)度

            
import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年齡)-1, 20, 30, 40, max(data.年齡)+1
]
labels = [
  '20歲以及以下', '21歲到30歲', '31歲到40歲', '41歲以上'
]
 
data['年齡分層'] = pandas.cut(
  data.年齡, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年齡'], 
  index=['年齡分層'], 
  columns=['性別'], 
  aggfunc=[numpy.size]
 File "
            
              ", line 25
  aggfunc=[numpy.size]
            ^
SyntaxError: unexpected EOF while parsing
 
 
import numpy
import pandas
 
data = pandas.read_csv(
  'C:/Users/ZL/Desktop/Python/5.4/data.csv'
)
 
bins = [
  min(data.年齡)-1, 20, 30, 40, max(data.年齡)+1
]
labels = [
  '20歲以及以下', '21歲到30歲', '31歲到40歲', '41歲以上'
]
 
data['年齡分層'] = pandas.cut(
  data.年齡, 
  bins, 
  labels=labels
)
 
ptResult = data.pivot_table(
  values=['年齡'], 
  index=['年齡分層'], 
  columns=['性別'], 
  aggfunc=[numpy.size]
)
 
ptResult
Out[4]: 
     size    
      年齡    
性別     女   男
年齡分層        
20歲以及以下  111  1950
21歲到30歲 2903 43955
31歲到40歲  735  7994
41歲以上   567  886
            
          

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論