欧美三区_成人在线免费观看视频_欧美极品少妇xxxxⅹ免费视频_a级毛片免费播放_鲁一鲁中文字幕久久_亚洲一级特黄

python學(xué)習(xí)——數(shù)據(jù)分析

系統(tǒng) 1615 0

目錄:

  1.數(shù)據(jù)分析模塊

  2.數(shù)據(jù)文件導(dǎo)入

  3.圖形繪制

  4.讀取數(shù)據(jù)并可視化分析

?

1.數(shù)據(jù)分析模塊

            
              import
            
            
               numpy as nn

            
            
              #
            
            
              一維數(shù)組numpy.array([元素1,元素2....,元素n])
            
            
x = nn.array([
            
              '
            
            
              2
            
            
              '
            
            ,
            
              '
            
            
              3
            
            
              '
            
            ,
            
              '
            
            
              d
            
            
              '
            
            ,
            
              '
            
            
              g
            
            
              '
            
            
              ])

            
            
              #
            
            
               print(x)
            
            
              #
            
            
              創(chuàng)建二維數(shù)組格式numpy.array([[元素1],[元素2]....,[元素n]])
            
            
y = nn.array([[2,3,4],[4,3,4,],[34,4,2
            
              ,]])

            
            
              #
            
            
               print(y)
            
            
              #
            
            
              排序sort()
            
            
              
#
            
            
               x.sort()
            
            
              
#
            
            
               print(x)
            
            
              
#
            
            
               y.sort()
            
            
              
#
            
            
               print(y)
            
            
              #
            
            
              取最大值和最小值
            
            
              
#
            
            
               y1 = y.min()
            
            
              
#
            
            
               print(y1)
            
            
              #
            
            
              切片:數(shù)組[起始下標(biāo):最終下表+1]
            
            
x1 = x[1:3
            
              ]
x2 
            
            = x[:2
            
              ]
x3 
            
            = x[1
            
              :]

            
            
              print
            
            
              (x1,x2,x3)


            
            
              import
            
            
               pandas as pda

            
            
              #
            
            
               Series #indes 索引
            
            
              
#
            
            
               a = pda.Series([8,9,2,1])
            
            
b = pda.Series([8,9,2,1],index=[
            
              '
            
            
              a
            
            
              '
            
            ,
            
              '
            
            
              b
            
            
              '
            
            ,
            
              '
            
            
              c
            
            
              '
            
            ,
            
              '
            
            
              d
            
            
              '
            
            
              ])

            
            
              print
            
            
              (s)


c 
            
            = pda.DataFrame([[5,6,4,2],[5,4,2,5],[6,2,5,74
            
              ]])

指定列名
d 
            
            = pda.DataFrame([[5,6,4,2],[5,4,2,5],[6,2,5,74]],columns=[
            
              '
            
            
              a
            
            
              '
            
            ,
            
              '
            
            
              b
            
            
              '
            
            ,
            
              '
            
            
              c
            
            
              '
            
            ,
            
              '
            
            
              d
            
            
              '
            
            
              ])


e 
            
            =
            
               pda.DataFrame({
    
            
            
              '
            
            
              a
            
            
              '
            
            :2
            
              ,
    
            
            
              '
            
            
              b
            
            
              '
            
            :[6,4,7
            
              ],
    
            
            
              '
            
            
              c
            
            
              '
            
            :list(str(919
            
              ))
})

head()調(diào)取頭部數(shù)據(jù),默認(rèn)5行
d 
            
            = pda.DataFrame([[5,6,4,2],[5,4,2,5],[6,2,5,74]],columns=[
            
              '
            
            
              a
            
            
              '
            
            ,
            
              '
            
            
              b
            
            
              '
            
            ,
            
              '
            
            
              c
            
            
              '
            
            ,
            
              '
            
            
              d
            
            
              '
            
            
              ])
e 
            
            = d.head(2
            
              )

            
            
              print
            
            
              (e)
tail()調(diào)取尾部收據(jù),默認(rèn)5行
d 
            
            = pda.DataFrame([[5,6,4,2],[5,4,2,5],[6,2,5,74]],columns=[
            
              '
            
            
              a
            
            
              '
            
            ,
            
              '
            
            
              b
            
            
              '
            
            ,
            
              '
            
            
              c
            
            
              '
            
            ,
            
              '
            
            
              d
            
            
              '
            
            
              ])
f 
            
            = d.tail(2
            
              )

            
            
              print
            
            
              (f)
desctibe()統(tǒng)計(jì)數(shù)據(jù)基本情況count元素個(gè)數(shù)、mean平均數(shù)、std標(biāo)準(zhǔn)差、
min列中所有數(shù)據(jù)中最小值、百分?jǐn)?shù)每一列的分位數(shù)、max列中最大值
d 
            
            = pda.DataFrame([[5,6,4,2],[5,4,2,5],[6,2,5,74]],columns=[
            
              '
            
            
              a
            
            
              '
            
            ,
            
              '
            
            
              b
            
            
              '
            
            ,
            
              '
            
            
              c
            
            
              '
            
            ,
            
              '
            
            
              d
            
            
              '
            
            
              ])
g 
            
            =
            
               d.describe()

            
            
              print
            
            
              (g)

數(shù)據(jù)轉(zhuǎn)置(行列互換)
d 
            
            = pda.DataFrame([[5,6,4,2],[5,4,2,5],[6,2,5,74]],columns=[
            
              '
            
            
              a
            
            
              '
            
            ,
            
              '
            
            
              b
            
            
              '
            
            ,
            
              '
            
            
              c
            
            
              '
            
            ,
            
              '
            
            
              d
            
            
              '
            
            
              ])
d1 
            
            =
            
               d.T

            
            
              print
            
            (d1)
          

?

2.數(shù)據(jù)文件導(dǎo)入

            
              import
            
            
               pandas as pd

導(dǎo)入csv文件
i 
            
            = pd.read_csv(
            
              '
            
            
              文件路徑
            
            
              '
            
            
              )

            
            
              #
            
            
               按照某一列排序
            
            
i.sort_values(by=
            
              '
            
            
              列名
            
            
              '
            
            
              )

導(dǎo)入excel文件
j 
            
            = pd.read_excel(
            
              '
            
            
              C:/Users/BLX/Desktop/123.xls
            
            
              '
            
            
              )

            
            
              print
            
            
              (j)

導(dǎo)入mysql數(shù)據(jù)庫中的數(shù)據(jù)

            
            
              import
            
            
               pymysql
conn 
            
            = pymysql.connect(host=
            
              '
            
            
              127.0.0.1
            
            
              '
            
            ,user=
            
              '
            
            
              root
            
            
              '
            
            ,passwd=
            
              '
            
            
              root
            
            
              '
            
            ,db=
            
              '
            
            
              hexun
            
            
              '
            
            
              )
sql 
            
            = 
            
              '
            
            
              select * from myhexun
            
            
              '
            
            
              #
            
            
              查詢語句
            
            
k =
            
               pd.read_sql(sql,conn)

導(dǎo)入html數(shù)據(jù)
pd.read_html(
            
            
              '
            
            
              網(wǎng)頁源碼路徑
            
            
              '
            
            
              )

導(dǎo)入文本數(shù)據(jù)
pd.read_table(
            
            
              '
            
            
              路徑
            
            
              '
            
            )
          

?

3.圖形繪制

            
              import
            
            
               matplotlib.pylab as pyl

            
            
              import
            
            
               numpy as npy

散點(diǎn)圖
            
            /
            
              折線圖plot
x 
            
            = [1,2,3,4,8
            
              ]
y 
            
            = [5,7,2,1,5
            
              ]
折線圖
pyl.plot(x,y)
            
            
              #
            
            
              plot(x軸數(shù)據(jù),y軸數(shù)據(jù),展現(xiàn)形式(可有可無))
            
            
              pyl.show()

散點(diǎn)圖
pyl.plot(x,y,
            
            
              '
            
            
              o
            
            
              '
            
            
              )
pyl.show()

顏色

            
            
              '''
            
            
              
c-cyan-青色
r-red-紅色
m-magenta-品紅
g-green-綠色
b-blue-藍(lán)色
y-yellow-黃色
k-black-黑色
w-white-白色

            
            
              '''
            
            
              
pyl.plot(x,y,
            
            
              '
            
            
              oc
            
            
              '
            
            
              )

線條樣式

            
            
              '''
            
            
              
-直線
--虛線
-.點(diǎn)直線
:細(xì)小虛線

            
            
              '''
            
            
              
pyl.plot(x,y,
            
            
              '
            
            
              -.
            
            
              '
            
            
              )

點(diǎn)的樣式

            
            
              '''
            
            
              
s方形
h六角形
H六角形
*星形
+加好形
x叉形
d菱形
D菱形
p五角形

            
            
              '''
            
            
              
pyl.plot(x,y,
            
            
              '
            
            
              p
            
            
              '
            
            
              )
pyl.show()

標(biāo)題
pyl.plot(x,y)
x2 
            
            = [1,2,3,5,6,9
            
              ]
y2 
            
            = [3,1,5,6,4,2
            
              ]
pyl.plot(x2,y2)
pyl.title(
            
            
              '
            
            
              show
            
            
              '
            
            )
            
              #
            
            
              主標(biāo)題
            
            
pyl.xlabel(
            
              '
            
            
              ages
            
            
              '
            
            )
            
              #
            
            
              x軸標(biāo)題
            
            
pyl.ylabel(
            
              '
            
            
              temp
            
            
              '
            
            )
            
              #
            
            
              y軸標(biāo)題
            
            
pyl.xlim(0,10)
            
              #
            
            
              x軸范圍
            
            
pyl.ylim(0.10)
            
              #
            
            
              y軸范圍
            
            
              pyl.show()


隨機(jī)數(shù)的生成
data 
            
            = npy.random.random_integers(1,20,10) 
            
              #
            
            
              (最小值,最大值,個(gè)數(shù))生成10個(gè)1-20之間的隨機(jī)數(shù)
            
            
data2 = npy.random.normal(5.0,2.0,10) 
            
              #
            
            
              (平均數(shù),西格瑪,個(gè)數(shù))正態(tài)分布隨機(jī)數(shù)
            
            
正態(tài)分布隨機(jī)數(shù),參考網(wǎng)址:www.mamicode.com/info-detail-507676
            
              .html

直方圖hist
data3 
            
            = npy.random.normal(10.0,1.0,1000
            
              )
pyl.hist(data3)
pyl.show()

data4 
            
            = npy.random.random_integers(1,25,100
            
              )
pyl.hist(data4)
pyl.show()

設(shè)置直方圖的組距、輪廓
data4 
            
            = npy.random.random_integers(1,25,100
            
              )
sty 
            
            = npy.arange(2,17,2)
            
              #
            
            
              (起始,結(jié)束,每條直方圖取值間隔)
            
            
pyl.hist(data4,sty,histtype=
            
              '
            
            
              stepfilled
            
            
              '
            
            ) 
            
              #
            
            
              histtype內(nèi)參數(shù)取消圖形輪廓
            
            
              pyl.show()

子圖繪制:各區(qū)域內(nèi)分別寫內(nèi)容
data4 
            
            = npy.random.random_integers(1,25,100
            
              )

            
            
              #
            
            
               區(qū)域1
            
            
pyl.subplot(2,2,1)
            
              #
            
            
               拆分n行,拆分n列,當(dāng)前繪制區(qū)域
            
            
x1 = [1,2,3,4,5
            
              ]
y1 
            
            = [5,2,5,8,9
            
              ]
pyl.plot(x1,y1)

區(qū)域2
pyl.subplot(
            
            2,2,2
            
              )
x2 
            
            = [1,2,3,4,5
            
              ]
y2 
            
            = [5,2,5,8,9
            
              ]
pyl.plot(x2,y2)

區(qū)域3
pyl.subplot(
            
            2,1,2)
            
              #
            
            
               拆分為2行1列的第二個(gè)位置
            
            
x3 = [1,2,3,4,5,6,7,8
            
              ]
y3 
            
            = [5,2,5,8,9,3,5,8
            
              ]
pyl.plot(x3,y3)

pyl.show()
            
          

?

4.讀取數(shù)據(jù)并可視化分析

            
              import
            
            
               pandas as pd

            
            
              import
            
            
               numpy as np

            
            
              import
            
            
               matplotlib.pylab as mp

data 
            
            = pd.read_csv(
            
              '
            
            
              E:/python/123.csv
            
            
              '
            
            
              )

            
            
              #
            
            
               data.shape()#返回(行數(shù),列數(shù))
            
            
data2 =
            
               data.T
x1 
            
            = data2.values[1] 
            
              #
            
            
               取[第幾行][第幾列]的數(shù)據(jù)
            
            
y1 = data2.values[2
            
              ]
mp.plot(x1,y1)
mp.show()
            
          

?


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長(zhǎng)會(huì)非常 感謝您的哦!?。?/p>

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 中文字幕日韩欧美一区二区三区 | 亚洲午夜国产精品无卡 | 日韩福利在线观看 | 亚洲视频一区在线 | 欧美日本国产 | 中文二区 | 国产午夜精品一区二区三区在线观看 | 欧美日韩在线影院 | 亚洲二区视频 | 国产日韩亚洲不卡高清在线观看 | 免费高清成人啪啪网站 | 蜜臀国产| 色网站免费视频 | 日韩在线播放网址 | 成年女人免费v片 | 亚瑟天堂久久一区二区影院 | 日韩中文欧美 | 国产不卡免费 | 免费黄色欧美视频 | 欧美aⅴ| 污视频在线免费 | 国产人成激情视频在线观看 | 亚洲欧美日韩另类精品一区二区三区 | 一级黄色免费片 | 亚洲伊人色一综合网 | 三级斤| 日韩hd| 99热热99| 国产欧美成人 | 夜夜爽天天狠狠九月婷婷 | 色老头xxxwww作爱视频 | 欧美一区二区精品 | 综合精品在线 | 欧美影院推理片免费看 | 久久新视频 | 欧美日韩亚洲精品国产色 | 欧美午夜影院 | 亚洲视频在线观看免费视频 | 午夜影院在线免费观看视频 | 精品亚洲一区二区三区四区五区 | 久久首页|