欧美三区_成人在线免费观看视频_欧美极品少妇xxxxⅹ免费视频_a级毛片免费播放_鲁一鲁中文字幕久久_亚洲一级特黄

Python數據分析:數據特征分析

系統 1650 0

Python數據分析:數據特征分析

文章目錄

      • 1. 定量數據分布分析
          • 極差、組距、頻率分布表、頻率分布直方圖
          • 不同樣式的直方圖
      • 2. 定性數據分布分析
          • 餅圖、條形圖
          • 時間序列圖:概述及時間格式轉換
          • 時間序列圖:橫坐標為時間的折線圖、周期性分析
          • 時間序列圖:繪制不同樣式的折線圖
          • 散點圖:不同組別數據繪制在一幅圖中

1. 定量數據分布分析

極差、組距、頻率分布表、頻率分布直方圖

Python數據分析:數據特征分析_第1張圖片

            
              
                #定量數據的分布分析
              
              
                import
              
               pandas 
              
                as
              
               pd

              
                import
              
               numpy 
              
                as
              
               np

              
                import
              
               matplotlib 
              
                as
              
               plt
data 
              
                =
              
               pd
              
                .
              
              read_csv
              
                (
              
              
                'myexcel2.csv'
              
              
                )
              
              
sale_data 
              
                =
              
               data
              
                [
              
              
                '總額'
              
              
                ]
              
              
                #print(sale_data)
              
              
                #極差=最大值-最小值,調用np.ptp()求極差
              
              
jicha 
              
                =
              
               sale_data
              
                .
              
              
                max
              
              
                (
              
              
                )
              
              
                -
              
              sale_data
              
                .
              
              
                min
              
              
                (
              
              
                )
              
              
                print
              
              
                (
              
              jicha
              
                ,
              
               np
              
                .
              
              ptp
              
                (
              
              sale_data
              
                )
              
              
                )
              
              
                #決定分點, 分布區間表
              
              
gcut 
              
                =
              
               pd
              
                .
              
              cut
              
                (
              
              sale_data
              
                ,
              
              
                5
              
              
                ,
              
               right
              
                =
              
              
                False
              
              
                )
              
              
                #等寬分成5組,right左區間閉合
              
              
data
              
                [
              
              
                '參考總價分組'
              
              
                ]
              
              
                =
              
               gcut
              
                .
              
              values
gcut_data 
              
                =
              
               gcut
              
                .
              
              value_counts
              
                (
              
              sort 
              
                =
              
              
                False
              
              
                )
              
              
                print
              
              
                (
              
              gcut_data
              
                )
              
              
                #列出頻率分布表
              
              
p_l 
              
                =
              
               pd
              
                .
              
              DataFrame
              
                (
              
              gcut_data
              
                )
              
              
p_l
              
                .
              
              columns 
              
                =
              
              
                [
              
              
                '頻數'
              
              
                ]
              
              
p_l
              
                [
              
              
                '頻率'
              
              
                ]
              
              
                =
              
               p_l 
              
                /
              
               p_l
              
                [
              
              
                '頻數'
              
              
                ]
              
              
                .
              
              
                sum
              
              
                (
              
              
                )
              
              
                #計算頻率
              
              
p_l
              
                [
              
              
                '累計頻率'
              
              
                ]
              
              
                =
              
               p_l
              
                [
              
              
                '頻率'
              
              
                ]
              
              
                .
              
              cumsum
              
                (
              
              
                )
              
              
                #計算累計頻率
              
              
                #百分比顯示頻率, 百分比顯示累計頻率
              
              
p_l
              
                [
              
              
                '頻率%'
              
              
                ]
              
              
                =
              
               p_l
              
                [
              
              
                '頻率'
              
              
                ]
              
              
                .
              
              
                map
              
              
                (
              
              
                lambda
              
               x
              
                :
              
              
                "%.2f%%"
              
              
                %
              
              
                (
              
              x
              
                *
              
              
                100
              
              
                )
              
              
                )
              
              
p_l
              
                [
              
              
                '累計頻率%'
              
              
                ]
              
              
                =
              
               p_l
              
                [
              
              
                '累計頻率'
              
              
                ]
              
              
                .
              
              
                map
              
              
                (
              
              
                lambda
              
               x
              
                :
              
              
                "%.2f%%"
              
              
                %
              
              
                (
              
              x
              
                *
              
              
                100
              
              
                )
              
              
                )
              
              
                print
              
              
                (
              
              p_l
              
                )
              
              
                #繪制頻率直方圖
              
              
p_l
              
                [
              
              
                '頻率'
              
              
                ]
              
              
                .
              
              plot
              
                (
              
              kind 
              
                =
              
              
                'bar'
              
              
                ,
              
               width 
              
                =
              
              
                0.8
              
              
                ,
              
               figsize 
              
                =
              
              
                (
              
              
                6
              
              
                ,
              
              
                3
              
              
                )
              
              
                ,
              
              
                 rot 
              
                =
              
              
                25
              
              
                ,
              
               color 
              
                =
              
              
                'b'
              
              
                ,
              
               grid 
              
                =
              
              
                False
              
              
                ,
              
               alpha 
              
                =
              
              
                0.7
              
              
                )
              
              
                #添加文本
              
              
x 
              
                =
              
              
                len
              
              
                (
              
              p_l
              
                )
              
              
y 
              
                =
              
               p_l
              
                [
              
              
                '頻率'
              
              
                ]
              
              
m 
              
                =
              
               p_l
              
                [
              
              
                '頻數'
              
              
                ]
              
              
                for
              
               i
              
                ,
              
              j
              
                ,
              
              k 
              
                in
              
              
                zip
              
              
                (
              
              
                range
              
              
                (
              
              x
              
                )
              
              
                ,
              
              y
              
                ,
              
              m
              
                )
              
              
                :
              
              
    plt
              
                .
              
              text
              
                (
              
              i
              
                -
              
              
                0.1
              
              
                ,
              
              j
              
                +
              
              
                0.01
              
              
                ,
              
              
                '%i'
              
              
                %
              
               k
              
                ,
              
               color 
              
                =
              
              
                'r'
              
              
                )
              
              
plt
              
                .
              
              rcParams
              
                [
              
              
                'font.sans-serif'
              
              
                ]
              
              
                =
              
              
                [
              
              
                'SimHei'
              
              
                ]
              
              
                #用來顯示中文
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                [
              
              
                -
              
              
                25.0
              
              
                ,
              
              
                20.0
              
              
                )
              
              
                3
              
              
                [
              
              
                20.0
              
              
                ,
              
              
                65.0
              
              
                )
              
              
                5
              
              
                [
              
              
                65.0
              
              
                ,
              
              
                110.0
              
              
                )
              
              
                4
              
              
                [
              
              
                110.0
              
              
                ,
              
              
                155.0
              
              
                )
              
              
                3
              
              
                [
              
              
                155.0
              
              
                ,
              
              
                200.225
              
              
                )
              
              
                5
              
              
Name
              
                :
              
               總額
              
                ,
              
               dtype
              
                :
              
               int64
                  頻數    頻率  累計頻率     頻率
              
                %
              
                  累計頻率
              
                %
              
              
                [
              
              
                -
              
              
                25.0
              
              
                ,
              
              
                20.0
              
              
                )
              
              
                3
              
              
                0.15
              
              
                0.15
              
              
                15.00
              
              
                %
              
              
                15.00
              
              
                %
              
              
                [
              
              
                20.0
              
              
                ,
              
              
                65.0
              
              
                )
              
              
                5
              
              
                0.25
              
              
                0.40
              
              
                25.00
              
              
                %
              
              
                40.00
              
              
                %
              
              
                [
              
              
                65.0
              
              
                ,
              
              
                110.0
              
              
                )
              
              
                4
              
              
                0.20
              
              
                0.60
              
              
                20.00
              
              
                %
              
              
                60.00
              
              
                %
              
              
                [
              
              
                110.0
              
              
                ,
              
              
                155.0
              
              
                )
              
              
                3
              
              
                0.15
              
              
                0.75
              
              
                15.00
              
              
                %
              
              
                75.00
              
              
                %
              
              
                [
              
              
                155.0
              
              
                ,
              
              
                200.225
              
              
                )
              
              
                5
              
              
                0.25
              
              
                1.00
              
              
                25.00
              
              
                %
              
              
                100.00
              
              
                %
              
            
          

Python數據分析:數據特征分析_第2張圖片

不同樣式的直方圖
            
              
                import
              
               pandas 
              
                as
              
               pd

              
                import
              
               numpy 
              
                as
              
               np

              
                import
              
               matplotlib
              
                .
              
              pyplot 
              
                as
              
               plt

              
                #產生1000個隨機數,并分配給1000個日期值
              
              
data 
              
                =
              
               pd
              
                .
              
              DataFrame
              
                (
              
              np
              
                .
              
              random
              
                .
              
              randn
              
                (
              
              
                1000
              
              
                ,
              
              
                4
              
              
                )
              
              
                ,
              
              
	index
              
                =
              
              pd
              
                .
              
              date_range
              
                (
              
              
                '1/1/2000'
              
              
                ,
              
              periods
              
                =
              
              
                1000
              
              
                )
              
              
                ,
              
              columns
              
                =
              
              
                list
              
              
                (
              
              
                'ABCD'
              
              
                )
              
              
                )
              
              
                print
              
              
                (
              
              data
              
                .
              
              head
              
                (
              
              
                )
              
              
                )
              
              
                #data['A'].hist(alpha=0.7) #繪制某一列的直方圖
              
              
                #data.hist(bins=50,alpha=0.7) #多個直方圖單獨顯示
              
              
                #data.plot.hist(bins=50,alpha=0.7) #多個直方圖堆疊
              
              
data
              
                .
              
              plot
              
                .
              
              hist
              
                (
              
              stacked
              
                =
              
              
                True
              
              
                ,
              
              bins
              
                =
              
              
                50
              
              
                ,
              
              alpha
              
                =
              
              
                0.7
              
              
                )
              
              
                #多個直方圖疊加
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
            
          

Python數據分析:數據特征分析_第3張圖片
Python數據分析:數據特征分析_第4張圖片
Python數據分析:數據特征分析_第5張圖片
Python數據分析:數據特征分析_第6張圖片

2. 定性數據分布分析

餅圖 、 條形圖 、 時間序列圖

餅圖、條形圖

Python數據分析:數據特征分析_第7張圖片

            
              
                #定性分析:餅圖
              
              
                import
              
               pandas 
              
                as
              
               pd

              
                import
              
               numpy 
              
                as
              
               np

              
                import
              
               matplotlib
              
                .
              
              pyplot 
              
                as
              
               plt
data 
              
                =
              
               pd
              
                .
              
              read_csv
              
                (
              
              
                'myexcel2.csv'
              
              
                ,
              
               header
              
                =
              
              
                0
              
              
                )
              
              
                print
              
              
                (
              
              data
              
                )
              
              
labels 
              
                =
              
              
                [
              
              
                'A'
              
              
                ,
              
              
                'B'
              
              
                ,
              
              
                'C'
              
              
                ,
              
              
                'D'
              
              
                ]
              
              
share 
              
                =
              
              
                [
              
              
                422
              
              
                ,
              
              
                262
              
              
                ,
              
              
                365
              
              
                ,
              
              
                824
              
              
                ]
              
              
colors 
              
                =
              
              
                [
              
              
                'red'
              
              
                ,
              
              
                'yellowgreen'
              
              
                ,
              
              
                'lightskyblue'
              
              
                ]
              
              
explode 
              
                =
              
              
                (
              
              
                0.05
              
              
                ,
              
              
                0
              
              
                ,
              
              
                0
              
              
                ,
              
              
                0
              
              
                )
              
              
                #radius餅圖半徑,autopct比例,labeldistance文本的位置離遠點有多遠,explode某部分爆炸出來 
              
              
                #startangle起始角度 一般選擇從90度開始比較好看,pctdistance text離圓心的距離
              
              
plt
              
                .
              
              pie
              
                (
              
              share
              
                ,
              
              labels
              
                =
              
              labels
              
                ,
              
              radius
              
                =
              
              
                0.8
              
              
                ,
              
              autopct
              
                =
              
              
                '%3.1f%%'
              
              
                ,
              
              pctdistance
              
                =
              
              
                0.6
              
              
                ,
              
              
        colors
              
                =
              
              colors
              
                ,
              
              startangle
              
                =
              
              
                180
              
              
                ,
              
              labeldistance
              
                =
              
              
                1.1
              
              
                ,
              
              explode
              
                =
              
              explode
              
                ,
              
              shadow
              
                =
              
              
                True
              
              
                )
              
              
plt
              
                .
              
              title
              
                (
              
              
                '菜品銷售量分布'
              
              
                )
              
              
                #標題
              
              
                #plt.rcParams['font.sans-serif'] = ['SimHei']  #用來顯示中文
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
            
          

Python數據分析:數據特征分析_第8張圖片
Python數據分析:數據特征分析_第9張圖片

            
              
                #定性分析:條形圖
              
              
                import
              
               pandas 
              
                as
              
               pd

              
                import
              
               numpy 
              
                as
              
               np

              
                import
              
               matplotlib
              
                .
              
              pyplot 
              
                as
              
               plt
data 
              
                =
              
               pd
              
                .
              
              read_csv
              
                (
              
              
                'myexcel1.csv'
              
              
                ,
              
               header
              
                =
              
              
                0
              
              
                )
              
              
oriention 
              
                =
              
               data
              
                [
              
              
                '名稱'
              
              
                ]
              
              
                .
              
              value_counts
              
                (
              
              
                )
              
              
                #統計各類別的數量
              
              
                print
              
              
                (
              
              
                len
              
              
                (
              
              oriention
              
                )
              
              
                )
              
              
                #數目為5
              
              
                print
              
              
                (
              
              oriention
              
                )
              
              
                #查看5個類別的數量
              
              
oriention
              
                .
              
              plot
              
                (
              
              kind
              
                =
              
              
                'barh'
              
              
                ,
              
              color
              
                =
              
              
                'blue'
              
              
                ,
              
              alpha
              
                =
              
              
                0.7
              
              
                )
              
              
plt
              
                .
              
              title
              
                (
              
              
                '房屋朝向分析'
              
              
                ,
              
               size 
              
                =
              
              
                15
              
              
                )
              
                 
plt
              
                .
              
              xlabel
              
                (
              
              
                '房屋數量'
              
              
                ,
              
               size 
              
                =
              
              
                15
              
              
                )
              
                
plt
              
                .
              
              ylabel
              
                (
              
              
                '房屋朝向'
              
              
                ,
              
               size 
              
                =
              
              
                15
              
              
                )
              
               
plt
              
                .
              
              rcParams
              
                [
              
              
                'font.sans-serif'
              
              
                ]
              
              
                =
              
              
                [
              
              u
              
                'SimHei'
              
              
                ]
              
              
                #用來顯示中文
              
              
plt
              
                .
              
              rcParams
              
                [
              
              
                'axes.unicode_minus'
              
              
                ]
              
              
                =
              
              
                False
              
              
                #用來正常顯示負號
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
                7
              
                4
              
              
東南    
              
                4
              
              
西南    
              
                3
              
              
西     
              
                2
              
            
          

Python數據分析:數據特征分析_第10張圖片

時間序列圖:概述及時間格式轉換

時間序列圖:實現時間序列的可視化,及周期性的可視化。
導入到時間數據,默認的是字符串的數據類型。因此,在可視化的時候,會出現沒有按時間先后順序的方式繪圖的狀況。因此,需要將字符串解析為時間類型的數據類型。

將字符串解析為時間類型的 3 中方法:
1 在讀取數據的時候,采用parse_dates=True,自動解析其中的時間數據
2 使用dateuyil包中的parser.parse解析時間字符串
3 利用pandas的to_datetime處理時間list

            
              
                #使用 parser.parse 解析時間字符串
              
              
                from
              
               dateutil
              
                .
              
              parser 
              
                import
              
               parse
v1 
              
                =
              
               parse
              
                (
              
              
                '2018-09-02'
              
              
                )
              
              
                print
              
              
                (
              
              
                "解析后的時間格式為:"
              
              
                ,
              
              v1
              
                )
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                #使用 pd.to_datetime 處理時間list
              
              
                import
              
               pandas 
              
                as
              
               pd
datestrs 
              
                =
              
              
                [
              
              
                '2018/09/02'
              
              
                ,
              
              
                '2018/09/03'
              
              
                ,
              
              
                '2018/09/04'
              
              
                ]
              
              
                print
              
              
                (
              
              pd
              
                .
              
              to_datetime
              
                (
              
              datestrs
              
                )
              
              
                )
              
            
          
時間序列圖:橫坐標為時間的折線圖、周期性分析

Python數據分析:數據特征分析_第11張圖片

            
              
                import
              
               numpy 
              
                as
              
               np

              
                import
              
               pandas 
              
                as
              
               pd

              
                import
              
               matplotlib
              
                .
              
              pyplot 
              
                as
              
               plt

              
                #從文件導入數據,采用parse_dates=True,自動解析其中的時間數據
              
              
                #數據來源 https://www.cnblogs.com/yimengtianya1/p/9576431.html
              
              
data 
              
                =
              
               pd
              
                .
              
              read_csv
              
                (
              
              
                '1213.csv'
              
              
                ,
              
              parse_dates
              
                =
              
              
                True
              
              
                ,
              
              index_col
              
                =
              
              
                0
              
              
                )
              
              
                print
              
              
                (
              
              data
              
                .
              
              head
              
                (
              
              
                )
              
              
                )
              
              
                #繪圖-折線圖
              
              
plt
              
                .
              
              plot
              
                (
              
              data
              
                [
              
              
                '銷售額'
              
              
                ]
              
              
                ,
              
              label 
              
                =
              
              
                '銷售額'
              
              
                )
              
              
plt
              
                .
              
              xticks
              
                (
              
              rotation
              
                =
              
              
                50
              
              
                )
              
              
                #旋轉橫坐標的標簽
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              
                #繪圖-周期性分析圖
              
              
data 
              
                =
              
               data
              
                .
              
              set_index
              
                (
              
              
                '星期'
              
              
                )
              
              
                #將列'星期'變成data的行索引
              
              
                print
              
              
                (
              
              data
              
                .
              
              head
              
                (
              
              
                )
              
              
                )
              
              

count 
              
                =
              
               data
              
                [
              
              
                '銷售額'
              
              
                ]
              
              
                .
              
              count
              
                (
              
              
                )
              
              
                #統計行數:29
              
              
circle 
              
                =
              
               count
              
                //
              
              
                7
              
              
                #取整除,向下取整:4
              
              
                print
              
              
                (
              
              count
              
                ,
              
              circle
              
                )
              
              
                #每 7 天一次循環繪制折線圖
              
              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              circle
              
                )
              
              
                :
              
              
    plt
              
                .
              
              plot
              
                (
              
              data
              
                [
              
              
                '銷售額'
              
              
                ]
              
              
                [
              
              
                7
              
              
                *
              
              i
              
                :
              
              
                7
              
              
                *
              
              i
              
                +
              
              
                7
              
              
                ]
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
             星期      銷售額
日期                      

              
                2018
              
              
                -
              
              
                08
              
              
                -
              
              
                01
              
                Wed  
              
                4702986
              
              
                2018
              
              
                -
              
              
                08
              
              
                -
              
              
                02
              
                Thu  
              
                5034151
              
              
                2018
              
              
                -
              
              
                08
              
              
                -
              
              
                03
              
                Fri  
              
                5636981
              
              
                2018
              
              
                -
              
              
                08
              
              
                -
              
              
                04
              
                Sat  
              
                6377764
              
              
                2018
              
              
                -
              
              
                08
              
              
                -
              
              
                05
              
                Sun  
              
                6138548
              
              

         銷售額
星期          
Wed  
              
                4702986
              
              
Thu  
              
                5034151
              
              
Fri  
              
                5636981
              
              
Sat  
              
                6377764
              
              
Sun  
              
                6138548
              
              
                29
              
              
                4
              
            
          

Python數據分析:數據特征分析_第12張圖片
Python數據分析:數據特征分析_第13張圖片

時間序列圖:繪制不同樣式的折線圖
            
              
                import
              
               pandas 
              
                as
              
               pd

              
                import
              
               numpy 
              
                as
              
               np

              
                import
              
               matplotlib
              
                .
              
              pyplot 
              
                as
              
               plt

              
                #繪制折線圖:產生1000個隨機數,并分配給1000個日期值
              
              
data 
              
                =
              
               pd
              
                .
              
              Series
              
                (
              
              np
              
                .
              
              random
              
                .
              
              randn
              
                (
              
              
                1000
              
              
                )
              
              
                ,
              
              index
              
                =
              
              pd
              
                .
              
              date_range
              
                (
              
              
                '1/1/2000'
              
              
                ,
              
              periods
              
                =
              
              
                1000
              
              
                )
              
              
                )
              
              
                # print(data.head())
              
              
data 
              
                =
              
               data
              
                .
              
              cumsum
              
                (
              
              
                )
              
              
data
              
                .
              
              plot
              
                (
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              
                #整體繪制多維數組的折線圖
              
              
df 
              
                =
              
               pd
              
                .
              
              DataFrame
              
                (
              
              np
              
                .
              
              random
              
                .
              
              randn
              
                (
              
              
                1000
              
              
                ,
              
              
                4
              
              
                )
              
              
                ,
              
              index
              
                =
              
              data
              
                .
              
              index
              
                ,
              
              columns
              
                =
              
              
                list
              
              
                (
              
              
                'ABCD'
              
              
                )
              
              
                )
              
              
                print
              
              
                (
              
              df
              
                .
              
              head
              
                (
              
              
                )
              
              
                )
              
              
df 
              
                =
              
               df
              
                .
              
              cumsum
              
                (
              
              
                )
              
              
df
              
                .
              
              plot
              
                (
              
              
                )
              
              
                ;
              
               plt
              
                .
              
              legend
              
                (
              
              loc
              
                =
              
              
                'best'
              
              
                )
              
              
                ;
              
               plt
              
                .
              
              show
              
                (
              
              
                )
              
              
                #單獨繪制多維數組的折線圖
              
              
df
              
                .
              
              plot
              
                (
              
              subplots
              
                =
              
              
                True
              
              
                )
              
              
                ;
              
               plt
              
                .
              
              legend
              
                (
              
              loc
              
                =
              
              
                'best'
              
              
                )
              
              
                ;
              
               plt
              
                .
              
              show
              
                (
              
              
                )
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                   A         B         C         D

              
                2000
              
              
                -
              
              
                01
              
              
                -
              
              
                01
              
              
                -
              
              
                0.410500
              
              
                0.747189
              
              
                0.448807
              
              
                0.405169
              
              
                2000
              
              
                -
              
              
                01
              
              
                -
              
              
                02
              
              
                1.251914
              
              
                -
              
              
                0.079718
              
              
                -
              
              
                0.688459
              
              
                1.887231
              
              
                2000
              
              
                -
              
              
                01
              
              
                -
              
              
                03
              
              
                0.885157
              
              
                -
              
              
                0.428284
              
              
                0.494870
              
              
                1.175288
              
              
                2000
              
              
                -
              
              
                01
              
              
                -
              
              
                04
              
              
                0.316397
              
              
                -
              
              
                1.934446
              
              
                0.424298
              
              
                -
              
              
                1.753221
              
              
                2000
              
              
                -
              
              
                01
              
              
                -
              
              
                05
              
              
                -
              
              
                0.079853
              
              
                -
              
              
                1.188323
              
              
                -
              
              
                1.034872
              
              
                -
              
              
                0.696540
              
            
          

Python數據分析:數據特征分析_第14張圖片
Python數據分析:數據特征分析_第15張圖片
Python數據分析:數據特征分析_第16張圖片
以隨機數B為橫坐標,C為縱坐標繪圖

            
              
                import
              
               pandas 
              
                as
              
               pd

              
                import
              
               numpy 
              
                as
              
               np

              
                import
              
               matplotlib
              
                .
              
              pyplot 
              
                as
              
               plt

              
                #以隨機數B為橫坐標,C為縱坐標繪圖
              
              
data 
              
                =
              
               pd
              
                .
              
              DataFrame
              
                (
              
              np
              
                .
              
              random
              
                .
              
              randn
              
                (
              
              
                1000
              
              
                ,
              
              
                2
              
              
                )
              
              
                ,
              
              columns
              
                =
              
              
                [
              
              
                'B'
              
              
                ,
              
              
                'C'
              
              
                ]
              
              
                )
              
              
                .
              
              cumsum
              
                (
              
              
                )
              
              
                print
              
              
                (
              
              data
              
                .
              
              head
              
                (
              
              
                )
              
              
                )
              
              
data
              
                .
              
              plot
              
                (
              
              x
              
                =
              
              
                'B'
              
              
                ,
              
              y
              
                =
              
              
                'C'
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
          B         C

              
                0
              
              
                -
              
              
                0.868427
              
              
                0.269645
              
              
                1
              
              
                -
              
              
                0.783871
              
              
                -
              
              
                2.097551
              
              
                2
              
              
                -
              
              
                1.961644
              
              
                -
              
              
                1.483593
              
              
                3
              
              
                -
              
              
                1.973470
              
              
                -
              
              
                1.421133
              
              
                4
              
              
                -
              
              
                2.626177
              
              
                -
              
              
                1.129055
              
            
          

Python數據分析:數據特征分析_第17張圖片
使用'x_compat'函數對橫坐標日期進行調整

            
              
                import
              
               pandas 
              
                as
              
               pd

              
                import
              
               numpy 
              
                as
              
               np

              
                import
              
               matplotlib
              
                .
              
              pyplot 
              
                as
              
               plt

              
                #產生1000個隨機數,并分配給1000個日期值
              
              
data 
              
                =
              
               pd
              
                .
              
              DataFrame
              
                (
              
              np
              
                .
              
              random
              
                .
              
              randn
              
                (
              
              
                1000
              
              
                ,
              
              
                4
              
              
                )
              
              
                ,
              
              
	index
              
                =
              
              pd
              
                .
              
              date_range
              
                (
              
              
                '1/1/2000'
              
              
                ,
              
              periods
              
                =
              
              
                1000
              
              
                )
              
              
                ,
              
              columns
              
                =
              
              
                list
              
              
                (
              
              
                'ABCD'
              
              
                )
              
              
                )
              
              
data 
              
                =
              
               data
              
                .
              
              cumsum
              
                (
              
              
                )
              
              
                print
              
              
                (
              
              data
              
                .
              
              head
              
                (
              
              
                )
              
              
                )
              
              
data
              
                .
              
              A
              
                .
              
              plot
              
                (
              
              x_compat
              
                =
              
              
                True
              
              
                )
              
              
                #使用'x_compat'函數對橫坐標日期進行調整
              
              
data
              
                .
              
              plot
              
                (
              
              x_compat
              
                =
              
              
                True
              
              
                )
              
              
                #所有列進行繪制
              
              
data
              
                .
              
              plot
              
                (
              
              x_compat
              
                =
              
              
                True
              
              
                ,
              
              subplots
              
                =
              
              
                True
              
              
                )
              
              
                #所有列單獨繪制
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                -
              
              
                   A         B         C         D

              
                2000
              
              
                -
              
              
                01
              
              
                -
              
              
                01
              
              
                0.636463
              
              
                1.950795
              
              
                -
              
              
                0.661356
              
              
                1.858671
              
              
                2000
              
              
                -
              
              
                01
              
              
                -
              
              
                02
              
              
                1.044353
              
              
                2.750769
              
              
                -
              
              
                0.495825
              
              
                0.211315
              
              
                2000
              
              
                -
              
              
                01
              
              
                -
              
              
                03
              
              
                1.280628
              
              
                2.947151
              
              
                -
              
              
                0.139967
              
              
                0.999238
              
              
                2000
              
              
                -
              
              
                01
              
              
                -
              
              
                04
              
              
                -
              
              
                0.934980
              
              
                3.316594
              
              
                1.021859
              
              
                -
              
              
                0.119952
              
              
                2000
              
              
                -
              
              
                01
              
              
                -
              
              
                05
              
              
                -
              
              
                2.030070
              
              
                2.410148
              
              
                1.590350
              
              
                -
              
              
                1.081503
              
            
          

Python數據分析:數據特征分析_第18張圖片
Python數據分析:數據特征分析_第19張圖片
Python數據分析:數據特征分析_第20張圖片

散點圖:不同組別數據繪制在一幅圖中
            
              
                import
              
               pandas 
              
                as
              
               pd

              
                import
              
               numpy 
              
                as
              
               np

              
                import
              
               matplotlib
              
                .
              
              pyplot 
              
                as
              
               plt
fig 
              
                =
              
               plt
              
                .
              
              figure
              
                (
              
              
                )
              
               
ax 
              
                =
              
               fig
              
                .
              
              add_subplot
              
                (
              
              
                111
              
              
                )
              
               
data 
              
                =
              
               pd
              
                .
              
              DataFrame
              
                (
              
              np
              
                .
              
              random
              
                .
              
              rand
              
                (
              
              
                50
              
              
                ,
              
              
                4
              
              
                )
              
              
                ,
              
              columns
              
                =
              
              
                list
              
              
                (
              
              
                'abcd'
              
              
                )
              
              
                )
              
              
ax
              
                .
              
              scatter
              
                (
              
              x
              
                =
              
              data
              
                [
              
              
                'a'
              
              
                ]
              
              
                ,
              
              y
              
                =
              
              data
              
                [
              
              
                'b'
              
              
                ]
              
              
                ,
              
              color
              
                =
              
              
                'DarkBlue'
              
              
                ,
              
              s
              
                =
              
              
                120
              
              
                ,
              
              alpha
              
                =
              
              
                0.7
              
              
                ,
              
              linewidths
              
                =
              
              
                None
              
              
                ,
              
              label
              
                =
              
              
                'Group1'
              
              
                )
              
              
ax
              
                .
              
              scatter
              
                (
              
              x
              
                =
              
              data
              
                [
              
              
                'c'
              
              
                ]
              
              
                ,
              
              y
              
                =
              
              data
              
                [
              
              
                'd'
              
              
                ]
              
              
                ,
              
              color
              
                =
              
              
                'Red'
              
              
                ,
              
              s
              
                =
              
              
                120
              
              
                ,
              
              alpha
              
                =
              
              
                0.7
              
              
                ,
              
              linewidths
              
                =
              
              
                None
              
              
                ,
              
              label
              
                =
              
              
                'Group2'
              
              
                )
              
              
plt
              
                .
              
              legend
              
                (
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
            
          

Python數據分析:數據特征分析_第21張圖片

            
              
                print
              
            
          
            
              
                import
              
               pandas 
              
                as
              
               pd

              
                import
              
               statsmodels
              
                .
              
              api 
              
                as
              
               sm

              
                import
              
               matplotlib
              
                .
              
              pyplot 
              
                as
              
               plt

data 
              
                =
              
               sm
              
                .
              
              datasets
              
                .
              
              co2
              
                .
              
              load_pandas
              
                (
              
              
                )
              
              
co2 
              
                =
              
               data
              
                .
              
              data

              
                print
              
              
                (
              
              co2
              
                .
              
              head
              
                (
              
              
                5
              
              
                )
              
              
                )
              
              
co2
              
                .
              
              index

y 
              
                =
              
               co2
              
                [
              
              
                'co2'
              
              
                ]
              
              
                .
              
              resample
              
                (
              
              
                'MS'
              
              
                )
              
              
                .
              
              mean
              
                (
              
              
                )
              
              
y
              
                .
              
              head
              
                (
              
              
                5
              
              
                )
              
              
y
              
                [
              
              
                '1990'
              
              
                :
              
              
                ]
              
              
y
              
                .
              
              isnull
              
                (
              
              
                )
              
              
                .
              
              
                sum
              
              
                (
              
              
                )
              
              
y 
              
                =
              
               y
              
                .
              
              fillna
              
                (
              
              y
              
                .
              
              bfill
              
                (
              
              
                )
              
              
                )
              
              
y
              
                .
              
              isnull
              
                (
              
              
                )
              
              
                .
              
              
                sum
              
              
                (
              
              
                )
              
              
y
              
                .
              
              plot
              
                (
              
              figsize
              
                =
              
              
                (
              
              
                12
              
              
                ,
              
              
                6
              
              
                )
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              
                import
              
               pandas 
              
                as
              
               pd

              
                import
              
               statsmodels
              
                .
              
              api 
              
                as
              
               sm

              
                import
              
               matplotlib
              
                .
              
              pyplot 
              
                as
              
               plt

data 
              
                =
              
               sm
              
                .
              
              datasets
              
                .
              
              co2
              
                .
              
              load_pandas
              
                (
              
              
                )
              
              
co2 
              
                =
              
               data
              
                .
              
              data
co2
              
                .
              
              to_csv
              
                (
              
              data
              
                )
              
              
                #導出數據到CSV文件
              
              
                import
              
               os
os
              
                .
              
              getcwd
              
                (
              
              
                )
              
              
                #獲取當前工作路徑
              
              
                %
              
              pwd 
              
                #獲取當前工作路徑
              
            
          
            
              時間序列
https://blog.csdn.net/oh5w6hinug43jvrhhb/article/details/78360686
https://m.jb51.net/article/167032.htm

https://my.oschina.net/zhiyonghe/blog/906307
https://blog.csdn.net/hustqb/article/details/80717055
http://www.360doc.com/content/19/0708/06/39062348_847360415.shtml#
https://www.cnblogs.com/yimengtianya1/p/9576431.html
https://blog.csdn.net/hustqb/article/details/80722766
https://blog.csdn.net/qq_37635049/article/details/82012135
https://blog.csdn.net/weixin_39778570/article/details/81157040

https://blog.csdn.net/weixin_39778570/article/details/81157884


https://www.kaggle.com/datasets?search=stock

            
          

更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦?。?!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 国产精品天堂 | 久久中文字幕在线 | 美女一区 | 久久久久久久久日本理论电影 | 一级做a爱片久久 | 精品欧美乱码久久久久久 | 日韩无套 | 草久网| 精品午夜久久网成年网 | 国产偷国产偷亚洲高清在线 | 毛片啪啪 | 欧美日韩视频在线第一区二区三区 | a网站| 日本道专区无码中文字幕 | 国产精品色 | 青草娱乐极品免费视频 | 色综合99| 91视频这里只有精品 | 亚洲欧美日韩精品中文乱码 | 欧美大黑bbb| 国产精品福利视频免费观看 | 久久久青草 | 日本不卡一区在线观看 | 免费精品一区二区三区在线观看 | 狠狠干美女 | 久久精品久久精品国产大片 | 午夜影院福利社 | 亚洲天堂网站 | 深夜福利久久久 | 欧美最黄视频 | 久久中文字幕一区二区三区 | 成人免费视频网址 | 国产福利视频在线观看 | 一区二区三区四区在线播放 | 精品永久 | 91视频网| 国产精品久久久久久久久久久新郎 | 女人午夜色又刺激黄的视频免费 | 天天操夜夜爽 | 午夜久久久久久久久久一区二区 | 91精品国产闺蜜国产在线 |