欧美三区_成人在线免费观看视频_欧美极品少妇xxxxⅹ免费视频_a级毛片免费播放_鲁一鲁中文字幕久久_亚洲一级特黄

python--一元線性回歸模型分析

系統 1867 0

一、要求

boston 房價數據是機器學習中著名的基礎數據集,包含 506 條記錄,每條記錄包含房
屋的 13 條屬性,房價信息屬性 MEDV 在 boston.target 中,具體(翻譯成中文) 可通過如下語句查看:
print(boston.DESCR)
各屬性的中文解釋如下:

  • CRIM 城鎮人均犯罪率
  • ZN 占地面積超過 25,000 平方尺的住宅用地比例
  • INDUS 城鎮中非商業用地比例
  • CHAS Charles River 虛擬變量(如果邊界是河流則為 1;否則為 0)
  • NOX 一氧化氮濃度
  • RM 每棟住宅平均房間數
  • AGE 1940 年前建成的自住房屋比例
  • DIS 距五個波士頓就業中心的加權距離
  • RAD 距離高速公路的便利指數- TAX 每 10,000 美元的全額房產稅率
  • PTRATIO 城鎮中學生教師比例
  • B 城鎮中黑人比例
  • LSTAT 人口中低收入階層比例
  • MEDV 自住房房價中位數

完成如下數據處理和分析任務:
(1)在一張畫布上,畫出每個變量與房價變化的散點圖,并詳細分析各個變量和房價
之間的關系。
(2)計算變量和房價的相關系數(相關系數的函數 df.corr())。
(3)建立所有變量和房價的線性回歸模型,寫出模型表達式,并分析模型的顯著性。
(4)將系數檢驗結果不顯著的變量去掉,重新建立線性模型。
(5)選擇與房價的相關系數大于等于 0.5 的變量,作為模型的自變量,房價作為因變
量,建立線性回歸模型,并將房價預測值和真實值繪制成折線圖。

二、代碼

            
              
                from
              
               sklearn 
              
                import
              
               datasets

              
                import
              
               pandas 
              
                as
              
               pd

              
                import
              
               matplotlib
              
                .
              
              pyplot 
              
                as
              
               plt
#
              
                from
              
               scipy
              
                .
              
              misc 
              
                import
              
               factorial  依賴scipy  而且為
              
                1.2
              
              
                .0
              
              版本
#此文件依賴pillow


boston 
              
                =
              
               pd
              
                .
              
              
                read_csv
              
              
                (
              
              
                './dataset/boston_house.csv'
              
              
                )
              
              
df
              
                =
              
              pd
              
                .
              
              
                DataFrame
              
              
                (
              
              boston
              
                )
              
              

#
              
                print
              
              
                (
              
              df
              
                .
              
              iloc
              
                [
              
              
                :
              
              
                ,
              
              
                -
              
              
                1
              
              
                ]
              
              
                )
              
              

#相關系數大于
              
                0.5
              
              
x_has
              
                =
              
              
                [
              
              
                ]
              
              
y_predict
              
                =
              
              
                [
              
              
                ]
              
              
plt
              
                .
              
              
                figure
              
              
                (
              
              
                1
              
              
                )
              
              
#第一題
plt
              
                .
              
              rcParams
              
                [
              
              
                'font.sans-serif'
              
              
                ]
              
              
                =
              
              
                'SimHei'
              
              
plt
              
                .
              
              rcParams
              
                [
              
              
                'axes.unicode_minus'
              
              
                ]
              
              
                =
              
               False

              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                13
              
              
                )
              
              
                :
              
              
    plt
              
                .
              
              
                subplot
              
              
                (
              
              
                7
              
              
                ,
              
              
                2
              
              
                ,
              
              i
              
                +
              
              
                1
              
              
                )
              
              
    plt
              
                .
              
              
                scatter
              
              
                (
              
              df
              
                .
              
              iloc
              
                [
              
              
                :
              
              
                ,
              
              i
              
                ]
              
              
                ,
              
              df
              
                .
              
              iloc
              
                [
              
              
                :
              
              
                ,
              
              
                -
              
              
                1
              
              
                ]
              
              
                ,
              
              marker
              
                =
              
              
                'o'
              
              
                ,
              
              c
              
                =
              
              
                'g'
              
              
                )
              
              # x
              
                ,
              
              y
              
                ,
              
              
                ,
              
              green

    #第二題
    #
              
                print
              
              
                (
              
              
                type
              
              
                (
              
              df
              
                .
              
              columns
              
                [
              
              
                1
              
              
                ]
              
              
                )
              
              
                )
              
              
    dfi
              
                =
              
              df
              
                [
              
              
                [
              
              df
              
                .
              
              columns
              
                [
              
              i
              
                ]
              
              
                ,
              
              df
              
                .
              
              columns
              
                [
              
              
                -
              
              
                1
              
              
                ]
              
              
                ]
              
              
                ]
              
              
                print
              
              
                (
              
              
                '\n'
              
              
                ,
              
              dfi
              
                .
              
              
                corr
              
              
                (
              
              
                )
              
              
                ,
              
              dfi
              
                .
              
              
                corr
              
              
                (
              
              
                )
              
              
                .
              
              iloc
              
                [
              
              
                0
              
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              
                '\n'
              
              
                )
              
              
    #
              
                print
              
              
                (
              
              dfi
              
                .
              
              
                corr
              
              
                (
              
              
                )
              
              
                .
              
              iloc
              
                [
              
              
                0
              
              
                ,
              
              
                1
              
              
                ]
              
              
                )
              
              
  
    #第三題
    
              
                import
              
                numpy  
              
                as
              
               np
    
              
                from
              
               sklearn
              
                .
              
              linear_model 
              
                import
              
               LinearRegression
    x_linear
              
                =
              
              df
              
                .
              
              iloc
              
                [
              
              
                :
              
              
                ,
              
              i
              
                ]
              
              
                .
              
              values
              
                .
              
              
                reshape
              
              
                (
              
              
                -
              
              
                1
              
              
                ,
              
              
                1
              
              
                )
              
               #將DataFrame轉為array格式,通過values 屬性
    y_linear
              
                =
              
              df
              
                .
              
              iloc
              
                [
              
              
                :
              
              
                ,
              
              
                -
              
              
                1
              
              
                ]
              
              
                .
              
              values
              
                .
              
              
                reshape
              
              
                (
              
              
                -
              
              
                1
              
              
                ,
              
              
                1
              
              
                )
              
               ##
              
                reshape
              
              
                (
              
              
                -
              
              
                1
              
              
                ,
              
              
                1
              
              
                )
              
              功能
    #
              
                print
              
              
                (
              
              x_linear
              
                ,
              
              
                type
              
              
                (
              
              x_linear
              
                )
              
              
                )
              
              
    lreg 
              
                =
              
              
                LinearRegression
              
              
                (
              
              
                )
              
              
    lreg
              
                .
              
              
                fit
              
              
                (
              
              x_linear
              
                ,
              
               y_linear
              
                )
              
              
    message0 
              
                =
              
              
                '一元線性回歸方程為: '
              
              
                +
              
              
                '\ty'
              
              
                +
              
              
                '='
              
              
                +
              
              
                str
              
              
                (
              
              lreg
              
                .
              
              intercept_
              
                [
              
              
                0
              
              
                ]
              
              
                )
              
              
                +
              
              
                ' + '
              
              
                +
              
              
                str
              
              
                (
              
              lreg
              
                .
              
              coef_
              
                [
              
              
                0
              
              
                ]
              
              
                [
              
              
                0
              
              
                ]
              
              
                )
              
              
                +
              
              
                '*x'
              
              
                import
              
               scipy
              
                .
              
              stats 
              
                as
              
               stats
    n     
              
                =
              
              
                len
              
              
                (
              
              x_linear
              
                )
              
              
    y_prd 
              
                =
              
               lreg
              
                .
              
              
                predict
              
              
                (
              
              x_linear
              
                )
              
              
                if
              
               dfi
              
                .
              
              
                corr
              
              
                (
              
              
                )
              
              
                .
              
              iloc
              
                [
              
              
                0
              
              
                ,
              
              
                1
              
              
                ]
              
              
                >
              
              
                0.5
              
              
                :
              
              
        x_has
              
                .
              
              
                append
              
              
                (
              
              i
              
                )
              
              
        y_predict
              
                .
              
              
                append
              
              
                (
              
              y_prd
              
                )
              
              
    Regression 
              
                =
              
              
                sum
              
              
                (
              
              
                (
              
              y_prd 
              
                -
              
               np
              
                .
              
              
                mean
              
              
                (
              
              y_linear
              
                )
              
              
                )
              
              
                **
              
              
                2
              
              
                )
              
               # 回歸
    Residual   
              
                =
              
              
                sum
              
              
                (
              
              
                (
              
              y_linear 
              
                -
              
               y_prd
              
                )
              
              
                **
              
              
                2
              
              
                )
              
                        # 殘差
    R_square   
              
                =
              
               Regression 
              
                /
              
              
                (
              
              Regression 
              
                +
              
               Residual
              
                )
              
               # 相關性系數
              
                R
              
              
                ^
              
              
                2
              
              
                F
              
              
                =
              
              
                (
              
              Regression 
              
                /
              
              
                1
              
              
                )
              
              
                /
              
              
                (
              
              Residual 
              
                /
              
              
                (
              
               n 
              
                -
              
              
                2
              
              
                )
              
              
                )
              
                # 
              
                F
              
               分布
    #取a
              
                =
              
              
                0.05
              
              
                if
              
               stats
              
                .
              
              
                pearsonr
              
              
                (
              
              x_linear
              
                ,
              
              y_linear
              
                )
              
              
                [
              
              
                1
              
              
                ]
              
              
                [
              
              
                0
              
              
                ]
              
              
                <
              
              
                0.05
              
              
                :
              
              
        ms1_1
              
                =
              
              
                '顯著'
              
              
                else
              
              
                :
              
              
        ms1_1
              
                =
              
              
                '不顯著'
              
              
    message1
              
                =
              
              
                '顯著性檢測(p值檢測):'
              
              
                +
              
              
                str
              
              
                (
              
              stats
              
                .
              
              
                pearsonr
              
              
                (
              
              x_linear
              
                ,
              
              y_linear
              
                )
              
              
                [
              
              
                1
              
              
                ]
              
              
                [
              
              
                0
              
              
                ]
              
              
                )
              
              
                +
              
               ms1_1 
    
              
                print
              
              
                (
              
              message0
              
                ,
              
              
                '\n'
              
              
                ,
              
              message1
              
                )
              
              


    #第四題

              
                print
              
              
                (
              
              x_has
              
                ,
              
              y_predict
              
                )
              
              
plt
              
                .
              
              
                show
              
              
                (
              
              
                )
              
              


#第五題
plt
              
                .
              
              
                figure
              
              
                (
              
              
                2
              
              
                )
              
              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                len
              
              
                (
              
              x_has
              
                )
              
              
                )
              
              
                :
              
              
    plt
              
                .
              
              
                plot
              
              
                (
              
              df
              
                .
              
              iloc
              
                [
              
              
                :
              
              
                ,
              
              
                -
              
              
                1
              
              
                ]
              
              
                .
              
              values
              
                ,
              
              marker
              
                =
              
              
                'o'
              
              
                ,
              
              c
              
                =
              
              
                'g'
              
              
                )
              
              
    plt
              
                .
              
              
                plot
              
              
                (
              
              y_predict
              
                [
              
              i
              
                ]
              
              
                ,
              
              marker
              
                =
              
              
                'o'
              
              
                ,
              
              c
              
                =
              
              
                'r'
              
              
                )
              
              
plt
              
                .
              
              
                show
              
              
                (
              
              
                )
              
            
          

更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 蜜臀影院 | 国产精品成人免费一区久久羞羞 | 免费观看一级黄色片 | 91毛片网 | 亚洲色图偷拍视频 | 欧美爱爱一区二区 | 免费无码毛片一区二区A片 成人18网站 | 操舔| 亚洲一区和二区 | 欧美毛片网 | 日韩欧美一区在线观看 | 国产成人精品999在线观看 | 王的女人印度剧电视剧免费观看32集 | 久草视频福利在线观看 | 色婷婷视频在线观看 | 国产成人综合一区二区三区 | 久草高清视频 | 午夜在线观看视频 | 成人做爰 | av在线网站观看 | 高清一区二区在线观看 | 久久国产成人 | 一区二区福利视频 | 大香伊蕉国产短视频69 | 天天干天天色 | 99久久久国产精品 | 国产二区三区毛片 | 午夜激情影院 | 日日干夜夜操 | 成年人黄色毛片 | 国产成人免费精品 | 性少妇videosexfreexx | 国产亚洲精品国产一区 | 天天做天天爱夜夜爽女人爽宅 | 国产成人精品一区二区三在线观看 | 国产一区二区精品尤物 | 成人福利视频 | 欧美一级毛片高清免费观看 | 国产成人在线视频 | 97在线视频免费 | 激情久久婷婷 |