Y)=X∩Y/N置信度的計算方法:confidence(X->Y)=support(X->Y)/support(X)知道支持度和置信度的計算方法之后就可以實現(xiàn)上面算法了,首先本題給的數(shù)據(jù)集比" />

欧美三区_成人在线免费观看视频_欧美极品少妇xxxxⅹ免费视频_a级毛片免费播放_鲁一鲁中文字幕久久_亚洲一级特黄

【Python】關(guān)聯(lián)規(guī)則實例

系統(tǒng) 1651 0

這是最近找機器學(xué)習(xí)實習(xí)的一個筆試題:
【Python】關(guān)聯(lián)規(guī)則實例_第1張圖片
看到這個題的時候第一想法就是用關(guān)聯(lián)規(guī)則(Apriori算法)來實現(xiàn)。
關(guān)聯(lián)規(guī)則最重要的就是支持度Support和置信度Confidence。
支持度的計算方法:

            
              #下面式中X∩Y表示X和Y同時發(fā)生的次數(shù),N表示總事物數(shù)
support(X->Y) = X∩Y/N

            
          

置信度的計算方法:

            
              confidence(X->Y) = support(X->Y) / support(X)

            
          

知道支持度和置信度的計算方法之后就可以實現(xiàn)上面算法了,首先本題給的數(shù)據(jù)集比較大,有六百多個項,因此直接對數(shù)據(jù)進行循環(huán)操作的話時間復(fù)雜度太高,我們先根據(jù)支持度對數(shù)據(jù)進行基本篩選。

            
              已知:若A->Z不滿足支持度,則AB->Z亦不滿足支持度。

            
          

因此我們先找出規(guī)則左邊只有一項且滿足支持度的數(shù)據(jù),即初步剔除不滿足支持度的數(shù)據(jù),代碼如下:

            
              import pandas as pd
import numpy as np
#讀取數(shù)據(jù)
path = r"Test2_Data.csv"
df = pd.read_csv(path,engine='python')
#sup支持度大于等于0.1
sup = 0.1
#N為事務(wù)數(shù)目
N = df.shape[0]
#初步篩選頻繁1項集,將df更新,其中列Label為數(shù)據(jù)的最后一列
data = df[df['Label']==1]
df = df[data.sum()[(data.sum()>=N*sup)].index]

            
          

然后根據(jù)通過雙層循環(huán)來選取滿足置信度條件的規(guī)則,其中在左邊有兩項的規(guī)則中需要加入支持度條件,代碼如下:

            
              #con置信度大于等于0.7
con = 0.7
#定義變量apriori存放符合要求的關(guān)聯(lián)規(guī)則X->Y
apriori = []
for i in range(df.shape[1]-1):
    #X->Y的置信度等于XY同時出現(xiàn)的次數(shù)除以X出現(xiàn)的次數(shù)
    #選取左邊只有一項的規(guī)則
    XY = df[(df['Label']==1)&(df.ix[:,i]==1)].shape[0]
    Y = df[df.ix[:,i]==1].shape[0]
    if(Y!=0 and XY/Y>=con):
        apriori.append(df.columns[i] + '->' + 'Label')
    elif(i == df.shape[1]-1):
        break
    for j in range(i+1,df.shape[1]-1):
        # 選取左邊有兩項的規(guī)則
        XY = df[(df['Label']==1)&(df.ix[:,i]==1)&(df.ix[:,j]==1)].shape[0]
        Y = df[(df.ix[:,i]==1)&(df.ix[:,j]==1)].shape[0]
        if(Y!=0 and XY/Y>=con and XY>=N*sup):
            apriori.append(df.columns[i]+ df.columns[j] + '->' + 'Label')

            
          

到這里就完成了這個機器學(xué)習(xí)的筆試題。

歡迎添加個人微信號:liu2536036458。
想進入交流群的,備注: 數(shù)據(jù)分析交流群


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 在线观看91精品国产入口 | 国产一级大片在线观看 | 国产成人精品福利网站在线观看 | 青青艹视频在线 | 精品视频麻豆入口 | 秋霞av电影 | 特黄做愛又硬又大A片视频 小视频在线看 | 九九热视频这里只有精品 | 色婷亚洲 | 欧美精品一区二区三区在线 | 国产精品久久久爽爽爽麻豆色哟哟 | 亚洲高清视频在线 | 久久se精品一区精品二区 | 草草影院国产第一页 | 一级免费看片 | 欧美经典成人在观看线视频 | 精品一区二区久久久久久久网站 | 一级看片免费视频 | 国产午夜精品一区二区三区嫩草 | 国产亚洲综合一区二区在线 | 欧美在线观看视频一区 | 美乃雀中文字幕在线一区 | 男女激情啪啪 | 在线不卡视频 | 99SE久久爱五月天婷婷 | 日本午夜精品一区二区三区电影 | 午夜精品久久久久久久99热浪潮 | 日韩 欧美 亚洲国产 | 成人做爰高潮片免费视频韩国 | 国产高清在线精品一区αpp | 久久中文字幕网 | 91在线免费观看 | 久久偷拍人 | 中文字幕成人 | 欧美日韩国产在线观看 | 欧美激情无码成人A片 | 精品在线播放 | 国产婷婷在线观看 | 91尤物国产尤物福利 | 日本一区二区不卡 | 国产视频导航 |