數(shù)據(jù)集介紹
使用數(shù)據(jù)集Wine,來(lái)自UCI? 。包括178條樣本,13個(gè)特征。
import pandas as pd import numpy as np df_wine = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data', header=None) df_wine.columns = ['Class label', 'Alcohol', 'Malic acid', 'Ash', 'Alcalinity of ash', 'Magnesium', 'Total phenols', 'Flavanoids', 'Nonflavanoid phenols', 'Proanthocyanins', 'Color intensity', 'Hue', 'OD280/OD315 of diluted wines', 'Proline']
分割訓(xùn)練集和測(cè)試集
隨機(jī)分割
分為訓(xùn)練集和測(cè)試集
方法:使用scikit-learn中model_selection子模塊的train_test_split函數(shù)
from sklearn.model_selection import train_test_split X, y = df_wine.ix[:, 1:].values, df_wine.ix[:, 0].values X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=0)#隨機(jī)選擇25%作為測(cè)試集,剩余作為訓(xùn)練集
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號(hào)聯(lián)系: 360901061
您的支持是博主寫(xiě)作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對(duì)您有幫助就好】元
