#1.导入鸢尾花数据 from sklearn.datasets import load_iris #导入numpy import numpy as np
#2. 从sklearn包自带的数据集中读出鸢尾花数据集data data_iris = load_iris() data_iris
#3.查看data类型,包含哪些数据 type_data=type(data_iris) ##数据类型 print(type_data) Data=data_iris.keys() ##查看包含哪些数据 print(Data)
#取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型 iris_feature = data_iris[‘data‘] #鸢尾花特征 print(iris_feature) iris_target = data_iris[‘target‘] #鸢尾花类型 print(iris_target) iris_target_name = data_iris[‘target_names‘] #鸢尾花类型名称 print(iris_target_name)
#5.取出所有花的花萼长度(cm)的数据 iris_len = np.array(list(iris_feature)) for len in iris_len: print(len[0])
#6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据 iris_len = np.array(list(iris_feature)) for len_width in iris_len: print(len_width[2],len_width[3])
#7.取出某朵花的四个特征及其类别。 Some_iris = data_iris[‘data‘][1],data_iris[‘target‘][1] print(Some_iris)
#8.将所有花的特征和类别分成三组,每组50个 #第一步建立三个空的列表 iris_setosa=[] iris_versicolor=[] iris_virginica=[] #第二步利用for循环将的特征和类别分成三组 for i in range(0,150): if data_iris[‘target‘][i] == 0: data = data_iris[‘data‘][i].tolist() data.append(‘setosa‘) iris_setosa.append(data) elif data_iris[‘target‘][i] == 1: data = data_iris[‘data‘][i].tolist() data.append(‘versicolor‘) iris_versicolor.append(data) else: data = data_iris[‘data‘][i].tolist() data.append(‘virginica‘) iris_virginica.append(data)
#9.生成新的数组,每个元素包含四个特征+类别 iris_result = np.array([iris_setosa,iris_versicolor,iris_virginica]) print(iris_resul
原文:https://www.cnblogs.com/XLxielin/p/9787001.html