numpy数据集练习
Posted cx1234
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了numpy数据集练习相关的知识,希望对你有一定的参考价值。
1. 安装scipy,numpy,sklearn包
2. 从sklearn包自带的数据集中读出鸢尾花数据集data
3.查看data类型,包含哪些数据
#加载numpy包 import numpy #加载sklearn包 from sklearn.datasets import load_iris #读出鸢尾花数据集data data=load_iris() #查看data类型 print(type(data)) #查看数据内容 print(data.keys())
运行结果如下:
4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型
#鸢尾花的四个特征 data_feature= data.feature_names iris_data=data.data print(data_feature) print(iris_data) #鸢尾花的三个类别 data_target =data.target_names print(data_target) iris_data=data.target print(iris_data) #数据类型 type(iris_data)
运行结果如下:
5.取出所有花的花萼长度(cm)的数据
#鸢尾花花萼长度的数据 sepal_length=numpy.array(list(len[0] for len in data[‘data‘])) print(sepal_length)
运行结果如下:
6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据
#鸢尾花花瓣长度的数据 petal_length=numpy.array(list(len[2] for len in data[‘data‘])) print(petal_length)
#鸢尾花花瓣宽度的数据 petal_width=numpy.array(list(len[3] for len in data[‘data‘])) print(petal_width)
运行结果如下:
7.取出某朵花的四个特征及其类别
#取出某朵花的四个特征 print(data.data[0]) #取出某朵花的类别 print(data.target_names[0])
运行结果如下:
8.将所有花的特征和类别分成三组,每组50个
9.生成新的数组,每个元素包含四个特征+类别
#定义三个列表来存放不同类型花朵的类别 setosa_data = [] versicolor_data = [] virginica_data = [] # for i in range(0,150): #生成为setosa类的鸢尾花花数据 if data.target[i] == 0: data1 = data.data[i].tolist() data1.append(‘setosa‘) setosa_data.append(data1) #生成为versicolor类的鸢尾花数据 elif data.target[i] == 1: data1 = data.data[i].tolist() data1.append(‘versicolor‘) versicolor_data.append(data1) #剩下的为virginica类的鸢尾花数据 else: data1 = data.data[i].tolist() data1.append(‘virginica‘) virginica_data.append(data1) #生成新的数组,每个元素包含四个特征+类别 newdata=(setosa_data ,versicolor_data,virginica_data) print(newdata)
运行结果如下:
以上是关于numpy数据集练习的主要内容,如果未能解决你的问题,请参考以下文章