numpy数据集练习

Posted 2021-01-12 cx1234

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了numpy数据集练习相关的知识，希望对你有一定的参考价值。

1. 安装scipy，numpy，sklearn包

2. 从sklearn包自带的数据集中读出鸢尾花数据集data

3.查看data类型，包含哪些数据

#加载numpy包
import numpy
#加载sklearn包
from sklearn.datasets import load_iris 
#读出鸢尾花数据集data
data=load_iris()
#查看data类型
print(type(data))
#查看数据内容
print(data.keys())

运行结果如下：

技术分享图片

4.取出鸢尾花特征和鸢尾花类别数据，查看其形状及数据类型

#鸢尾花的四个特征
data_feature= data.feature_names
iris_data=data.data
print(data_feature)
print(iris_data)
#鸢尾花的三个类别
data_target =data.target_names
print(data_target)
iris_data=data.target
print(iris_data)
#数据类型
type(iris_data)

运行结果如下：

技术分享图片

5.取出所有花的花萼长度(cm)的数据

#鸢尾花花萼长度的数据
sepal_length=numpy.array(list(len[0] for len in data[‘data‘]))
print(sepal_length)

运行结果如下：

技术分享图片

6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据

#鸢尾花花瓣长度的数据
petal_length=numpy.array(list(len[2] for len in data[‘data‘])) 
print(petal_length)

#鸢尾花花瓣宽度的数据
petal_width=numpy.array(list(len[3] for len in data[‘data‘])) 
print(petal_width)

运行结果如下：

技术分享图片

7.取出某朵花的四个特征及其类别

#取出某朵花的四个特征
print(data.data[0])
#取出某朵花的类别
print(data.target_names[0])

运行结果如下：

技术分享图片

8.将所有花的特征和类别分成三组，每组50个

9.生成新的数组，每个元素包含四个特征+类别

#定义三个列表来存放不同类型花朵的类别
setosa_data = []
versicolor_data = []
virginica_data = []
#
for i in range(0,150):
    #生成为setosa类的鸢尾花花数据
    if  data.target[i] == 0: 
        data1 = data.data[i].tolist()
        data1.append(‘setosa‘)
        setosa_data.append(data1)
    #生成为versicolor类的鸢尾花数据  
    elif data.target[i] == 1: 
        data1 = data.data[i].tolist()
        data1.append(‘versicolor‘)
        versicolor_data.append(data1)
    #剩下的为virginica类的鸢尾花数据  
    else:                         
        data1 = data.data[i].tolist()
        data1.append(‘virginica‘)
        virginica_data.append(data1)
#生成新的数组，每个元素包含四个特征+类别
newdata=(setosa_data ,versicolor_data,virginica_data)
print(newdata)

运行结果如下：

技术分享图片

以上是关于numpy数据集练习的主要内容，如果未能解决你的问题，请参考以下文章