numpy数据集练习

Posted dsj666

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了numpy数据集练习相关的知识,希望对你有一定的参考价值。

从sklearn包自带的数据集中读出鸢尾花数据集data

data=iris[‘data‘]
data

  

  运行结果

技术分享图片

查看data类型,包含哪些数据

 

from sklearn.datasets import load_iris
iris = load_iris()
iris.keys()

  

运行结果

dict_keys([‘data‘, ‘target‘, ‘target_names‘, ‘DESCR‘, ‘feature_names‘])
.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型
a2=iris[‘target‘]
a2

  技术分享图片

a4=iris[‘feature_names‘]
a4

  

 技术分享图片

 

取出所有花的花萼长度(cm)的数据

data=iris[‘data‘]
x=data[:,2]
x

  技术分享图片

取出某朵花的四个特征及其类别。

d=iris.data[0]
print(d)

  

[ 5.1  3.5  1.4  0.2]
生成新的数组,每个元素包含四个特征+类别
Setasa=[]
Versicolor=[]
Virginica=[]#将所有花的特征和类别分成三组,每组50个


for a in range(0,150):
    if iris.target[a]==0:
        data1=iris.data[a].tolist()
        data1.append("Setosa")
        Setasa.append(data1)
    elif iris.target[a] ==1:
        data1=iris.data[a].tolist()
        data1.append("Versicolor")
        Versicolor.append(data1)
    else:
        data1=iris.data[a].tolist()
        data1.append("Virginica")
        Virginica.append(data1)

  

生成新的数组,每个元素包含四个特征+类别
result=numpy.array([Setasa,Versicolor,Virginica])
result

  运行结果

技术分享图片

 

 计算鸢尾花花瓣长度的最大值,平均值,中值,均方差。

print("最大值:",np.max(iris.data[:,1]),
"平均值:",np.mean(iris.data[:,1]),
"中值:",np.median(iris.data[:,1]),
"均方差:",np.std(iris.data[:,1]))

  运行结果

最大值: 4.4 平均值: 3.054 中值: 3.0 均方差: 0.432146580071


显示鸢尾花某一特征的曲线图,散点图。
import matplotlib.pyplot as plt
plt.plot(iris.data[:,0],iris.data[:,1])
plt.show()

  

技术分享图片
plt.scatter(iris.data[:,0],iris.data[:,1])
plt.show()

  

技术分享图片

 

 







以上是关于numpy数据集练习的主要内容,如果未能解决你的问题,请参考以下文章

numpy数据集练习

numpy数据集练习——鸢尾花数据集

numpy数据集练习

numpy数据集练习

numpy数据集练习

numpy练习