第四十五篇 入门机器学习——数据加载和简单的数据探索

Posted xuezou

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第四十五篇 入门机器学习——数据加载和简单的数据探索相关的知识,希望对你有一定的参考价值。

 

 

No.1. 导入相关类库,并加载鸢尾花数据集

技术分享图片

 

No.2. 这个鸢尾花数据集类似于一个字典,可以查看都有哪些键

技术分享图片

 

No.3. ‘DESCR‘这个键对应的值为鸢尾花数据集的文档,简单对其进行查看

技术分享图片

从文档中我们可以了解到,这个数据集共保存了150个鸢尾花样本;每个样本包含4个特征:萼片长度、萼片宽度、花瓣长度、花瓣宽度;共分为三类鸢尾花:Iris-Setosa、Iris-Versicolour和Iris-Virginica等等信息

 

No.4. 通过‘data‘这个键,可以访问150个样本的数据

技术分享图片

很明显,这些数据保存在一个矩阵中,我们可以检查这个矩阵的形状

技术分享图片

150行4列,表示150个样本,每个样本有4个特征

 

No.6. 每个样本所属的鸢尾花类别,通过索引的方式保存在一个向量中,可以通过‘target‘这个键进行访问

技术分享图片

 

No.7. 相应的,每个索引所指代的鸢尾花名称保存在另一个向量中,可以通过‘target_names‘这个键进行访问

技术分享图片

 

No.8. 我们可以尝试选取鸢尾花的前两个特征绘制散点图

技术分享图片

 

No.9. 添加筛选条件,对不同种类的鸢尾花添加不同样式

技术分享图片

 

No.10. 我们再试着绘制鸢尾花的另外两个特征的散点图

技术分享图片

 

以上是关于第四十五篇 入门机器学习——数据加载和简单的数据探索的主要内容,如果未能解决你的问题,请参考以下文章

第四十五篇UITableViewCell高度计算

Python之路(第四十五篇)线程Event事件 条件Condition定时器Timer线程queue

第四十七篇 入门机器学习——分类的准确性(Accuracy)

第四十九篇 入门机器学习——数据归一化(Feature Scaling)

第四十八篇 入门机器学习——超参数问题

Python机器学习(四十五)NumPy 统计函数