sklearn.datasets

Posted cgmcoding

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了sklearn.datasets相关的知识,希望对你有一定的参考价值。

sklearn.datasets

#波士顿房价数据集
from  sklearn.datasets import load_boston
import pandas as pd
boston=load_boston()
boston.data
boston.target
boston.feature_names
df=pd.DataFrame(boston.data,columns=boston.feature_names)

属性:

name 属性信息
CRIM 按城镇划分的CRIM人均犯罪率
ZN ZN占地超过25,000平方英尺的住宅用地比例
INDUS INDUS每个城镇非零售业务英亩的比例
CHAS 查尔斯河虚拟变量(如果束缚河,则为1;否则为0)
NOX 一氧化氮浓度(百万分之几)
RM 每个住宅的平均房间数
AGE 1940年之前建造的自有住房的年龄比例
DIS 与五个波士顿就业中心的加权距离
RAD 径向公路通达性指数
TAX 每10,000美元的税全额财产税税率
PTRATIO 按镇划分的师生比例
B 1000(Bk-0.63)^ 2其中Bk是按城镇划分的黑人比例
LSTAT 人口地位降低百分比
target 自有住房的中位数价值(以1000美元计)

 

以上是关于sklearn.datasets的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 sklearn.datasets.load_files 加载数据百分比

『Sklearn』自带数据集API

在 sklearn 中使用 datasets.fetch_mldata() 时出现 IO 错误

PyMC3 贝叶斯线性回归预测与 sklearn.datasets

ModuleNotFoundError: No module named ‘sklearn.datasets.samples_generator‘

sklearn中决策树算法DesiciontTreeClassifier()调用以及sklearn自带的数据包sklearn.datasets.load_iris()的应用