使用 scikit learn 在 Python 中导入数据集以解决机器学习问题数据集 Wisconsin Breast Cancer

Posted

技术标签:

【中文标题】使用 scikit learn 在 Python 中导入数据集以解决机器学习问题数据集 Wisconsin Breast Cancer【英文标题】:import the dataset in Python with sci-kit learn for machine learning problems_dataset Winscosin breast cancer 【发布时间】:2017-06-05 20:45:54 【问题描述】:

您好,我尝试将数据集导入 spyder

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

dataset = pd.read_csv('breast-cancer-wisconsin.data1.csv')
X = dataset.iloc[:,0:9].values
y= dataset.iloc[:,9].values

但是当我在变量资源管理器中显示 X 矩阵时,它说当前不支持对象数组

【问题讨论】:

【参考方案1】:

实际上在 Spyder 中我们看不到对象数组。我们只能看到数据框数据,但 Spyder 团队承诺他们将在 Spyder 4(将于 2019 年晚些时候发布)中提供对象数组功能。

【讨论】:

【参考方案2】:

试试这个:

X = dataset.drop('column_9', 1).values
y = dataset['column_9'].values

只需将column_9 替换为目标列的名称即可。

【讨论】:

以上是关于使用 scikit learn 在 Python 中导入数据集以解决机器学习问题数据集 Wisconsin Breast Cancer的主要内容,如果未能解决你的问题,请参考以下文章

在 scikit-learn 中使用 python 生成器 [关闭]

树莓派上的 scikit-learn/python3

使用 Scikit-Learn 在 Python 中绘制随机森林的树

如何在 python 虚拟环境中导入 scikit-learn?

如何在 scikit-learn 的 SVM 中使用非整数字符串标签? Python

使用Python scikit-learn 库实现神经网络算法