在手写数字示例中使用 scikit-learn 实现 SVM 的特征提取器

Posted

技术标签:

【中文标题】在手写数字示例中使用 scikit-learn 实现 SVM 的特征提取器【英文标题】:feature extractor implementing an SVM with scikit-learn in handwritten digit example 【发布时间】:2012-12-09 02:40:18 【问题描述】:

在指南中谈到:“在监督问题的情况下,解释变量存储在 .target 成员中。”什么意思?

在 scikit 站点的这个例子中: http://scikit-learn.org/stable/auto_examples/plot_digits_classification.html 我不明白:

1) 如果使用任何特征提取器(边缘检测)来识别数字。

2) 目标向量中的数字是什么意思?是图片显示的对应数字吗?

【问题讨论】:

【参考方案1】:

datasets.load_digits() 的返回值是 Bunch 类型的对象,这是一个用于表示标记数据集的便利类。没有特征提取,数字数据集只包含位图。目标向量中的数字确实是位图表示的数字,即要训练/预测的标签/目标。

【讨论】:

如果我想将此示例与我自己的图像一起使用并使用 Hog 特征提取器,我将 Hog 特征向量放入数据中?分类器.fit(数据[:n_samples / 2], digits.target[:n_samples / 2]) 只需将您的 hog 特征放入一个形状为(n_samples, n_features) 的二维数组和一个形状为(n_samples,) 的一维数组中每个样本的符号的整数标识符,然后调用:classifier.fit(hog_features, sign_ids)。跨度>

以上是关于在手写数字示例中使用 scikit-learn 实现 SVM 的特征提取器的主要内容,如果未能解决你的问题,请参考以下文章

使用Python scikit-learn 库实现神经网络算法

机器学习笔记:常用数据集之scikit-learn内置玩具数据集

python数据分析实战-第11章-识别手写数字

08 支持向量机(SVM)

tensorflow实现mnist手写数字识别

如何用python和scikit learn实现神经网络