使用 Scikit-Learn 数据上传查询机器学习

Posted

技术标签:

【中文标题】使用 Scikit-Learn 数据上传查询机器学习【英文标题】:Query on Machine Learning with Scikit-Learn data uploading 【发布时间】:2016-10-31 04:04:48 【问题描述】:

我正在尝试使用 Scikit-Learn 开发基于机器学习的图像分类系统。我想做的是多类分类。我在使用 Scikit-Learn 时面临的最大问题是如何加载数据。然后我遇到了 face_recognition.py 的一个例子。它使用 fetch_lfw_people 从互联网上获取数据。我可以看到这个例子实际上做了多类分类。我试图找到有关该示例的一些文档,但找不到。我在这里有一些问题, fetch_lfw_people 是做什么的?这个函数在 lfw_people 中加载了什么。另外我在数据文件夹中看到的还有一些文本文件。代码是否在读取文本文件/?我的主要目的是加载我的图像数据集,但我无法使用 fetch_lfw_people 来完成,以防我通过 data_home 和 funneled=False 更改图像文件夹的路径。我得到错误,我希望我能在这里得到一些答案 H2>

【问题讨论】:

【参考方案1】:

第一件事。您不能直接将图像作为分类器的输入。您必须从图像中提取一些特征。或者,您可以使用 opencv 加载图像并将 numpy 数组用作分类器的输入。 我建议你阅读一些图像分类的基础知识,比如如何训练你的分类器等等。 来回答你关于 fetch_lfw_people 函数的问题。它可能正在从任何文本文件下载已经预处理的图像数据。如果您从图像进行训练,则必须首先将图像数据转换为一些数字特征。

【讨论】:

以上是关于使用 Scikit-Learn 数据上传查询机器学习的主要内容,如果未能解决你的问题,请参考以下文章

机器学习之SKlearn(scikit-learn)的K-means聚类算法

零基础学Python--机器学习:数据集及特征工程介绍

基于scikit-learn包实现机器学习之KNN(K近邻)-完整示例

机器学习之概述

《机器学习系统设计》之应用scikit-learn做文本分类(上)

机器学习之必知开源数据集