处理图像以将数据输入卷积神经网络
Posted
技术标签:
【中文标题】处理图像以将数据输入卷积神经网络【英文标题】:Processing Image To Feed data in to Convolutional Neural Network 【发布时间】:2017-05-13 18:08:04 【问题描述】:我是机器学习的新手,最近参加了 Andrew Ng 在 Coursera 上的课程。 之后我转向 Python 并使用 Pandas、Numpy、Sklearn 来实现 ML 算法。 现在在冲浪时,我遇到了 tensorFLow,发现它非常棒,并实现了这个example,它以 MNIST 数据作为输入。 现在我想阅读我自己的自定义图像并将它们用于训练。我对如何将图像转换为 MNIST 类型的数据感到困惑。或其他方式来训练我的网络。 我用这个tutorial 来创建我的网络。
【问题讨论】:
【参考方案1】:有关 MNIST 数据集的信息可以在 Yann LeCun's website 上找到。
TensorFlow 模块tensorflow.examples.tutorials.mnist.mnist_softmax.py 似乎正在为训练/测试步骤获取/准备数据集。
MNIST 数据集包含手写数字的图像和相应的标签。如果您想为新图像创建标签,可以使用scipy.misc.imread。
【讨论】:
您好,感谢您的信息。我使用this 将我的jpg 转换为字节数组。然后使用this 将其转换为MNIST 形式。但是在第一个链接中,为什么它将任何 jpg 图像转换为 png ???我没明白,为什么不调整 jpg tp jpg 的大小并改用它。 :?其次,在 MNIST website 上,它说了一些奇怪的话,例如:“数字已被大小标准化并以固定大小的图像为中心” 关于 MNIST 的解释呢? “来自 NIST 的原始黑白(双水平)图像经过尺寸归一化以适合 20x20 像素框,同时保持其纵横比。由于归一化算法使用的抗锯齿技术,生成的图像包含灰度级。图像通过计算像素的质心在 28x28 图像中居中,并平移图像以将该点定位在 28x28 字段的中心。使用分类方法,当数字以边界框为中心时,错误率得到改善而不是质心。”以上是关于处理图像以将数据输入卷积神经网络的主要内容,如果未能解决你的问题,请参考以下文章