如何将 numpy Array 转换为 tensorflow 可以分类的数据类型?

Posted

技术标签:

【中文标题】如何将 numpy Array 转换为 tensorflow 可以分类的数据类型?【英文标题】:How do I convert a numpy Array to a data type that tensorflow can classify? 【发布时间】:2017-07-15 07:52:24 【问题描述】:

我正在编写一个 Python 程序来检测棋盘的状态,并且我正在使用滑动窗口来检测每个棋子的位置。我的主程序检测图像中的棋盘并将其裁剪的图片传递给 my_sliding_window 方法。这应该是使用 TensorFlow 来检测滑动窗口中的一块。从thistutorial我看到图片是这样读的:

image_data = tf.gfile.FastGFile('picture.jpg', 'rb').read()

但我不想从文件中读取它,因为我已经在一个 numpy 数组中有图片。如何使我的 numpy 数组能够被 Tensorflow 分类?

谢谢。

代码:

import tensorflow as tf, sys
import cv2

image_path = sys.argv[1]


img = cv2.imread('picture.jpg')
image_data = tf.convert_to_tensor(img)
print type(image_data)    # this returns <class 'tensorflow.python.framework.ops.Tensor'>

# This is what is used in the tutorial I mentioned above
image_data2 = tf.gfile.FastGFile(image_path, 'rb').read()
print type(image_data2)    # this returns <type 'str'>


# Loads label file, strips off carriage return
label_lines = [line.rstrip() for line
               in tf.gfile.GFile("retrained_labels.txt")]

# Unpersists graph from file
with tf.gfile.FastGFile("retrained_graph.pb", 'rb') as f:
    graph_def = tf.GraphDef()
    graph_def.ParseFromString(f.read())
    _ = tf.import_graph_def(graph_def, name='')

with tf.Session() as sess:
    # Feed the image_data as input to the graph and get first prediction
    softmax_tensor = sess.graph.get_tensor_by_name('final_result:0')

    predictions = sess.run(softmax_tensor, \
         'DecodeJpeg/contents:0': image_data)

    # Sort to show labels of first prediction in order of confidence
    top_k = predictions[0].argsort()[-len(predictions[0]):][::-1]

    for node_id in top_k:
        human_string = label_lines[node_id]
        score = predictions[0][node_id]
        print('%s (score = %.5f)' % (human_string, score))

【问题讨论】:

【参考方案1】:

我用这个单线解决了这个问题:

image_data = cv2.imencode('.jpg', cv_image)[1].tostring()

【讨论】:

【参考方案2】:

您可以使用 tf.convert_to_tensor() 将您的 numpy 数组转换为 TensorFlow 张量:

该函数将各种类型的 Python 对象转换为 Tensor 对象。它接受张量对象、numpy 数组、Python 列表和 Python 标量。

更新

好的,所以您要做的是将尺寸为[123, 82] 的numpy 数组image_data 提供给占位符DecodeJpeg/contents:0。然而,占位符是用 shape=() 定义的,这意味着它只接受 0D 张量作为输入(参见 tensor shapes),因此会引发错误。

original code 所做的是将图像读取为无量纲字符串:

image_data = tf.gfile.FastGFile(image_path, 'rb').read()

然后将其馈送到DecodeJpeg/contents:0 占位符:

predictions = sess.run(softmax_tensor, 'DecodeJpeg/contents:0': image_data)

继续并尝试通过预训练图表运行图像的最简单方法是使用相同的 tf.gfile.FastGFile() 调用来加载图像。

【讨论】:

在我的 numpy 数组上使用该函数时出现此错误:TypeError: The value of a feed cannot be a tf.Tensor object。可接受的提要值包括 Python 标量、字符串、列表或 numpy ndarray。我将在问题中包含我的代码。 那是因为你不能将 Tensor 对象作为 feed 参数传递给 sess.run()。尝试直接传递 numpy 数组。 这就是我首先尝试的,但我得到了这个错误:ValueError: Cannot feed value of shape (123, 82) for Tensor u'DecodeJpeg/contents:0', which has shape '( )' 。我从这一行得到它: predictions = sess.run(softmax_tensor, \ 'DecodeJpeg/contents:0': image_data) 所以我应该(事实上这是我在试图理解这一点时所做的)将这些图像写入文件并使用 tf.gfile.FastGFile(image_path, 'rb').read 将它们读回() ?它有效,但效率不高。一定有办法直接使用numpy数组。 在您的代码中,根据img = cv2.imread('picture.jpg') 行,您似乎已经有了图像文件。我的建议是您执行image_data = tf.gfile.FastGFile('picture.jpg', 'rb').read(),然后将其提供给占位符。此外,确实有一种方法可以使用 numpy 数组作为占位符的输入,但这需要您再次创建图表,或者尝试修改预训练的图表(我不确定这是否可能)。

以上是关于如何将 numpy Array 转换为 tensorflow 可以分类的数据类型?的主要内容,如果未能解决你的问题,请参考以下文章

将numpy数组转换为数据框[重复]

如何将 PIL 图像转换为 numpy 数组?

将浮点 numpy 数组转换为字符串数组 Python

将两个numpy数组转换为数据框

如何将 2D float numpy 数组转换为 2D int numpy 数组?

如何在 Numpy 中将索引数组转换为掩码数组?