Grad-CAM 可视化:无效参数错误:您必须使用 dtype 浮点数和形状 [x] 为占位符张量“X”提供一个值

Posted

技术标签:

【中文标题】Grad-CAM 可视化:无效参数错误:您必须使用 dtype 浮点数和形状 [x] 为占位符张量“X”提供一个值【英文标题】:Grad-CAM visualization: Invalid Argument Error: You must feed a value for placeholder tensor 'X' with dtype float and shape [x] 【发布时间】:2019-04-02 02:56:52 【问题描述】:

我正在尝试使用 CNN 可视化分类任务的重要区域。

我正在使用 VGG16 + 我自己的顶层(一个全局平均池化层和一个 Dense 层)

model_vgg16_conv = VGG16(weights='imagenet', include_top=False, input_shape=(100, 100, 3))

model = models.Sequential()

model.add(model_vgg16_conv)

model.add(Lambda(global_average_pooling, output_shape=global_average_pooling_shape))
model.add(Dense(4, activation = 'softmax', init='uniform'))

编译和拟合模型后,我尝试使用 Grad-CAM 制作新图像:

image = cv2.imread("data/example_images/test.jpg")
# Resize to 100x100
image = resize(image,(100,100),anti_aliasing=True, mode='constant')
# Because it's a grey scale image extend the dimensions
image = np.repeat(image.reshape(1,100, 100, 1), 3, axis=3)

class_weights = model.get_layer("dense_1").get_weights()[0]
final_conv_layer = model.get_layer("vgg16").get_layer("block5_conv3")
input1 = model.get_layer("vgg16").layers[0].input
output1 = model.get_layer("dense_1").output
get_output = K.function([input1], [final_conv_layer.output, output1])

之后我正在执行

[conv_outputs, predictions] = get_output([image])

导致如下错误:

InvalidArgumentError:您必须为占位符张量“vgg16_input”提供一个值,其 dtype 为 float 和 shape [?,100,100,3] [[node vgg16_input]] [[dense_1/Softmax/_233]]

其他信息

def global_average_pooling(x):
    return K.mean(x, axis = (2, 3))

def global_average_pooling_shape(input_shape):
    return input_shape[0:2]

模型总结:

Layer (type)                 Output Shape              Param #   
=================================================================
vgg16 (Model)                (None, 3, 3, 512)         14714688  
_________________________________________________________________
lambda_1 (Lambda)            (None, 3)                 0         
_________________________________________________________________
dense_1 (Dense)              (None, 4)                 16        
=================================================================
Total params: 14,714,704
Trainable params: 16
Non-trainable params: 14,714,688

VGG-模型总结:

Layer (type)                 Output Shape              Param #   
=================================================================
input_1 (InputLayer)         (None, 100, 100, 3)       0   
...

我是 Grad-CAM 的新手,我不确定我是否只是在监督某些事情,或者我是否误解了整个概念。

【问题讨论】:

【参考方案1】:

使用 Sequential,层是通过 add() 方法添加的。在这种情况下,由于直接添加了模型对象,因此模型现在有两个输入 - 一个通过 Sequential,另一个通过 model_vgg16_conv。

>>> layer = model.layers[0]
>>> layer.get_input_at(0)
<tf.Tensor 'input_1:0' shape=(?, ?, ?, 3) dtype=float32>
>>> layer.get_input_at(1)
<tf.Tensor 'vgg16_input:0' shape=(?, ?, ?, 3) dtype=float32>

由于使用 K.function,只提供了一个输入,因此出现有关“vgg16_input”的缺少输入的错误。这会工作,

get_output = K.function([input1] + [model.input], [final_conv_layer.output, output1])

[conv_outputs, predictions] = get_output([image, image])

但函数式 API 可以像这样在这种情况下使用:

model_vgg16_conv = VGG16(weights='imagenet', include_top=False, input_shape=(100, 100, 3))
gavg = Lambda(global_average_pooling, output_shape=global_average_pooling_shape)(model_vgg16_conv.output)
output = Dense(4, activation = 'softmax', init='uniform')(gavg)
model_f = Model(model_vgg16_conv.input, output)

final_conv_layer = model_f.get_layer("block5_conv3")
get_output = K.function([model_f.input], [final_conv_layer.output, model_f.output])
[conv_outputs, predictions] = get_output([image])

【讨论】:

非常感谢。很好解释。像魅力一样工作!

以上是关于Grad-CAM 可视化:无效参数错误:您必须使用 dtype 浮点数和形状 [x] 为占位符张量“X”提供一个值的主要内容,如果未能解决你的问题,请参考以下文章

学习打卡04可解释机器学习笔记之Grad-CAM

学习打卡04可解释机器学习笔记之Grad-CAM

学习打卡04可解释机器学习笔记之Grad-CAM

您如何解决此参数无效错误? (C#、VisualStudio、WinForms)

Microsoft Edge 的“无效参数:'handle' 必须是字符串”错误以及如何添加“w3c:false”功能?

无效参数:“使用”必须是在 iframe 中提取图像源的字符串