带有noise_shape的Keras Dropout

Question

我有一个关于Keras函数Dropout的问题，其中包含noise_shape的参数。

问题1：

如果您的输入具有形状（batch_size，timesteps，features）并且您希望所有时间步长的丢失掩码相同，那么您可以使用noise_shape =（batch_size，1，features）?,添加的好处是什么？这个论点？

这是否意味着将被淘汰的神经元数量沿着时间步长是相同的？这意味着在每个时间步都会有n个神经元掉落？

问题2：在创建模型时，我是否必须在noise_shape中包含'batch_size'？ - >参见以下示例。

假设我有一个多变量的时间序列数据，形状为（10000,1,100,2） - >（数据的数量，通道，时间步长，特征数）。

然后我创建批量大小为64 - >（64,1,100,2）的批次

如果我想创建一个退出的CNN模型，我使用Keras功能API：

inp = Input([1, 100, 2])
conv1 = Conv2D(64, kernel_size=(11,2), strides(1,1),data_format='channels_first')(inp)
max1 = MaxPooling2D((2,1))(conv1)
max1_shape = max1._keras_shape
drop1 = Dropout((0.1, noise_shape=[**?**, max1._keras_shape[1], 1, 1]))

因为图层max1的输出形状应为（None，64,50,1），并且我不能将None分配给问号（对应于batch_size）

我想知道我应该如何应对这个问题？我应该使用（64,1,1）作为noise_shape吗？或者我应该定义一个名为'batch_size'的变量，然后将它传递给这个参数，如（batch_size，64,1,1）？