顺序模型中层的附加参数

Posted

技术标签:

【中文标题】顺序模型中层的附加参数【英文标题】:additional parameters for layer in sequential model 【发布时间】:2018-07-20 23:43:47 【问题描述】:

我正在尝试在顺序模型中使用一个新层,但是,该层需要一些额外的输入。当模型不是顺序的。模型是这样的

X_in = Input(shape=(X.shape[1],))    
H = Dropout(0.5)(X_in)
H = GraphConvolution(16, support, activation='relu', kernel_regularizer=l2(5e-4))([H]+[G])
H = Dropout(0.5)(H)
Y = GraphConvolution(y.shape[1], support, activation='softmax')([H]+[G])
model = Model(inputs=[X_in]+[G], outputs=Y)
model.compile(loss='categorical_crossentropy', optimizer=Adam(lr=0.01))

我尝试使用如下的sequential()函数,但不知道如何以这种方式添加图层。

model2 = Sequential()
batch_size = 5
model2.add(Dropout(0.5, input_shape=(X.shape[0], X.shape[1])))

我还尝试创建输入序列并在不同的时间戳独立调用 GraphConvolution。 我试过了

input_sequences = Input(shape=(X.shape[0], X.shape[1]))

还有

input_sequences = Input(shape=(batch_size, X.shape[0], X.shape[1]),batch_shape=(None, None, None))

但我真的不知道如何独立处理输入序列的每个输入。因为input_sequences.shape[0] = None

这个问题很简单,我多次遇到同样的问题。非常感谢,欢迎任何答案。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ ~~~~~~~~~~~~

我有一些解决方案,但不是那么简单。我在 Input 函数中使用了 batch_shape:

with tf.name_scope('input_sequence'):
    input_sequences = Input(batch_shape=(X.shape[0], timestamps, X.shape[1]))
    gcn_output = []

    for i in range(timestamps):
        gcn_output.append(tf.expand_dims(model([input_sequences[:,i,:]]+[G]),1))
    gcn_output_tensor = tf.concat(
        gcn_output,
        axis=1,
        name='concat'
    )

【问题讨论】:

使用batch_input_shape 似乎是解决您的问题最方便的方法。 @MarcinMożejko 谢谢! @MarcinMożejko 你知道如何改进处理每个时间戳的输入并将它们连接起来的过程吗?我当前的实现使用了一个列表,然后是 concat,这看起来并不那么简单......谢谢! 我也有同样的问题,还是不知道怎么办。 【参考方案1】:

使用 input_sequences = Input(batch_shape=(X.shape[0], timestamps, X.shape[1]))

【讨论】:

以上是关于顺序模型中层的附加参数的主要内容,如果未能解决你的问题,请参考以下文章

CLGeoCoder 未按正确顺序附加地标

顺序模型api

按顺序附加异步响应 swit 3

将数据附加到属性文件,注释消失并更改数据顺序[重复]

将多个元素附加到 DOM 的 jquery 会丢失排序顺序

附加两个具有相同列、不同顺序的数据框