加载权重后如何在 keras 中添加和删除新图层?

Posted

技术标签:

【中文标题】加载权重后如何在 keras 中添加和删除新图层?【英文标题】:How to add and remove new layers in keras after loading weights? 【发布时间】:2017-05-30 20:15:54 【问题描述】:

我正在尝试进行迁移学习;为此,我想删除神经网络的最后两层并添加另外两层。这是一个也输出相同错误的示例代码。

from keras.models import Sequential
from keras.layers import Input,Flatten
from keras.layers.convolutional import Convolution2D, MaxPooling2D
from keras.layers.core import Dropout, Activation
from keras.layers.pooling import GlobalAveragePooling2D
from keras.models import Model

in_img = Input(shape=(3, 32, 32))
x = Convolution2D(12, 3, 3, subsample=(2, 2), border_mode='valid', name='conv1')(in_img)
x = Activation('relu', name='relu_conv1')(x)
x = MaxPooling2D(pool_size=(3, 3), strides=(2, 2), name='pool1')(x)
x = Convolution2D(3, 1, 1, border_mode='valid', name='conv2')(x)
x = Activation('relu', name='relu_conv2')(x)
x = GlobalAveragePooling2D()(x)
o = Activation('softmax', name='loss')(x)
model = Model(input=in_img, output=[o])
model.compile(loss="categorical_crossentropy", optimizer="adam")
#model.load_weights('model_weights.h5', by_name=True)
model.summary()

model.layers.pop()
model.layers.pop()
model.summary()
model.add(MaxPooling2D())
model.add(Activation('sigmoid', name='loss'))

我使用pop() 删除了该层,但是当我尝试添加它时输出此错误

AttributeError: 'Model' 对象没有属性 'add'

我知道错误的最可能原因是model.add() 使用不当。我应该使用什么其他语法?

编辑:

我尝试在 keras 中删除/添加图层,但在加载外部权重后不允许添加。

from keras.models import Sequential
from keras.layers import Input,Flatten
from keras.layers.convolutional import Convolution2D, MaxPooling2D
from keras.layers.core import Dropout, Activation
from keras.layers.pooling import GlobalAveragePooling2D
from keras.models import Model
in_img = Input(shape=(3, 32, 32))

def gen_model():
    in_img = Input(shape=(3, 32, 32))
    x = Convolution2D(12, 3, 3, subsample=(2, 2), border_mode='valid', name='conv1')(in_img)
    x = Activation('relu', name='relu_conv1')(x)
    x = MaxPooling2D(pool_size=(3, 3), strides=(2, 2), name='pool1')(x)
    x = Convolution2D(3, 1, 1, border_mode='valid', name='conv2')(x)
    x = Activation('relu', name='relu_conv2')(x)
    x = GlobalAveragePooling2D()(x)
    o = Activation('softmax', name='loss')(x)
    model = Model(input=in_img, output=[o])
    return model

#parent model
model=gen_model()
model.compile(loss="categorical_crossentropy", optimizer="adam")
model.summary()

#saving model weights
model.save('model_weights.h5')

#loading weights to second model
model2=gen_model()
model2.compile(loss="categorical_crossentropy", optimizer="adam")
model2.load_weights('model_weights.h5', by_name=True)

model2.layers.pop()
model2.layers.pop()
model2.summary()

#editing layers in the second model and saving as third model
x = MaxPooling2D()(model2.layers[-1].output)
o = Activation('sigmoid', name='loss')(x)
model3 = Model(input=in_img, output=[o])

显示此错误

RuntimeError: Graph disconnected: cannot obtain value for tensor input_4 at layer "input_4". The following previous layers were accessed without issue: []

【问题讨论】:

这似乎与您的问题相似 [1]:***.com/questions/54284898/…。 【参考方案1】:

你可以取上一个模型的output,创建一个新模型。较低的层保持不变。

model.summary()
model.layers.pop()
model.layers.pop()
model.summary()

x = MaxPooling2D()(model.layers[-1].output)
o = Activation('sigmoid', name='loss')(x)

model2 = Model(input=in_img, output=[o])
model2.summary()

查看How to use models from keras.applications for transfer learnig?

编辑更新:

新错误是因为您试图在全局in_img 上创建新模型,这实际上未在以前的模型创建中使用。您实际上是在定义一个本地in_img。所以全局in_img显然没有连接到符号图中的上层。并且与负重无关。

为了更好地解决这个问题,您应该改用model.input 来引用输入。

model3 = Model(input=model2.input, output=[o])

【讨论】:

【参考方案2】:

另一种方法

from keras.models import Model

layer_name = 'relu_conv2'
model2= Model(inputs=model1.input, outputs=model1.get_layer(layer_name).output)

【讨论】:

【参考方案3】:

从 Keras 2.3.1 和 TensorFlow 2.0 开始,model.layers.pop() 无法按预期工作(请参阅问题 here)。他们提出了两种选择。

一种选择是重新创建模型并复制图层。例如,如果您想删除最后一层并添加另一层,您可以这样做:

model = Sequential()
for layer in source_model.layers[:-1]: # go through until last layer
    model.add(layer)
model.add(Dense(3, activation='softmax'))
model.summary()
model.compile(optimizer='adam', loss='categorical_crossentropy')

另一种选择是使用函数模型:

predictions = Dense(3, activation='softmax')(source_model.layers[-2].output)
model = Model(inputs=inputs, outputs=predictions)
model.compile(optimizer='adam', loss='categorical_crossentropy')

model.layers[-1].output 表示最后一层的输出,即最终输出,所以在您的代码中,您实际上并没有删除任何层,而是添加了另一个头部/路径。

【讨论】:

【参考方案4】:

Wesam Na 的答案的替代方案,如果您不知道图层名称,您可以通过以下方式简单地切断最后一层:

from keras.models import Model

model2= Model(inputs=model1.input, outputs=model1.layers[-2].output)

【讨论】:

以上是关于加载权重后如何在 keras 中添加和删除新图层?的主要内容,如果未能解决你的问题,请参考以下文章

使用 Keras,如何将 CuDNNLSTM 生成的权重加载到 LSTM 模型中?

如何使用 PyTorch 在预训练模型上添加新层? (给出了 Keras 示例。)

如何在 Keras 中重新初始化现有模型的层权重?

Keras:如何在损失函数中使用层的权重?

如果我将层传递给两个 Keras 模型并且只训练一个模型,那么在前者训练后两个模型会共享权重吗

如何使用Keras API提取隐藏层的权重