加载权重后如何在 keras 中添加和删除新图层?
Posted
技术标签:
【中文标题】加载权重后如何在 keras 中添加和删除新图层?【英文标题】:How to add and remove new layers in keras after loading weights? 【发布时间】:2017-05-30 20:15:54 【问题描述】:我正在尝试进行迁移学习;为此,我想删除神经网络的最后两层并添加另外两层。这是一个也输出相同错误的示例代码。
from keras.models import Sequential
from keras.layers import Input,Flatten
from keras.layers.convolutional import Convolution2D, MaxPooling2D
from keras.layers.core import Dropout, Activation
from keras.layers.pooling import GlobalAveragePooling2D
from keras.models import Model
in_img = Input(shape=(3, 32, 32))
x = Convolution2D(12, 3, 3, subsample=(2, 2), border_mode='valid', name='conv1')(in_img)
x = Activation('relu', name='relu_conv1')(x)
x = MaxPooling2D(pool_size=(3, 3), strides=(2, 2), name='pool1')(x)
x = Convolution2D(3, 1, 1, border_mode='valid', name='conv2')(x)
x = Activation('relu', name='relu_conv2')(x)
x = GlobalAveragePooling2D()(x)
o = Activation('softmax', name='loss')(x)
model = Model(input=in_img, output=[o])
model.compile(loss="categorical_crossentropy", optimizer="adam")
#model.load_weights('model_weights.h5', by_name=True)
model.summary()
model.layers.pop()
model.layers.pop()
model.summary()
model.add(MaxPooling2D())
model.add(Activation('sigmoid', name='loss'))
我使用pop()
删除了该层,但是当我尝试添加它时输出此错误
AttributeError: 'Model' 对象没有属性 'add'
我知道错误的最可能原因是model.add()
使用不当。我应该使用什么其他语法?
编辑:
我尝试在 keras 中删除/添加图层,但在加载外部权重后不允许添加。
from keras.models import Sequential
from keras.layers import Input,Flatten
from keras.layers.convolutional import Convolution2D, MaxPooling2D
from keras.layers.core import Dropout, Activation
from keras.layers.pooling import GlobalAveragePooling2D
from keras.models import Model
in_img = Input(shape=(3, 32, 32))
def gen_model():
in_img = Input(shape=(3, 32, 32))
x = Convolution2D(12, 3, 3, subsample=(2, 2), border_mode='valid', name='conv1')(in_img)
x = Activation('relu', name='relu_conv1')(x)
x = MaxPooling2D(pool_size=(3, 3), strides=(2, 2), name='pool1')(x)
x = Convolution2D(3, 1, 1, border_mode='valid', name='conv2')(x)
x = Activation('relu', name='relu_conv2')(x)
x = GlobalAveragePooling2D()(x)
o = Activation('softmax', name='loss')(x)
model = Model(input=in_img, output=[o])
return model
#parent model
model=gen_model()
model.compile(loss="categorical_crossentropy", optimizer="adam")
model.summary()
#saving model weights
model.save('model_weights.h5')
#loading weights to second model
model2=gen_model()
model2.compile(loss="categorical_crossentropy", optimizer="adam")
model2.load_weights('model_weights.h5', by_name=True)
model2.layers.pop()
model2.layers.pop()
model2.summary()
#editing layers in the second model and saving as third model
x = MaxPooling2D()(model2.layers[-1].output)
o = Activation('sigmoid', name='loss')(x)
model3 = Model(input=in_img, output=[o])
显示此错误
RuntimeError: Graph disconnected: cannot obtain value for tensor input_4 at layer "input_4". The following previous layers were accessed without issue: []
【问题讨论】:
这似乎与您的问题相似 [1]:***.com/questions/54284898/…。 【参考方案1】:你可以取上一个模型的output
,创建一个新模型。较低的层保持不变。
model.summary()
model.layers.pop()
model.layers.pop()
model.summary()
x = MaxPooling2D()(model.layers[-1].output)
o = Activation('sigmoid', name='loss')(x)
model2 = Model(input=in_img, output=[o])
model2.summary()
查看How to use models from keras.applications for transfer learnig?
编辑更新:
新错误是因为您试图在全局in_img
上创建新模型,这实际上未在以前的模型创建中使用。您实际上是在定义一个本地in_img
。所以全局in_img
显然没有连接到符号图中的上层。并且与负重无关。
为了更好地解决这个问题,您应该改用model.input
来引用输入。
model3 = Model(input=model2.input, output=[o])
【讨论】:
【参考方案2】:另一种方法
from keras.models import Model
layer_name = 'relu_conv2'
model2= Model(inputs=model1.input, outputs=model1.get_layer(layer_name).output)
【讨论】:
【参考方案3】:从 Keras 2.3.1 和 TensorFlow 2.0 开始,model.layers.pop()
无法按预期工作(请参阅问题 here)。他们提出了两种选择。
一种选择是重新创建模型并复制图层。例如,如果您想删除最后一层并添加另一层,您可以这样做:
model = Sequential()
for layer in source_model.layers[:-1]: # go through until last layer
model.add(layer)
model.add(Dense(3, activation='softmax'))
model.summary()
model.compile(optimizer='adam', loss='categorical_crossentropy')
另一种选择是使用函数模型:
predictions = Dense(3, activation='softmax')(source_model.layers[-2].output)
model = Model(inputs=inputs, outputs=predictions)
model.compile(optimizer='adam', loss='categorical_crossentropy')
model.layers[-1].output
表示最后一层的输出,即最终输出,所以在您的代码中,您实际上并没有删除任何层,而是添加了另一个头部/路径。
【讨论】:
【参考方案4】:Wesam Na 的答案的替代方案,如果您不知道图层名称,您可以通过以下方式简单地切断最后一层:
from keras.models import Model
model2= Model(inputs=model1.input, outputs=model1.layers[-2].output)
【讨论】:
以上是关于加载权重后如何在 keras 中添加和删除新图层?的主要内容,如果未能解决你的问题,请参考以下文章
使用 Keras,如何将 CuDNNLSTM 生成的权重加载到 LSTM 模型中?
如何使用 PyTorch 在预训练模型上添加新层? (给出了 Keras 示例。)