在 Keras 中使用 load_weights 加载模型时出错

Posted

技术标签:

【中文标题】在 Keras 中使用 load_weights 加载模型时出错【英文标题】:Error in loading the model with load_weights in Keras 【发布时间】:2019-07-29 15:49:29 【问题描述】:

我在 Linux 平台上用 keras(回归)训练了一个模型,并用 model.save_weights("kwhFinal.h5") 保存了模型

然后我希望在我的 Windows 10 笔记本电脑上将我完整保存的模型带到 Python 3.6,然后在 IDLE 中使用它:

from keras.models import load_model

# load weights into new model
loaded_model.load_weights("kwhFinal.h5")
print("Loaded model from disk")

除非我在 Keras 中遇到了这种只读模式 ValueError。通过 pip 我在我的 Windows 10 笔记本电脑上安装了 Keras 和 Tensorflow,并在网上进行了更多研究,看起来像这样 other SO post about the same issue,答案是:

您必须设置和定义模型的架构,然后使用 model.load_weights

但我对此的理解不足以从答案中重新创建代码(链接到 git gist)。下面是我在 Linux 操作系统上运行以创建模型的 Keras 脚本。谁能给我一个关于如何定义架构的提示,以便我可以使用此模型在我的 Windows 10 笔记本电脑上进行预测?

#https://machinelearningmastery.com/custom-metrics-deep-learning-keras-python/
#https://machinelearningmastery.com/save-load-keras-deep-learning-models/
#https://machinelearningmastery.com/regression-tutorial-keras-deep-learning-library-python/


import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import math
from keras.models import Sequential
from keras.layers import Dense
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import mean_squared_error
from keras import backend
from keras.models import model_from_json
import os



def rmse(y_true, y_pred):
    return backend.sqrt(backend.mean(backend.square(y_pred - y_true), axis=-1))

# load dataset
dataset = pd.read_csv("joinedRuntime2.csv", index_col='Date', parse_dates=True)

print(dataset.shape)
print(dataset.dtypes)
print(dataset.columns)

# shuffle dataset
df = dataset.sample(frac=1.0)

# split into input (X) and output (Y) variables
X = df.drop(['kWh'],1)
Y = df['kWh']

offset = int(X.shape[0] * 0.7)
X_train, Y_train = X[:offset], Y[:offset]
X_test, Y_test = X[offset:], Y[offset:]


model = Sequential()
model.add(Dense(60, input_dim=7, kernel_initializer='normal', activation='relu'))
model.add(Dense(55, kernel_initializer='normal', activation='relu'))
model.add(Dense(50, kernel_initializer='normal', activation='relu'))
model.add(Dense(45, kernel_initializer='normal', activation='relu'))
model.add(Dense(30, kernel_initializer='normal', activation='relu'))
model.add(Dense(20, kernel_initializer='normal', activation='relu'))
model.add(Dense(1, kernel_initializer='normal'))
model.summary()

model.compile(loss='mse', optimizer='adam', metrics=[rmse])

# train model
history = model.fit(X_train, Y_train, epochs=5, batch_size=1,  verbose=2)

# plot metrics
plt.plot(history.history['rmse'])
plt.title("kWh RSME Vs Epoch")
plt.show()

# serialize model to JSON
model_json = model.to_json()
with open("model.json", "w") as json_file:
    json_file.write(model_json)

model.save_weights("kwhFinal.h5")
print("[INFO] Saved model to disk")

在机器学习掌握方面,他们还展示了保存 YML 和 Json,但我不确定这是否有助于定义模型架构...

【问题讨论】:

【参考方案1】:

您保存的是权重,而不是整个模型。模型不仅仅是权重,包括架构、损失、指标等。

您有两种解决方案:

1) 保存权重:在这种情况下,在加载模型时,您需要重新创建模型,加载权重,然后编译模型。你的代码应该是这样的:

model = Sequential()
model.add(Dense(60, input_dim=7, kernel_initializer='normal', activation='relu'))
model.add(Dense(55, kernel_initializer='normal', activation='relu'))
model.add(Dense(50, kernel_initializer='normal', activation='relu'))
model.add(Dense(45, kernel_initializer='normal', activation='relu'))
model.add(Dense(30, kernel_initializer='normal', activation='relu'))
model.add(Dense(20, kernel_initializer='normal', activation='relu'))
model.add(Dense(1, kernel_initializer='normal'))
model.load_weights("kwhFinal.h5")
model.compile(loss='mse', optimizer='adam', metrics=[rmse])

2) 通过这个命令保存整个模型:

model.save("kwhFinal.h5")

在加载过程中使用这个命令来加载你的模型:

from keras.models import load_model
model=load_model("kwhFinal.h5")

【讨论】:

【参考方案2】:

将模型另存为:

model.save("kwhFinal.h5")

在加载模型时,您需要添加您定义的自定义度量函数。

model=load_model("kwhFinal.h5",custom_objects='rmse': rmse)

【讨论】:

【参考方案3】:

首先将 load_model 从 keras 更改为 tensorflow.keras

from tensorflow.keras.models import load_model

但即使模型加载显示像 KeyError: 'sample_weight_mode' 这样的错误,请执行以下操作

from tensorflow.keras.models import load_model

model = load_model('model.h5', compile = False)

【讨论】:

以上是关于在 Keras 中使用 load_weights 加载模型时出错的主要内容,如果未能解决你的问题,请参考以下文章

Tensorflow+keras解决使用model.load_weights时报错 ‘str‘ object has no attribute ‘decode‘

Keras model.load_weights() error: ValueError: Invalid high library version bound (invalid high libra

加载权重 keras LSTM 不工作

Keras保存模型

我在 google colab 上训练了一个 keras 模型。现在无法在我的系统上本地加载它。

是否应该在使用 model.load_weights() 之前运行 model.compile(),如果模型只是稍微改变了说 dropout?