在 Keras 中使用 load_weights 加载模型时出错

Posted 2023-02-23

技术标签:

【中文标题】在 Keras 中使用 load_weights 加载模型时出错【英文标题】：Error in loading the model with load_weights in Keras 【发布时间】：2019-07-29 15:49:29 【问题描述】：

我在 Linux 平台上用 keras（回归）训练了一个模型，并用 model.save_weights("kwhFinal.h5") 保存了模型

然后我希望在我的 Windows 10 笔记本电脑上将我完整保存的模型带到 Python 3.6，然后在 IDLE 中使用它：

from keras.models import load_model

# load weights into new model
loaded_model.load_weights("kwhFinal.h5")
print("Loaded model from disk")

除非我在 Keras 中遇到了这种只读模式 ValueError。通过 pip 我在我的 Windows 10 笔记本电脑上安装了 Keras 和 Tensorflow，并在网上进行了更多研究，看起来像这样 other SO post about the same issue，答案是：

您必须设置和定义模型的架构，然后使用 model.load_weights

但我对此的理解不足以从答案中重新创建代码（链接到 git gist）。下面是我在 Linux 操作系统上运行以创建模型的 Keras 脚本。谁能给我一个关于如何定义架构的提示，以便我可以使用此模型在我的 Windows 10 笔记本电脑上进行预测？

#https://machinelearningmastery.com/custom-metrics-deep-learning-keras-python/
#https://machinelearningmastery.com/save-load-keras-deep-learning-models/
#https://machinelearningmastery.com/regression-tutorial-keras-deep-learning-library-python/


import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import math
from keras.models import Sequential
from keras.layers import Dense
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import mean_squared_error
from keras import backend
from keras.models import model_from_json
import os



def rmse(y_true, y_pred):
    return backend.sqrt(backend.mean(backend.square(y_pred - y_true), axis=-1))

# load dataset
dataset = pd.read_csv("joinedRuntime2.csv", index_col='Date', parse_dates=True)

print(dataset.shape)
print(dataset.dtypes)
print(dataset.columns)

# shuffle dataset
df = dataset.sample(frac=1.0)

# split into input (X) and output (Y) variables
X = df.drop(['kWh'],1)
Y = df['kWh']

offset = int(X.shape[0] * 0.7)
X_train, Y_train = X[:offset], Y[:offset]
X_test, Y_test = X[offset:], Y[offset:]


model = Sequential()
model.add(Dense(60, input_dim=7, kernel_initializer='normal', activation='relu'))
model.add(Dense(55, kernel_initializer='normal', activation='relu'))
model.add(Dense(50, kernel_initializer='normal', activation='relu'))
model.add(Dense(45, kernel_initializer='normal', activation='relu'))
model.add(Dense(30, kernel_initializer='normal', activation='relu'))
model.add(Dense(20, kernel_initializer='normal', activation='relu'))
model.add(Dense(1, kernel_initializer='normal'))
model.summary()

model.compile(loss='mse', optimizer='adam', metrics=[rmse])

# train model
history = model.fit(X_train, Y_train, epochs=5, batch_size=1,  verbose=2)

# plot metrics
plt.plot(history.history['rmse'])
plt.title("kWh RSME Vs Epoch")
plt.show()

# serialize model to JSON
model_json = model.to_json()
with open("model.json", "w") as json_file:
    json_file.write(model_json)

model.save_weights("kwhFinal.h5")
print("[INFO] Saved model to disk")

在机器学习掌握方面，他们还展示了保存 YML 和 Json，但我不确定这是否有助于定义模型架构...

【问题讨论】：

【参考方案1】：

您保存的是权重，而不是整个模型。模型不仅仅是权重，包括架构、损失、指标等。

您有两种解决方案：

1) 保存权重：在这种情况下，在加载模型时，您需要重新创建模型，加载权重，然后编译模型。你的代码应该是这样的：

model = Sequential()
model.add(Dense(60, input_dim=7, kernel_initializer='normal', activation='relu'))
model.add(Dense(55, kernel_initializer='normal', activation='relu'))
model.add(Dense(50, kernel_initializer='normal', activation='relu'))
model.add(Dense(45, kernel_initializer='normal', activation='relu'))
model.add(Dense(30, kernel_initializer='normal', activation='relu'))
model.add(Dense(20, kernel_initializer='normal', activation='relu'))
model.add(Dense(1, kernel_initializer='normal'))
model.load_weights("kwhFinal.h5")
model.compile(loss='mse', optimizer='adam', metrics=[rmse])

2) 通过这个命令保存整个模型：

model.save("kwhFinal.h5")

在加载过程中使用这个命令来加载你的模型：

from keras.models import load_model
model=load_model("kwhFinal.h5")

【讨论】：

【参考方案2】：

将模型另存为：

model.save("kwhFinal.h5")

在加载模型时，您需要添加您定义的自定义度量函数。

model=load_model("kwhFinal.h5",custom_objects='rmse': rmse)

【讨论】：

【参考方案3】：

首先将 load_model 从 keras 更改为 tensorflow.keras 即

from tensorflow.keras.models import load_model

但即使模型加载显示像 KeyError: 'sample_weight_mode' 这样的错误，请执行以下操作

from tensorflow.keras.models import load_model

model = load_model('model.h5', compile = False)

【讨论】：

以上是关于在 Keras 中使用 load_weights 加载模型时出错的主要内容，如果未能解决你的问题，请参考以下文章