如何在 theano 中保存/序列化经过训练的模型？

Posted 2023-05-07

技术标签:

【中文标题】如何在 theano 中保存/序列化经过训练的模型？【英文标题】：How to save / serialize a trained model in theano? 【发布时间】：2015-08-10 13:38:47 【问题描述】：

我将模型保存在 loading and saving 上。

# saving trained model
f = file('models/simple_model.save', 'wb')
cPickle.dump(ca, f, protocol=cPickle.HIGHEST_PROTOCOL)
f.close()

ca 是经过训练的自动编码器。它是类cA 的一个实例。从我构建和保存模型的脚本中，我可以毫无问题地调用ca.get_reconstructed_input(...) 和ca.get_hidden_values(...)。

在不同的脚本中，我尝试加载经过训练的模型。

# loading the trained model
model_file = file('models/simple_model.save', 'rb')
ca = cPickle.load(model_file)
model_file.close()

我收到以下错误。

ca = cPickle.load(model_file)
AttributeError: 'module' 对象没有属性 'cA'

【问题讨论】：

【参考方案1】：

解酸的脚本需要知道酸洗对象的所有类定义。其他 *** 问题（例如 AttributeError: 'module' object has no attribute 'newperson'）中对此有更多说明。

只要您正确导入cA，您的代码就是正确的。鉴于您遇到的错误可能并非如此。确保您使用的是from cA import cA 而不仅仅是import cA。

或者，您的模型由其参数定义，因此您可以只腌制参数值）。这可以通过两种方式完成，具体取决于您的观点。

保存 Theano 共享变量。这里我们假设ca.params 是Theano 共享变量实例的常规Python 列表。

cPickle.dump(ca.params, f, protocol=cPickle.HIGHEST_PROTOCOL)

保存存储在 Theano 共享变量中的 numpy 数组。

cPickle.dump([param.get_value() for param in ca.params], f, protocol=cPickle.HIGHEST_PROTOCOL)

当您想要加载模型时，您需要重新初始化参数。例如，创建cA 类的新实例，然后

ca.params = cPickle.load(f)
ca.W, ca.b, ca.b_prime = ca.params

或

ca.params = [theano.shared(param) for param in cPickle.load(f)]
ca.W, ca.b, ca.b_prime = ca.params

请注意，您需要同时设置params 字段和单独的参数字段。

【讨论】：

我看到的错误是由于我使用的是import cA 而不是from cA import cA。我发布的代码是正确的。你的选择也是正确的。我认为关闭此线程的最简洁方法是让您在第一段中添加一些内容（确定问题的真正根源），例如“确保您使用的是from cA import cA 而不仅仅是import cA”，我可以将您的答案标记为已接受。谢谢！对我来说，从 cpickle 加载模型与编译它的速度差不多。据我了解，知道这个pickle文件本质上将绑定到相同的硬件是非常重要的，至少你不能在基于cpu的Theano上加载基于cuda的模型.在不同硬件之间传输学习到的网络并非易事，这让我感到非常惊讶。学习到的网络只需要经过训练的参数即可。您不需要腌制已编译的 Theano 函数。实际上，出于您给出的原因，最好避免这种情况。最好简单地腌制模型参数（作为 numpy 数组，而不是 Theano 共享变量），然后将它们加载回编译的任何形式的网络（即 CPU 或 GPU 版本）。 @DanielRenshaw 应该可以使用theano.misc.pkl_utils.dump() 和theano.misc.pkl_utils.load() 进行序列化/反序列化。【参考方案2】：

另一种保存模型的方法是保存其权重和架构，然后加载它们，就像我们对预训练 CNN 所做的那样：

def save_model(model):


   model_json = model.to_json()
   open('cifar10_architecture.json', 'w').write(model_json)
   model.save_weights('cifar10_weights.h5', overwrite=True)

来源/参考：https://blog.rescale.com/neural-networks-using-keras-on- rescale/

【讨论】：

以上是关于如何在 theano 中保存/序列化经过训练的模型？的主要内容，如果未能解决你的问题，请参考以下文章