如何存储 CNN 提取的特征来训练 SVM 分类器
Posted
技术标签:
【中文标题】如何存储 CNN 提取的特征来训练 SVM 分类器【英文标题】:How to store CNN extracted features to train a SVM classifier 【发布时间】:2018-10-25 19:26:28 【问题描述】:使用如下所示的 2D CNN 从图像中提取特征,我如何存储提取的特征以训练 SVM 对特征进行分类?
型号:
model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape=(3, 150, 150)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Flatten()) # this converts our 3D feature maps to 1D feature vectors
model.add(Dense(64))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(4))
model.add(Activation('softmax'))
提取特征:
layer_name = 'layer_name'
intermediate_layer_model = Model(inputs=model.input,
outputs=model.get_layer(layer_name).output)
intermediate_output = intermediate_layer_model.predict(data)
步骤:
从我的图像数据集中存储这些提取的特征,以便训练 SVM 分类器。
使用train_test_split()
分割训练和测试数据
训练分类器:
clf = svm.SVC()
clf.fit(X, y)
我需要知道怎么做。
【问题讨论】:
你可以试试h5py,或者np.save等...... 你为什么不把输出保存在一个泡菜里? docs.python.org/3/library/pickle.html 能否提供代码示例,好吗? :) 【参考方案1】:您可以尝试将它们保存并加载为 HDF5 文件格式。与泡菜相比,它有几个优点。保存和加载速度要快得多(尤其是对于大型数组)。
为此,您需要安装 h5py 包。保存加载示例代码如下:
为了节省:
import h5py
h5f = h5py.File('your_file_name.h5', 'w')
h5f.create_dataset('layer_model', data=intermediate_layer_model)
h5f.create_dataset('output', data=intermediate_output)
h5f.close()
用于加载
import h5py
h5f = h5py.File('your_file_name.h5', 'r')
intermediate_layer_model = h5f['layer_model'][:]
intermediate_output = h5f['output'][:]
h5f.close()
【讨论】:
有什么方法可以保存整个数据集的特征,还是我应该一次提取一张图像? 当然,您可以一次保存它们。例如,如果您要从每张图像中提取 64 个特征(比如总共 1000 张图像),您可以将其存储为 HDF5 文件中的 1000x64 numpy 数组。以上是关于如何存储 CNN 提取的特征来训练 SVM 分类器的主要内容,如果未能解决你的问题,请参考以下文章