Keras - 整个训练过程中的 Loss Nan 和 0.333 准确率

Posted 2023-02-23

技术标签:

【中文标题】Keras - 整个训练过程中的 Loss Nan 和 0.333 准确率【英文标题】：Keras - Loss Nan and 0.333 accuracy throughout the training 【发布时间】：2018-09-12 23:19:05 【问题描述】：

我正在进行一项实验，其目标是将脑电图时间序列数据分为 3 类。但是，每当我进行训练时，我的 Loss 都是 NaN，准确度是 0.0。

我的数据有 150 步长，有 4 个通道。它都在 0 和 1 之间归一化。

Data Channels

我将它们输入到以下模型中。

model = Sequential()
model.add(Conv1D(8, kernel_size=(2,), strides=(1,),
                 activation='relu',
                 input_shape=(input_width, num_channels)))
model.add(MaxPooling1D(pool_size=2, strides=(2,), padding='same'))
model.add(Dropout(0.25))

model.add(Conv1D(9, kernel_size=(2,), strides=(1,),
                 activation='relu'))
model.add(MaxPooling1D(pool_size=2, strides=(2,), padding='same'))
model.add(Dropout(0.25))

model.add(Conv1D(18, kernel_size=(2,), strides=(1,),
                 activation='relu'))
model.add(MaxPooling1D(pool_size=2, strides=(2,), padding='same'))
model.add(Dropout(0.25))

model.add(Conv1D(36, kernel_size=(2,), strides=(1,),
                 activation='relu'))
model.add(MaxPooling1D(pool_size=2, strides=(2,), padding='same'))
model.add(Dropout(0.25))

model.add(Conv1D(72, kernel_size=(2,), strides=(1,),
                 activation='relu'))
model.add(MaxPooling1D(pool_size=2, strides=(2,), padding='same'))
model.add(Dropout(0.25))

model.add(Flatten())
model.add(Dropout(0.5))
model.add(Dense(128, activation='tanh'),)
model.add(Dense(num_labels, activation='softmax'))

然后运行它

optimizer = Adam(lr=0.0001)

model.summary()

model.compile(optimizer=optimizer,
              loss='categorical_crossentropy',
              metrics=['accuracy'])

model.fit(X, labels,
          epochs=100,
          batch_size=32)

但是，结果是这样的：

Epoch 1/100
3855/3855 [==============================] - 24s 6ms/step - loss: nan - acc: 0.3331
Epoch 2/100
3855/3855 [==============================] - 25s 7ms/step - loss: nan - acc: 0.3331
.....
Epoch 100/100
3855/3855 [==============================] - 25s 7ms/step - loss: nan - acc: 0.3331

【问题讨论】：

查看这个答案***.com/questions/40050397/… 【参考方案1】：

我生成了合成数据并使用您的代码进行了训练。我没有想到 NaN 问题。您可能需要检查您的数据以查看是否有任何损坏。要尝试的另一件事是只保留一个 Conv/Pooling/Dropout 层，看看问题是否仍然存在。

【讨论】：

谢谢！我应该具体寻找什么？我的输入目前是 0 到 1 之间的 150 步，有 4 个通道。我的输出是一个包含 3 个类别的数组，因此 [0, 0, 1] 或 [0, 1, 0] 等。它可能是超参数吗？我不确定...但是在调整超参数之前，可以尝试的一件事是逐步简化模型以定位错误，例如保留一个 Conv/Pooling/Dropout 层，看看是否问题仍然存在。

以上是关于Keras - 整个训练过程中的 Loss Nan 和 0.333 准确率的主要内容，如果未能解决你的问题，请参考以下文章

损失：执行回归时 Keras 中的 NaN

训练网络中出现loss等于Nan的情况几种思路

机器学习技巧-训练过程中，loss参数出现NAN怎么解决？解决方案汇总？

pytorch训练时前一次迭代的loss正常后一次迭代却报nan

训练网络loss出现Nan的原因总结记录

Tensorflow+keras使用keras API保存模型权重plot画loss损失函数保存训练loss值