如何在 TensorFlow 中增加训练步数?

Posted

技术标签:

【中文标题】如何在 TensorFlow 中增加训练步数?【英文标题】:How to increase training steps in Tensorflow? 【发布时间】:2019-12-31 14:05:04 【问题描述】:

我按照以下 Tensorflow 教程在我自己的课程中重新训练 Inception V3。

https://www.tensorflow.org/hub/tutorials/image_retraining

到目前为止,一切都运行良好,我得到了可接受的最终测试准确度。但是,我想通过增加训练步骤来改善结果。我将模型训练了 4000 步,我想将其增加到 8000 步。在不重新开始培训的情况下如何做到这一点?

我已经阅读了很多关于保存和恢复检查点的文档,但我不明白如何使用它们。我应该修改retain.py 以允许继续培训吗?如果是,我该怎么做?

感谢您的帮助!

【问题讨论】:

【参考方案1】:

如this link 中所述,

最简单的尝试是--how_many_training_steps。这默认为 4,000,但如果将其增加到 8,000,它将训练两倍 长。

为此,运行命令,

python retrain.py --image_dir ~/flower_photos --how_many_training_steps 8000

如果要获取所有可用参数的列表,请运行命令, python retrain.py -h。下面提到的是列表。

usage: retrain.py [-h] [--image_dir IMAGE_DIR] [--output_graph OUTPUT_GRAPH]
                  [--intermediate_output_graphs_dir INTERMEDIATE_OUTPUT_GRAPHS_DIR]
                  [--intermediate_store_frequency INTERMEDIATE_STORE_FREQUENCY]
                  [--output_labels OUTPUT_LABELS]
                  [--summaries_dir SUMMARIES_DIR]
                  [--how_many_training_steps HOW_MANY_TRAINING_STEPS]
                  [--learning_rate LEARNING_RATE]
                  [--testing_percentage TESTING_PERCENTAGE]
                  [--validation_percentage VALIDATION_PERCENTAGE]
                  [--eval_step_interval EVAL_STEP_INTERVAL]
                  [--train_batch_size TRAIN_BATCH_SIZE]
                  [--test_batch_size TEST_BATCH_SIZE]
                  [--validation_batch_size VALIDATION_BATCH_SIZE]
                  [--print_misclassified_test_images]
                  [--bottleneck_dir BOTTLENECK_DIR]
                  [--final_tensor_name FINAL_TENSOR_NAME] [--flip_left_right]
                  [--random_crop RANDOM_CROP] [--random_scale RANDOM_SCALE]
                  [--random_brightness RANDOM_BRIGHTNESS]
                  [--tfhub_module TFHUB_MODULE]
                  [--saved_model_dir SAVED_MODEL_DIR]
                  [--logging_verbosity DEBUG,INFO,WARN,ERROR,FATAL]
                  [--checkpoint_path CHECKPOINT_PATH]

【讨论】:

以上是关于如何在 TensorFlow 中增加训练步数?的主要内容,如果未能解决你的问题,请参考以下文章

训练准确性增加,然后偶尔突然下降。使固定? [Keras] [TensorFlow 后端]

Eager Mode,写在TensorFlow 2.0 到来之前

3dmax中如何增加场景撤销的步数?

TensorFlow 对象检测 API 损失急剧增加

tensorflow内存消耗不断增加

如何在 nodejs (tensorflow.js) 中训练模型?