Tensorflow2.4,model_main_tf2.py,训练时的chechpoint问题

Posted

技术标签:

【中文标题】Tensorflow2.4,model_main_tf2.py,训练时的chechpoint问题【英文标题】:Tensorflow2.4, model_main_tf2.py, chechpoint problem during training 【发布时间】:2021-04-13 13:34:55 【问题描述】:

我按照 Gilbert Tunner 教程使用 Tensorflow 2 进行对象检测,但在使用 model_main_ft2.py 进行训练时出现此错误:

Traceback(最近一次调用最后一次):

文件“model_main_tf2.py”,第 113 行,在 tf.compat.v1.app.run() 文件 "C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\tensorflow\python\platform\app.py", 第 40 行,运行中 _run(main=main, argv=argv, flags_parser=_parse_flags_tolerate_undef) 文件 "C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\absl\app.py", 第 300 行,运行中 _run_main(main, args) 文件 "C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\absl\app.py", 第 251 行,在 _run_main sys.exit(main(argv)) 文件“model_main_tf2.py”,第 110 行,在 main record_summaries=FLAGS.record_summaries) 文件 "C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\object_detection\model_lib_v2.py", 第 566 行,在 train_loop unpad_groundtruth_tensors) 文件 "C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\object_detection\model_lib_v2.py", 第 339 行,在 load_fine_tune_checkpoint 如果不是 is_object_based_checkpoint(checkpoint_path): 文件 "C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\object_detection\model_lib_v2.py", 第 302 行,在 is_object_based_checkpoint var_names = [var[0] for var in tf.train.list_variables(checkpoint_path)] 文件 "C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\tensorflow\python\training\checkpoint_utils.py", 第 112 行,在 list_variables 中 reader = load_checkpoint(ckpt_dir_or_file) 文件“C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\tensorflow\python\training\checkpoint_utils.py”, 第 67 行,在 load_checkpoint 中 返回 py_checkpoint_reader.NewCheckpointReader(filename) 文件 "C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\tensorflow\python\training\py_checkpoint_reader.py", 第 99 行,在 NewCheckpointReader 中 error_translator(e) 文件 "C:\Users\anaconda3\envs\tensorflow2\lib\site-packages\tensorflow\python\training\py_checkpoint_reader.py", 第 35 行,在 error_translator 中 引发 errors_impl.NotFoundError(None, None, error_message) tensorflow.python.framework.errors_impl.NotFoundError: Unsuccessful TensorSliceReader 构造函数:找不到任何匹配的文件 C:/Users/Desktop/Tutorial/models/research/object_detection/efficientdet_d0_coco17_tpu-32/chechpoint/ckpt-0

我在对象检测文件夹中创建了efficientdet_d0_coco17_tpu-32 文件夹,下载并解压缩了我的模型。我已经修改了培训文件夹中的模型,添加了一个检查点 PATH。

【问题讨论】:

请使用您正在运行的命令以及文件夹结构更新您的问题 我修好了!错误是尺寸超过 efficentdet d0 尺寸请求的图像!! 【参考方案1】:

来自 cmets

错误是尺寸超过efficentdetd0 尺寸请求的图像(转述自 dons21)

【讨论】:

以上是关于Tensorflow2.4,model_main_tf2.py,训练时的chechpoint问题的主要内容,如果未能解决你的问题,请参考以下文章

Tensorflow2.4,model_main_tf2.py,训练时的chechpoint问题

tensorflow2.报错与解决 Cannot convert a symbolic Tensor

tensorflow2.报错与解决 Cannot convert a symbolic Tensor

Tensorflow 量化感知训练

Tensorflow 对象检测 API 数据增强边界框

使用TensorFlow Object Detection API确定最大批量大小