在自定义数据集上训练 tensorflow attention-ocr 的管道是啥?
Posted
技术标签:
【中文标题】在自定义数据集上训练 tensorflow attention-ocr 的管道是啥?【英文标题】:what's the pipeline to train tensorflow attention-ocr on customized dataset?在自定义数据集上训练 tensorflow attention-ocr 的管道是什么? 【发布时间】:2018-10-01 08:56:44 【问题描述】:我在***上阅读了一些关于attention-ocr的问题,其中大部分是关于特定步骤的实现细节。我想知道的是我们在自己的数据集上微调这个模型的管道。
据我所知,步骤应该是:
0) 我们应该先下载 FSNS 数据集吗?我试图绕过这一步并尝试仅在一张图像上运行推理,但它总是给我错误:“ImportError:没有名为'fsns”的模块。所以我想知道一旦我设置了自己的数据集,这个错误是否会消失。
1) 以与 FSNS 相同的格式存储我们的数据。 (本主题链接:How to create dataset in the same format as the FSNS dataset?、how to create cutomized dataset for google tensorflow attention ocr?)
2) 下载预训练的检查点(http://download.tensorflow.org/models/attention_ocr_2017_08_09.tar.gz)
3) 以某种方式修改“model.py”以适合您自己的目的。
4) 以某种方式修改“train.py”以使用 tensorflow 服务训练您自己的模块。
我现在仍处于这个项目的早期阶段(创建自己的数据集),对如何做以及下一阶段是什么感到困惑。
【问题讨论】:
【参考方案1】:错误是由不正确的 Python 版本引起的。它们应该与 Python 2 一起运行,您只需更改“导入”语句即可解决此错误。尝试将“import fsns”更改为“from datasets import fsns”。
【讨论】:
以上是关于在自定义数据集上训练 tensorflow attention-ocr 的管道是啥?的主要内容,如果未能解决你的问题,请参考以下文章
机器学习笔记 - 使用TensorFlow Lite从头创建模型
在自定义数据集上使用 roboflow 对象检测 Yolov4 pytorch 模型时出现值错误