在自定义数据集上训练 tensorflow attention-ocr 的管道是啥?

Posted

技术标签:

【中文标题】在自定义数据集上训练 tensorflow attention-ocr 的管道是啥?【英文标题】:what's the pipeline to train tensorflow attention-ocr on customized dataset?在自定义数据集上训练 tensorflow attention-ocr 的管道是什么? 【发布时间】:2018-10-01 08:56:44 【问题描述】:

我在***上阅读了一些关于attention-ocr的问题,其中大部分是关于特定步骤的实现细节。我想知道的是我们在自己的数据集上微调这个模型的管道。

据我所知,步骤应该是:

0) 我们应该先下载 FSNS 数据集吗?我试图绕过这一步并尝试仅在一张图像上运行推理,但它总是给我错误:“ImportError:没有名为'fsns”的模块。所以我想知道一旦我设置了自己的数据集,这个错误是否会消失。

1) 以与 FSNS 相同的格式存储我们的数据。 (本主题链接:How to create dataset in the same format as the FSNS dataset?、how to create cutomized dataset for google tensorflow attention ocr?)

2) 下载预训练的检查点(http://download.tensorflow.org/models/attention_ocr_2017_08_09.tar.gz)

3) 以某种方式修改“model.py”以适合您自己的目的。

4) 以某种方式修改“train.py”以使用 tensorflow 服务训练您自己的模块。

我现在仍处于这个项目的早期阶段(创建自己的数据集),对如何做以及下一阶段是什么感到困惑。

【问题讨论】:

【参考方案1】:

错误是由不正确的 Python 版本引起的。它们应该与 Python 2 一起运行,您只需更改“导入”语句即可解决此错误。尝试将“import fsns”更改为“from datasets import fsns”。

【讨论】:

以上是关于在自定义数据集上训练 tensorflow attention-ocr 的管道是啥?的主要内容,如果未能解决你的问题,请参考以下文章

YOLOv8已至,精度大涨!教你如何在自定义数据集上训练它

机器学习笔记 - 使用TensorFlow Lite从头创建模型

在自定义数据集上使用 roboflow 对象检测 Yolov4 pytorch 模型时出现值错误

在自己的数据集上训练 TensorFlow 对象检测

Tensorflow:在具有不同类别数量的新数据集上微调预训练模型

如何在 tensorflow 对象检测 API 中使用“忽略”类?