fme扫描件处理终章,深度学习和fme的极致结合,自动分户,分类,并提取宗地代码作为户档案文件名
Posted 努力的悟空
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了fme扫描件处理终章,深度学习和fme的极致结合,自动分户,分类,并提取宗地代码作为户档案文件名相关的知识,希望对你有一定的参考价值。
目录
前言
本文将主要体现再深度学习的计算模型搭建好只有如何使用fme来将其功能发挥到极致,图像分类模型如何搭建和使用我上一篇文章有详细的介绍和说明。
一、需求
需求其实非常简单,农村房地一体项目档案资料,按目录顺序整理好之后直接上高速扫描仪将一个村的档案直接放到一个文件夹,我们需要利用fme调用深度学习模型来实现资料按户归档。
可以看到按村扫描好的扫描件是直接这样非常暴力的放置的,按以前的逻辑,我们需要手动将这些扫描件一户一户的分出来,再一户一户的改图片的类型。非常的耗费人力,而且错误率还很高。
二、实际操作
1.图像分类
结合我上一篇文章,我们可以将全部的图像作为类型分类
2.图像分户
因为扫描文件的没一户的目录是提前整理好了的 所以每户的权籍调查表封面一定在第一张,我们 可以根据这个规律,来将户分割开来。首先我们需要将权籍调查表封面单独提取出来
然后调用百度的orc接口来识别宗地代码 ,然后分组计数宗地代码,然后排序填空值
可以看到 所有照片已经按不动产单元号整理完毕
3.成果输出
通过filecopy写模块将成果按路径写出
这里我还加了个纠错机制,因为有限户口簿复印件如果复印的非常黑,就会被错误识别,我单独针对这部分进行了模型训练,就可以保证接近于0的误差
总结
fme 一切皆有可能,没有你做不到,只有你想不到
以上是关于fme扫描件处理终章,深度学习和fme的极致结合,自动分户,分类,并提取宗地代码作为户档案文件名的主要内容,如果未能解决你的问题,请参考以下文章
如何使用 FME 处理 Kafka JDBC Sink 连接器