OCR开源项目对比总结

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了OCR开源项目对比总结相关的知识,希望对你有一定的参考价值。

参考技术A 光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。

ocr的发展已经有了非常多的积累,一般人或者企业使用, 都是直接使用第三方的服务,目前提供第三方服务的大企业也非常多,百度,阿里云,腾讯等等,都提供了非常方便的api接口,可以进行调用,识别的速度、精确度和效果也都是非常不错的。唯一的缺点就是api的调用是需要收费的,对于调用频次不高的个人和企业,这个费用还是非常低的。

目前因为公司的现状,使用开源的有几个目的

目前针对ocr的相关开源项目也还是有不少的,作者正好是公司也需要类似的功能,所以做了一些简单的调研,在这里进行记录。

对于调研不准确的希望大家指出

Tesseract 是谷歌开发并开源的图像文字识别引擎,使用python开发。

所以针对目前公司的现状,放弃了这个项目的学习和调研

PaddleOCR 是百度开源的中文识别的ocr开源软件

EasyOCR 是一个用 Python 编写的 OCR 库,用于识别图像中的文字并输出为文本,支持 80 多种语言。

chineseocr

chineseocr_lite

TrWebOCR

cnocr

针对上面的比较讨论,同时根据现在的公司的情况和之前既定的一些目标,暂时选择最简单的cnocr进行学习和内部学习和使用。同时也针对目前cnocr仅仅是一个python包,而且无法通过接口进行调用的情况,做了一个补充项目 hn_ocr 。

目前放到github上面,欢迎大家一起学习和完善。

总模型仅17M!这个超轻量中文OCR开源项目在Github火了

光学字符识别(OCR)相信大家都不陌生,就是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

目前比较常用的中文OCR开源项目是 chineseocr,最近又有一个新开源的中文OCR项目,登上Github Trending榜单第二——chineseocr_lite

chineseocr_lite实现的功能如下:

  • 提供轻量的backone检测模型psenet(8.5M),crnn_lstm_lite(9.5M) 和行文本方向分类网络(1.5M)

  • 任意方向文字检测,识别时判断行文本方向

  • crnn\crnn_lite lstm\dense识别(ocr-dense和ocr-lstm是搬运chineseocr的)

  • 支持竖排文本识别

  • ncnn 实现 (支持lstm)

  • mnn 实现

话不多说,先来看看效果:

总模型仅17M!这个超轻量中文OCR开源项目在Github火了

总模型仅17M!这个超轻量中文OCR开源项目在Github火了

总模型仅17M!这个超轻量中文OCR开源项目在Github火了

总模型仅17M!这个超轻量中文OCR开源项目在Github火了

接下来,我们再说一下chineseocr_lite的运行环境:

  • Ubuntu 18.04

  • Python 3.6.9

  • Pytorch 1.5.0.dev20200227+cpu

此外,最近项目作者对更新了可实现的功能。

  • nihui 大佬实现的 crnn_lstm 推理

  • 升级 crnn_lite_lstm_dw.pth 模型 crnn_lite_lstm_dw_v2.pth , 精度更高

  • 提供竖排文字样例以及字体库(旋转 90 度的字体)

如果你也对这个项目感兴趣就赶紧尝试下吧。

-END-

已有50万人
加入14天坚持学Python计划

世界正在奖励坚持学习的人!

以上是关于OCR开源项目对比总结的主要内容,如果未能解决你的问题,请参考以下文章

百度的这个开源项目!火了!

最新OCR开源神器来了!

OCR+NLP 提取信息并分析,这个开源项目火了!

OCR+NLP 提取信息并分析,这个开源项目火了!

本周优秀开源项目分享:基于yolov3的轻量级人脸检测增值税发票OCR识别 等8大项目

开源OCR识别库-Tesseract介绍