总模型仅17M!这个超轻量中文OCR开源项目在Github火了

Posted 顶级程序员

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了总模型仅17M!这个超轻量中文OCR开源项目在Github火了相关的知识,希望对你有一定的参考价值。

光学字符识别(OCR)相信大家都不陌生,就是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

目前比较常用的中文OCR开源项目是 chineseocr,最近又有一个新开源的中文OCR项目,登上Github Trending榜单第二——chineseocr_lite

chineseocr_lite实现的功能如下:

  • 提供轻量的backone检测模型psenet(8.5M),crnn_lstm_lite(9.5M) 和行文本方向分类网络(1.5M)

  • 任意方向文字检测,识别时判断行文本方向

  • crnn\crnn_lite lstm\dense识别(ocr-dense和ocr-lstm是搬运chineseocr的)

  • 支持竖排文本识别

  • ncnn 实现 (支持lstm)

  • mnn 实现

话不多说,先来看看效果:

总模型仅17M!这个超轻量中文OCR开源项目在Github火了

总模型仅17M!这个超轻量中文OCR开源项目在Github火了

总模型仅17M!这个超轻量中文OCR开源项目在Github火了

总模型仅17M!这个超轻量中文OCR开源项目在Github火了

接下来,我们再说一下chineseocr_lite的运行环境:

  • Ubuntu 18.04

  • Python 3.6.9

  • Pytorch 1.5.0.dev20200227+cpu

此外,最近项目作者对更新了可实现的功能。

  • nihui 大佬实现的 crnn_lstm 推理

  • 升级 crnn_lite_lstm_dw.pth 模型 crnn_lite_lstm_dw_v2.pth , 精度更高

  • 提供竖排文字样例以及字体库(旋转 90 度的字体)

如果你也对这个项目感兴趣就赶紧尝试下吧。

-END-

已有50万人
加入14天坚持学Python计划

世界正在奖励坚持学习的人!

以上是关于总模型仅17M!这个超轻量中文OCR开源项目在Github火了的主要内容,如果未能解决你的问题,请参考以下文章

飞桨文字识别模型套件PaddleOCR首次开源,带来8.6M超轻量中英文OCR模型!

开发者说PaddleOCR的.NET封装与应用部署

开源OCR识别库-Tesseract介绍

本周优秀开源项目分享:基于yolov3的轻量级人脸检测增值税发票OCR识别 等8大项目

这款上了Github Trending榜单的OCR开源Repo,又放大招了

周获 4700 Star 全球疫情数据可视化系统,超轻量级中文 OCR……GitHub 一周热点速览