卧槽,javaCV不到十行代码实现图片OCR文字识别
Posted 洛阳泰山
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了卧槽,javaCV不到十行代码实现图片OCR文字识别相关的知识,希望对你有一定的参考价值。
spring boot项目pom文件中添加以下依赖
<!-- https://mvnrepository.com/artifact/org.bytedeco/javacv-platform -->
<dependency>
<groupId>org.bytedeco</groupId>
<artifactId>javacv-platform</artifactId>
<version>1.5.5</version>
</dependency>
单类代码实现,复制到idea编辑器里,右键run运行即可。
OCR方法参数说明,
1.lng 语言类型 分为两种 1.eng 英语 2.chi_sim 中文简体
2.dataPath 语言数据集文件夹路径
3.imagePath 需要识别的图片文件路径
import org.bytedeco.javacpp.BytePointer;
import org.bytedeco.leptonica.PIX;
import org.bytedeco.leptonica.global.lept;
import org.bytedeco.tesseract.TessBaseAPI;
public class OcrTest {
public static String OCR(String lng,String dataPath,String imagePath) {
TessBaseAPI api=new TessBaseAPI();
if (api.Init(dataPath, lng)!=0){
System.out.println("error");
}
PIX image= lept.pixRead(imagePath);
if (image==null){
return "";
}
api.SetImage(image);
BytePointer outText=api.GetUTF8Text();
String result=outText.getString();
api.End();
outText.deallocate();
lept.pixDestroy(image);
return result;
}
public static void main(String[] args) {
String text= OCR("chi_sim", "E:\\\\traineddata", "C:\\\\Users\\\\tarzan\\\\Desktop\\\\image\\\\test5.png");
System.out.println(text);
}
}
测试样例结果
test1.jpg
test2.jpg
test3.jpg
test4.jpg
test5.jpg
相关文章推荐
JavaCV 将抖音小视频分割成图片帧图片和将图片合成小视频代码实现
需要 traineddata 语言训练数据集的可以关注我,私信获取。
也可以自行付费下载
https://download.csdn.net/download/weixin_40986713/18800645
以上是关于卧槽,javaCV不到十行代码实现图片OCR文字识别的主要内容,如果未能解决你的问题,请参考以下文章
锋利的javaCV文字识别篇之一:基于tesserac ocr检测识别图片文字,不仅跨平台还支持英文中文简体繁体等各种字符识别