android怎么调用tesseract实现OCR功能？

Posted 2023-03-13

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了android怎么调用tesseract实现OCR功能？相关的知识，希望对你有一定的参考价值。

android怎么调用tesseract实现OCR功能？希望高手指点~谢谢

android调用tesseract实现OCR功能的方法为：
一、下载&编译
1、首先下载tess-two
git clone git://github.com/rmtheis/tess-two tess
2、进入 tess目录，里面有三个项目，只需要进入tess-two就可以直接编译了
cd tess/tess-two
ndk-build
3、编译好后，将src下的两个包以及libs导入到自己的项目就可以用
二、使用
tesseract 使用了 leptonica的图像处理库，对于图像处理还是比较强大的
Android官方地址:tesseract-android-tools
但它必须要一个匹配库，即tessdata，我们可以从官方拷贝，在前面git的项目里面tesseract源码目录有现成的tessdata可以用，对于中文，google code上也有下载，当然也可以自己训练不同语言的tessdata。
包leptonica的类我们不必使用，只要使用tess包的类就行了
TessBaseAPI
使用时，首先创建TessBaseAPI对象
代码为：
TessBaseAPI baseApi=new TessBaseAPI();

//初始化tess
//android下面，tessdata肯定得放到sd卡里了
//如果tessdata这个目录放在sd卡的根目录
//那么path直接传入sd卡的目录
//eng就是英文，关于语言，按ISO 639-3标准的代码就行，具体请移步wiki
baseApi.init("tessdata文件夹的父级目录", "eng");

//options是为了缩放图片，这个酌情缩放，图片小的话可以不缩放
BitmapFactory.Options options=new BitmapFactory.Options();
//缩小为原来的1/2
options.inSampleSize=2;

//bitmap，我这里是以流的形式，只要能形成Bitmap就行
Bitmap bitmap = BitmapFactory.decodeStream(instream,null,options);
instream.close();

//如果图片有Alpha值，那么最好设置一下
/*ExifInterface exif = new ExifInterface(filename)
int exifOrientation = exif.getAttributeInt(ExifInterface.TAG_ORIENTATION, ExifInterface.ORIENTATION_NORMAL);

int rotate = 0;
switch (exifOrientation)
case ExifInterface.ORIENTATION_ROTATE_90:
rotate = 90;
break;
case ExifInterface.ORIENTATION_ROTATE_180:
rotate = 180;
break;
case ExifInterface.ORIENTATION_ROTATE_270:
rotate = 270;
break;

if (rotate != 0)

// Getting width & height of the given image.
int w = bitmap.getWidth();
int h = bitmap.getHeight();

// Setting pre rotate
Matrix mtx = new Matrix();
mtx.preRotate(rotate);

// Rotating Bitmap
bitmap = Bitmap.createBitmap(bitmap, 0, 0, w, h, mtx, false);
// tesseract req. ARGB_8888
bitmap = bitmap.copy(Bitmap.Config.ARGB_8888, true);
*/

//设置要ocr的图片bitmap
baseApi.setImage(bitmap);
//根据Init的语言，获得ocr后的字符串
String text= baseApi.getUTF8Text();
//释放bitmap
baseApi.clear();

//如果连续ocr多张图片，这个end可以不调用，但每次ocr之后，必须调用clear来对bitmap进行释放
//释放native内存
baseApi.end();

///////////////////////////其它方法//////////////////////////////////

//获取字符边框

Pixa pixa= baseApi.getCharacters();

//同上，这个是整段文字的边框
baseApi.getRegions();

//同上，只不过这里是条线
baseApi.getTextlines();

//剩下的自己测试吧。

//转为rect数组，之后，可以很方便的在图片上框出方框
//怎么框由你
ArrayList<Rect> rects=pixa.getBoxRects(); 参考技术A 另外google提供了一个demo工程，叫mezzofanti也实现了这个功能，只不过不太好用。参考技术B 我做了一个应用叫coolocr，你可以下来看看，需要对tesseract进行重新编译，不难就是比较麻烦。参考技术C 那个好像是用在电脑上的，不能用在手机开发上参考技术D 做成服务手机调用。。

以上是关于android怎么调用tesseract实现OCR功能？的主要内容，如果未能解决你的问题，请参考以下文章

android手机怎么调用OCR识别图像中的文字

求易语言调用tesseract-OCR例子

Android Tesseract OCR 7 段数字

如何通过Tesseract开源OCR引擎创建Android OCR应用

Python调用Tesseract-OCR完成图片OCR识别