使用特定字体进行 OCR 扫描

Posted

技术标签:

【中文标题】使用特定字体进行 OCR 扫描【英文标题】:OCR Scanning with specific font 【发布时间】:2017-05-01 21:13:38 【问题描述】:

我正在为 android 应用程序实现一个 OCR 扫描库,它不仅可以扫描数字,还可以使用我在库中手动定义的特定字体扫描这些数字。

我正在尝试实现“TESSERACT”库,但没有找到特定于字体的扫描实现。我正在使用以下代码扫描 OCR 而不是特定字体。我的实现如下:

 private void processImage(Bitmap bMap, String imagePath) 
        try 
            datapath = Environment.getExternalStorageDirectory().getAbsolutePath() + "/tesseract/";
            checkFile(new File(datapath + "tessdata/"));
            TessBaseAPI baseApi = new TessBaseAPI();
            baseApi.init(datapath, "eng");
            baseApi.setImage(bMap);
            String recognizedText = baseApi.getUTF8Text();
            baseApi.end();
            Log.e("log_tag", "onActivityResult recognizedText : " + recognizedText);
            Fragment myFragment = getActiveFragment();
            if (myFragment != null && myFragment.isVisible() && myFragment instanceof ScanPrescriptionFragment7c) 
                ((ScanPrescriptionFragment7c) myFragment).displaySelectedImage(recognizedText, imagePath);
            
         catch (Exception e) 
            e.printStackTrace();
        

    

有什么方法可以实现字体独立的 OCR 实现,或者至少可以提供自定义字体在 OCR 初始化期间进行扫描? 谢谢!

【问题讨论】:

对图书馆的请求不在此处讨论。 @GabeSechan 我认为这不是题外话 @JigneshAnsodariya 他要求图书馆做点什么。这是题外话。 【参考方案1】:

我不明白为什么你需要指定一种字体来识别字符,你想扫描不同的语言还是类似的东西?

我一直在使用 Tesseract 开发一个带有 OCR 的 Android 应用程序,我写下了我的结论并在 this post 中包含了一个示例,看看它,可能对解决您的问题有用。

【讨论】:

以上是关于使用特定字体进行 OCR 扫描的主要内容,如果未能解决你的问题,请参考以下文章

OCR:扫描图像的特定部分

大佬们,为啥我用OCR扫描不出字

OCR的理想字体是什么?

适用于 Android 的完美 OCR 扫描

怎么把图片字体识别?

制成双层pdf格式进行OCR识别时缺少两项不能OCR识别怎么办