C# - 如何使用 Tesseract 3.0 Wrapper 获取每个字符的边界框?

Posted

技术标签:

【中文标题】C# - 如何使用 Tesseract 3.0 Wrapper 获取每个字符的边界框?【英文标题】:C# - How to use Tesseract 3.0 Wrapper to get bounding box of each characters? 【发布时间】:2017-06-15 18:12:35 【问题描述】:

我目前正在使用 this 包装器来实现 Tesseract 的基本实现。但是我对示例中的循环有点困惑。似乎没有关于包装器的其他帮助或文档。有没有办法获取每个字符的边界框?

【问题讨论】:

【参考方案1】:

使用3.2 alpha:

List<Rectangle> GetSegmentedRegions(Bitmap image, PageIteratorLevel level)

    using (var engine = new TesseractEngine(Datapath, Language, EngineMode.Default))
    
        using (var page = engine.Process(image))
        
            List<Rectangle> boxes = page.GetSegmentedRegions(level);
            return boxes;
        
    

【讨论】:

以上是关于C# - 如何使用 Tesseract 3.0 Wrapper 获取每个字符的边界框?的主要内容,如果未能解决你的问题,请参考以下文章

如何仅在 Tesseract C# 中捕获数字

Tesseract + opencv 3.0 + windows,文本模块体积小,链接错误

使用 c# 和 Tesseract 读取 .jpeg 图像文本

C#使用tesseract3.02识别验证码模拟登录

Atititi tesseract使用总结

Tesseract ocr PDF 作为输入