读取图像数据

Posted

技术标签:

【中文标题】读取图像数据【英文标题】:Read Image Data 【发布时间】:2017-08-16 01:55:10 【问题描述】:

有什么方法可以获取相机捕获的 .jpeg 或 .png 文件中的文本数据?

例如-

如果我通过设备相机拍摄借记卡,那么如何从拍摄的照片中获取借记卡号码或持卡人姓名。

【问题讨论】:

en.wikipedia.org/wiki/Optical_character_recognition 请参考此代码:github.com/rmtheis/android-ocr 检查这个***.com/a/4836353/4148757你可以使用Tesseract-ocr @Dixit Patel 如果我在捕获布局中使用 2 ViewfinderView,它会给我空指针异常 - 【参考方案1】:

基本上,正如上面已经建议的那样,您将投入到光学识别的科学中。这些是非常复杂的算法,它们分析图像的像素并尝试“看到”一些文本,或者说,图像中的面孔。这个目标对于人眼和大脑来说是显而易见的,但非常复杂,尤其是考虑到图像可能是在某些特定照明(背光或侧光)、白平衡正确或错误等情况下拍摄的。

尽管复杂,但好消息是:Google 提供了一个专门的库,可以做到这一点:识别文本、条形码和面孔。它被称为Mobile Vision

即使不知道识别算法,您基本上也可以启动这个库,然后使用 Face API、Barcode API 或 Text API 将您的图像提供给这些算法。然后在该库中进行处理之后,您将获得这些算法找到的任何内容。这是一种魔法:)

这里有用的链接:

Tutorial with Text API

The code sample of the app using Text API

【讨论】:

教程链接失效!

以上是关于读取图像数据的主要内容,如果未能解决你的问题,请参考以下文章

字符识别--图像的读取与数据扩充

从 Java 中的 COM7 端口读取图像数据

使用gdal库读取图像

医学图像数据读取部分

怎样获取和读取一景遥感图像的信息?急求。。。

如何在谷歌 colab 中读取图像数据集以进行深度学习?