请问有没有能把图片里的文字和表格直接提取出来的软件?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了请问有没有能把图片里的文字和表格直接提取出来的软件?相关的知识,希望对你有一定的参考价值。
首先如果是这种文件的话,需要将图片和表格分离出来,单独提取。目前还不能一起提取
如果是单独提取文字和表格的话。倒是有软件的
提取文字的话可以使用下微信的一个小程序:识字传图神器
如果是提取图片里的表格的话,可以使用另外一个:表格识别君
点击那个上传表格,就可以识别出来了
我试了一下识别结果如下:复制表格链接就可以打开了
参考技术A 可以将文字跟表格分开识别提取,比如图片中的文字可以选择云脉文档识别软件识别图片里的文字,提取成文本文,保存后即可开启进行编辑并可导出word和pdf格式;而图片中的表格可以选择云脉票据识别,通过扫描、图像处理、自动分类、OCR(光学字符识别)技术,能够将表单表格图像中的数据信息准确、快速、真实地提取并保存。云脉票据识别利用光学字符识别(ocr)技术以及票据表格核心处理技术,可根据各类纸质票据、表格、表单等排版特点,自定义模板,将不同的格式内容识别并提取成字符、图像等可编辑电子数据..... 参考技术B 如果是通过电子文档生成的,比如截图,可以把图片导入onenote,然后右击图片使图片内容可读,但是成功率也不高,会有很多乱码。如果图片文字是手写体基本就只剩下手打一条路了。 参考技术C 用尚书七号文字识别软件,网上可以下载到,这个软件只支持几种格式的图片,你先将图片导进去看能否识别,不行的话,如果你有打印机,可以将图片转成扫描版的格式(不用打印机好像也行),好像是tig格式,这个格式尚书七号就能识别了。如果图片上的表格很整齐的话,可以直接转换成excel格式,基本上跟图片上的内容一样。试试看吧。 参考技术D 清华紫光OCR V7.5 下载这个软件就可以把图片中文字转换到World中了本回答被提问者采纳
用JAVA能把Word和PDF文档的表格内容和格式识别出来吗
我用Python只能把表格中的文字识别出来,但是格式全丢了,用JAVA能做到吗,就是让我能知道一句话在表格的第几行第几列
参考技术A java的poi插件可以读取word文件。以上是关于请问有没有能把图片里的文字和表格直接提取出来的软件?的主要内容,如果未能解决你的问题,请参考以下文章
用JAVA能把Word和PDF文档的表格内容和格式识别出来吗