怎么分辨PDF文件是扫描成的还是转换来的呢?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了怎么分辨PDF文件是扫描成的还是转换来的呢?相关的知识,希望对你有一定的参考价值。

有的PDF文件是用WORD转换成的,这种文件可以用某些软件直接转换回WORD文件,还有一些PDF文件是扫描成的,这种文件就不好转换了,只能用某些软件识别了。那怎么分辨是哪种类型的PDF文件呢?
不懂的请不要乱说,谢谢!
我是用foxit reader打开的,你能否看看这个截图的文件是否是扫描的啊?

最简单的方法,用adobe reader打开,鼠标指向某段文字,光标能变成I形,能选中文字的就是非扫描版的。不能选择的就是扫描版的。其实看多了一眼就能分辨是否扫描件,看字体边缘有没毛边就知道了。追问

请问这样的算是有毛边吗,我把字体放大的了。这种是转换的还是扫描的啊?

追答

说看那是看原文件啊,放大几次就很明显,扫描的文字是位图经不起放大,开到100%以上就开始锯齿毛边。做出来的话文字也是矢量图放大后不变。给个截图要怎么看啊。不过从原图字有倾斜和放大效果看该是扫描件

参考技术A 使用字符选择一下文件中的文字,能选上的就是文件生成的,不能选的就是扫描的。

怎么给OCR文字识别软件设置正确的扫描分辨率

ABBYY FineReader 12是一款专业的OCR文字识别软件,可快速方便地将扫描纸质文档、PDF文件和数码相机的图像转换成可编辑、可搜索的文本,不仅支持对页扫描,还支持多页扫描,扫描分辨率的选取是比较重要的一项操作,分辨率选择得不好,将直接影响扫描结果,那么ABBYY FineReader该如何选择正确的扫描分辨率呢?

技术分享

通常情况下,ABBYY FineReader建议的扫描分辨率为 300 dpi。

重要事项!当垂直分辨率和水平分辨率相同时,FineReader可以提供最佳的OCR效果。

分辨率设置得太高(超过600 dpi),将会增加识别次数,亦不会从根本上提高OCR质量。分辨率设置得太低(低于200 dpi),可能会对OCR质量产生负面影响。

以下情况中,可能需要调整分辨率:

1、图像分辨率小于 200 dpi 或 大于 600 dpi。

2、图像分辨率不标准。例如,传真的分辨率可能是204 x 96 dpi。

要调整分辨率:

1、在主工具栏上,单击“扫描”按钮。

技术分享

2、在“扫描”对话框中,选择所需的分辨率。

技术分享

3、扫描文档。

文档送纸器和双面扫描知识补充:

?如果你的扫描仪配有自动文档进纸器,请在“扫描”对话框加载页面,并选择“文档进纸器”。

?扫描书籍对开页或杂志页面时,请选中“采用双面扫描”选项。

?如果选中“向文档添加空白页”,对开页的后续处理将会更加方便。FineReader将会在扫描完每个对开页之后自动插入一个空白页。

本文来源于:http://www.abbyychina.com/FRshiyongjiqiao/abbyyfr-xz-smfbl.html

以上是关于怎么分辨PDF文件是扫描成的还是转换来的呢?的主要内容,如果未能解决你的问题,请参考以下文章

怎么知道PDF是扫描版

怎么用全能扫描王把图片转换成PDF(小于1M)?

发现PDF Transformer+转换的图像字体小了如何处理

扫描型PDF文件转可编辑复制Word方法

在pdf文件内怎么找到某个元件,(如电气图纸中想找到一个元件号,怎么能快速定位到某一页上?)

如何将扫描的PDF文件转换成Excel格式文档