pdf can't copy text 无法复制文字
Posted 兴杰(stooges.com.my)
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pdf can't copy text 无法复制文字相关的知识,希望对你有一定的参考价值。
有些 pdf 是通过图片弄出来的,或者被 protect 了. 我们会无法 copy 里面的字.
这个时候可以用 OCR (Optical character recognition) 就是从图片中识别出字的魔力.
做法可以是这样
1. pdf -> images -> word -> merge word
http://pdftoimage.com (pdf -> images)
https://www.onlineocr.net (image -> word)
https://support.microsoft.com/en-us/help/2665750/how-to-merge-multiple-word-documents-into-one---eeekb (merge word)
就是把 pdf 转换成图,然后转换成 microsof word, 最后把多个 word merge 起来就可以了。
以上是关于pdf can't copy text 无法复制文字的主要内容,如果未能解决你的问题,请参考以下文章
Idea中配置svn时报 Can't use Subversion command line client: svn.Errors found while svn working copies
使用jacob进行word转pdf的时候提示com.jacob.com.ComFailException: Can't map name to dispid: PrintOut
Mysql -- BLOB, TEXT, GEOMETRY or JSON column 'result' can't have a default value
“Unicode Error ”unicodeescape" codec can't decode bytes… Cannot open text files in Python 3
You can't specify target table 'table' for update in FROM clause
UnicodeEncodeError: 'gbk' codec can't encode character 'ufeff' in position 0: i(