pdf can't copy text 无法复制文字

Posted 兴杰(stooges.com.my)

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pdf can't copy text 无法复制文字相关的知识,希望对你有一定的参考价值。

有些 pdf 是通过图片弄出来的,或者被 protect 了. 我们会无法 copy 里面的字. 

这个时候可以用 OCR (Optical character recognition) 就是从图片中识别出字的魔力.

做法可以是这样 

1. pdf -> images -> word -> merge word 
http://pdftoimage.com (pdf -> images)
https://www.onlineocr.net (image -> word)
https://support.microsoft.com/en-us/help/2665750/how-to-merge-multiple-word-documents-into-one---eeekb (merge word)

 

就是把 pdf 转换成图,然后转换成 microsof word, 最后把多个 word merge 起来就可以了。 

 

以上是关于pdf can't copy text 无法复制文字的主要内容,如果未能解决你的问题,请参考以下文章

Idea中配置svn时报 Can't use Subversion command line client: svn.Errors found while svn working copies

使用jacob进行word转pdf的时候提示com.jacob.com.ComFailException: Can't map name to dispid: PrintOut

Mysql -- BLOB, TEXT, GEOMETRY or JSON column 'result' can't have a default value

“Unicode Error ”unicodeescape" codec can't decode bytes… Cannot open text files in Python 3

You can't specify target table 'table' for update in FROM clause

UnicodeEncodeError: 'gbk' codec can't encode character 'ufeff' in position 0: i(