尝试在python中阅读pdf
Posted
技术标签:
【中文标题】尝试在python中阅读pdf【英文标题】:Trying to read a pdf in python 【发布时间】:2022-01-20 19:08:59 【问题描述】:使用from PyPDF2.pdf import PdfFileReader
我的temp = open('HW8.pdf', 'rb')
在运行时返回一个错误,说 HW8.pdf 无法找到,即使它与我的 python 代码在同一个文件夹中。
不知道从这里怎么走。
【问题讨论】:
【参考方案1】:确保您在正确的目录中;我尝试了您的 sn-p,并意识到我不在正确的目录中。 'test.pdf' 文件在我的桌面上,这并没有引发任何错误:
import os
from PyPDF2 import PdfFileReader
os.chdir('/home/asylumax/Desktop')
temp = open('test.pdf', 'rb')
【讨论】:
我实现了os.chdir("C:\Users\giodi\invoice-generator")
,它仍然返回一个错误,说SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape
听起来 PDF 可能已损坏或有点奇怪。创建一个简单的文档,另存为 PDF,然后尝试一下。这与您最初遇到的错误不同,所以这是一个开始。
同样的事情。制作了 test.txt,然后将其保存为 test.pdf。发生了同样的错误。
我试过这个 pdf:s1.q4cdn.com/806093406/files/doc_downloads/test.pdf,它成功了。看看你能不能读出来。
同样的问题,同样的错误。以上是关于尝试在python中阅读pdf的主要内容,如果未能解决你的问题,请参考以下文章