尝试在python中阅读pdf

Posted

技术标签:

【中文标题】尝试在python中阅读pdf【英文标题】:Trying to read a pdf in python 【发布时间】:2022-01-20 19:08:59 【问题描述】:

使用from PyPDF2.pdf import PdfFileReader

我的temp = open('HW8.pdf', 'rb') 在运行时返回一个错误,说 HW8.pdf 无法找到,即使它与我的 python 代码在同一个文件夹中。

不知道从这里怎么走。

【问题讨论】:

【参考方案1】:

确保您在正确的目录中;我尝试了您的 sn-p,并意识到我不在正确的目录中。 'test.pdf' 文件在我的桌面上,这并没有引发任何错误:

import os
    
from PyPDF2 import PdfFileReader
os.chdir('/home/asylumax/Desktop')    
temp = open('test.pdf', 'rb')

【讨论】:

我实现了os.chdir("C:\Users\giodi\invoice-generator"),它仍然返回一个错误,说SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape 听起来 PDF 可能已损坏或有点奇怪。创建一个简单的文档,另存为 PDF,然后尝试一下。这与您最初遇到的错误不同,所以这是一个开始。 同样的事情。制作了 test.txt,然后将其保存为 test.pdf。发生了同样的错误。 我试过这个 pdf:s1.q4cdn.com/806093406/files/doc_downloads/test.pdf,它成功了。看看你能不能读出来。 同样的问题,同样的错误。

以上是关于尝试在python中阅读pdf的主要内容,如果未能解决你的问题,请参考以下文章

蓝色棱镜 - 保存和阅读 Pdf

从加密的PDF中提取Python数据

尝试在 PDF 中进行着色

如何使用Python填写PDF表单

Android 从 URL 下载 PDF,然后使用 PDF 阅读器打开它

PDF 阅读器 ruby​​ gem 风景页面