获取pathlib对象的字符串表示形式

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了获取pathlib对象的字符串表示形式相关的知识,希望对你有一定的参考价值。

我正在编写一个python脚本,将多个PDF合并为一个以放入输出文件夹。每个PDF都将位于不同的文件夹中,上面带有员工名称,并且需要与另一个文件夹中的相应pdf合并。并非所有员工都有每个文件,因此我将其包含在逻辑中。

我当前遇到的问题是,PdfFileMerger在附加文件时需要一个字符串,而pathlib库返回一个windowpath对象。那将不容易转换为字符串。我从这篇文章pypdf Merging multiple pdf files into one pdf中获取有关PyPDF2的信息。我是pathlib库的新手,我应该进行转换还是应该获取其他路径对象?

from PyPDF2 import PdfFileMerger, PdfFileReader
from pathlib import Path

tc = Path('totalcomp')
merger = PdfFileMerger()


for i in tc.iterdir():
pdfs = []
try:
    pdfs.append(Path(f'profitshare/{i.name}'))
    pdfs.append(Path(f'merit/{i.name}'))
finally:
    pdfs.append(i)
    for pdf in pdfs:
        output = i.name
        merger.append(pdf, 'rb')
    merger.write(Path(f'/output/{i.name}'))
答案

根据pathlib documentation

路径的字符串表示形式是原始文件系统路径本身(以本机格式,例如,在Windows下为反斜杠),您可以将其传递给将文件路径作为字符串的任何函数:

>>> p = PurePath('/etc')
>>> str(p)
'/etc'
>>> p = PureWindowsPath('c:/Program Files')
>>> str(p)
'c:\Program Files'

所以解决方案是使用Path()函数包装str()对象:

from PyPDF2 import PdfFileMerger, PdfFileReader
from pathlib import Path

tc = Path('totalcomp')
merger = PdfFileMerger()


for i in tc.iterdir():
pdfs = []
try:
    pdfs.append(str(Path(f'profitshare/{i.name}')))
    pdfs.append(str(Path(f'merit/{i.name}')))
finally:
    pdfs.append(i)
    for pdf in pdfs:
        output = i.name
        merger.append(pdf, 'rb')
    merger.write(str(Path(f'/output/{i.name}')))

顺便说一句,还有另一个pathlib的方法,该方法以字符串形式返回路径:as_posix()

返回带有正斜杠(/)的路径的字符串表示形式:

as_posix()

以上是关于获取pathlib对象的字符串表示形式的主要内容,如果未能解决你的问题,请参考以下文章

Pathlib模块

抛弃os.path,拥抱pathlib

python风格对象

流畅的python 符合python风格的对象

如何获取 Java 8 流中所有元素的字符串表示形式

在序列化时,我应该更改什么设置来获取枚举的int值而不是其字符串表示形式? [重复]