通用转换器到 PDF [关闭]

Posted

技术标签:

【中文标题】通用转换器到 PDF [关闭]【英文标题】:Universal converter to PDF [closed] 【发布时间】:2021-11-17 01:15:07 【问题描述】:

我有一千份文件。 它们的格式如下:

“xls、xlsx、csv、ppt、pptx、doc、docx、txt”

有没有图书馆可以做这项工作?我找到了一个叫 PDFTron,但似乎需要许可证。 这是我的示例代码,它将首先复制文件,然后转换非 PDF

import os
import shutil

src = ".../srcpaths"
dst = ".../dstpaths"
ext = ['xls', 'xlsx', 'csv', 'ppt', 'pptx', 'doc', 'docx', 'txt', 'pdf']

for root, subfolders, filenames in os.walk(src):               # for all folders and files
    for filename in filenames:                                 # for all names
        if os.path.splitext(filename)[1] in ext:
            shutil.copy2(os.path.join(root, filename), os.path.join(dst, filename))  # cope files with its path(root)
        
        
def ConvertToPDF(ext):
    ########converter code#####

ConvertToPDF('.xls')
ConvertToPDF('.xlsx')
ConvertToPDF('.csv')
ConvertToPDF('.ppt')
ConvertToPDF('.pptx')
ConvertToPDF('.doc')
ConvertToPDF('.docx')
ConvertToPDF('.txt')

【问题讨论】:

显然,问题不在于拥有免费的许可证,而在于保护文件的机密性 不,对于普通最终用户来说没问题。只是一些公司不允许使用第三方网络应用程序处理他们的数据。顺便说一句,我刚刚找到 unoconv,将在 github.com/unoconv/unoconv 中尝试这个 哦,现在说得通了。我会检查一下。谢谢@KJ! 【参考方案1】:

没有。没有通用的ConvertToPDF 库。但是使用pandoc 可能会得到合理的结果。但是,我非常怀疑您是否会找到一个 python 库来执行此操作。

【讨论】:

感谢您与我们联系。对我来说,“unoconv”效果最好。不过需要 Libre Office。 github.com/unoconv/unoconv

以上是关于通用转换器到 PDF [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

通用枚举到可迭代转换器 [关闭]

使用 PHP 将 HTML 转换为 PDF(不是 PDF 到 HTML)[关闭]

使用 PHP 将 HTML 转换为 PDF(不是 PDF 到 HTML)[关闭]

将 PDF 转换为干净的 SVG? [关闭]

如何将php文件转换为pdf文件[关闭]

如何将php文件转换为pdf文件[关闭]