将 pdf 文件转换为 tiff 文件的最佳方法 [关闭]

Posted

技术标签:

【中文标题】将 pdf 文件转换为 tiff 文件的最佳方法 [关闭]【英文标题】:Best way to convert pdf files to tiff files [closed] 【发布时间】:2010-09-09 16:24:18 【问题描述】:

我有大约 1000 个 pdf 文件,我需要将它们转换为 300 dpi 的 tiff 文件。做这个的最好方式是什么?如果有可以编写脚本的 SDK 或其他东西或工具,那将是理想的。

【问题讨论】:

这是我使用的解决方案:[Pdf to Tiff using Xpdf's pdftoppm and LibTIFF's ppm2tiff and tiffcp (optional, only if multipage)][1] [1]: ***.com/a/12868254/551460 任何带有完整源代码示例的最终解决方案?也许使用 powershell 脚本.. @Kiquenet 我发布了一个使用 powershell 的解决方案。请看下面... 使用 Ghrostscript 作为gs -q -dNOPAUSE -r300x300 -sDEVICE=tiff24nc -sOutputFile=output.tif input.pdf -c quit(在 Windows 上的命令是 gswin32c)生成 300x300 dpi 和 24 位彩色图像 将 PDF 文件转换为 TIFF 文件的最佳方法?确定:使用pdftoppm,如下:mkdir images && pdftoppm -tiff -r 300 mypdf.pdf images/pg。有关详细信息、用法和更多信息,请参见此处:askubuntu.com/questions/150100/…。 【参考方案1】:

使用 python 这就是我最终的结果

import os
os.popen(' '.join([
                   self._ghostscriptPath + 'gswin32c.exe', 
                   '-q',
                   '-dNOPAUSE',
                   '-dBATCH',
                   '-r300',
                   '-sDEVICE=tiff12nc',
                   '-sPAPERSIZE=a4',
                   '-sOutputFile=%s %s' % (tifDest, pdfSource),
                   ]))

【讨论】:

一般情况下,您会希望为此使用子流程。 os.popen 被认为已弃用。语法几乎相同。【参考方案2】:

https://pypi.org/project/pdf2tiff/

您还可以使用 pdf2ps、ps2image,然后使用其他实用程序将生成的图像转换为 tiff(我记得 'paul' [paul - 另一种图像查看器(显示 PNG、TIFF、GIF、JPG 等])

【讨论】:

【参考方案3】:

使用 Imagemagick,或者更好的 Ghostscript。

http://www.ibm.com/developerworks/library/l-graf2/#N101C2 有一个 imagemagick 的例子:

convert foo.pdf pages-%03d.tiff

http://www.asmail.be/msg0055376363.html 有一个 ghostscript 的例子:

gs -q -dNOPAUSE -sDEVICE=tiffg4 -sOutputFile=a.tif foo.pdf -c quit

我会安装 ghostscript 并阅读 gs 的手册页以查看需要哪些确切选项并进行实验。

【讨论】:

ghostscript 工作得非常好,据我了解 imagemagick 正在重用 ghostscript 进行 pdf 操作。这是正确的吗? 这是我听到的,但我不是 ImageMagick 内部的专家;) imagemagick 能正确处理多页 pdf --> tiff 吗? 哇,ghostscript 真的需要清理它的命令行界面了! imagemagick 在没有配置的情况下运行良好。我无法正确配置 ghostscript 以获得高分辨率彩色图像。【参考方案4】:

PDF Focus .Net 可以这样做:

1. PDF 转 TIFF

SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();    

string pdfPath = @"c:\My.pdf";

string imageFolder = @"c:\images\";

f.OpenPdf(pdfPath);

if (f.PageCount > 0)

    //Save all PDF pages to image folder as tiff images, 200 dpi
    int result = f.ToImage(imageFolder, "page",System.Drawing.Imaging.ImageFormat.Tiff, 200);

2. PDF to Multipage-TIFF

//Convert PDF file to Multipage TIFF file

SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();

string pdfPath = @"c:\Document.pdf";
string tiffPath = @"c:\Result.tiff";

f.OpenPdf(pdfPath);

if (f.PageCount > 0)

    f.ToMultipageTiff(tiffPath, 120) == 0)
    
        System.Diagnostics.Process.Start(tiffPath);
    
   

【讨论】:

【参考方案5】:

也许也试试这个? PDF Focus

这个 .Net 库可以让您解决问题 :)

此代码将有所帮助(在 C# 中将 1000 个 PDF 文件转换为 300-dpi TIFF 文件):

    SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();

    string[] pdfFiles = Directory.GetFiles(@"d:\Folder with 1000 pdfs\", "*.pdf");
    string folderWithTiffs = @"d:\Folder with TIFFs\";

    foreach (string pdffile in pdfFiles)
    
        f.OpenPdf(pdffile);

        if (f.PageCount > 0)
        
            //save all pages to tiff files with 300 dpi
            f.ToImage(folderWithTiffs, Path.GetFileNameWithoutExtension(pdffile), System.Drawing.Imaging.ImageFormat.Tiff, 300);
        
        f.ClosePdf();
    

【讨论】:

【参考方案6】:

必需的 ghostscript 和 tiffcp 在 Ubuntu 中测试

import os

def pdf2tiff(source, destination):
    idx = destination.rindex('.')
    destination = destination[:idx]
    args = [
    '-q', '-dNOPAUSE', '-dBATCH',
    '-sDEVICE=tiffg4',
    '-r600', '-sPAPERSIZE=a4',
    '-sOutputFile=' + destination + '__%03d.tiff'
    ]
    gs_cmd = 'gs ' + ' '.join(args) +' '+ source
    os.system(gs_cmd)
    args = [destination + '__*.tiff', destination + '.tiff' ]
    tiffcp_cmd = 'tiffcp  ' + ' '.join(args)
    os.system(tiffcp_cmd)
    args = [destination + '__*.tiff']
    rm_cmd = 'rm  ' + ' '.join(args)
    os.system(rm_cmd)    
pdf2tiff('abc.pdf', 'abc.tiff')

【讨论】:

【参考方案7】:

1) 安装 GhostScript

2) 安装 ImageMagick

3) 创建“Convert-to-TIFF.bat”(Windows XP、Vista、7)并使用以下行:

for %%f in (%*) DO "C:\Program Files\ImageMagick-6.6.4-Q16\convert.exe" -density 300 -compress lzw %%f %%f.tiff

将任意数量的单页 PDF 文件拖到此文件上,会将它们转换为 300 DPI 的压缩 TIFF。

【讨论】:

GhostScript 是必需的吗?如果我只安装 ImageMagick ? 这非常有效。非常感谢。 我们如何将颜色更改为灰度或任何其他类似颜色?它还在保存时重复文件名。我在 Windows 10 上使用它【参考方案8】:

我编写了一个小 powershell 脚本来遍历目录结构并使用 ghostscript 将所有 pdf 文件转换为 tiff 文件。这是我的脚本:

$tool = 'C:\Program Files\gs\gs8.63\bin\gswin32c.exe'
$pdfs = get-childitem . -recurse | where $_.Extension -match "pdf"

foreach($pdf in $pdfs)


    $tiff = $pdf.FullName.split('.')[0] + '.tiff'
    if(test-path $tiff)
    
        "tiff file already exists " + $tiff
    
    else        
       
        'Processing ' + $pdf.Name        
        $param = "-sOutputFile=$tiff"
        & $tool -q -dNOPAUSE -sDEVICE=tiffg4 $param -r300 $pdf.FullName -c quit
    

【讨论】:

7 年后,这仍然很有帮助!我只会添加一个没有 PowerShell 经验的人,您需要: 1. 编辑 $tool 值以匹配系统上的路径和版本。 2. 打开 PowerShell 并 cd 到存储 PDF 的目录。 3. 将代码粘贴到 PowerShell 窗口中。我需要按几次 Enter 才能运行它。谢谢 gyurisc【参考方案9】:

我喜欢PDFTIFF.com到convert PDF to TIFF,它可以处理无限的页面

【讨论】:

【参考方案10】:

免责声明:为我推荐的产品工作

Atalasoft 有一个.NET 库,可以convert PDF to TIFF -- 我们是FOXIT 的合作伙伴,所以PDF 渲染非常好。

【讨论】:

【参考方案11】:

从命令行使用 GhostScript,我过去使用过以下内容:

在 Windows 上:

gswin32c -dNOPAUSE -q -g300x300 -sDEVICE=tiffg4 -dBATCH -sOutputFile=output_file_name.tif input_file_name.pdf

在 *nix 上:

gs -dNOPAUSE -q -g300x300 -sDEVICE=tiffg4 -dBATCH -sOutputFile=output_file_name.tif input_file_name.pdf

对于大量文件,可以使用简单的批处理/shell 脚本来转换任意数量的文件...

【讨论】:

+1。有用的命令。但是我的彩色图形以黑白输出。知道为什么吗? -sDEVICE=tiffg4 是黑白传真压缩模型。见:pages.cs.wisc.edu/~ghost/doc/AFPL/8.00/Devices.htm#TIFF 大多数时候,您希望将 pdf 转换为 300x300 dpi,而不是 300x300 大小的 TIFF 图像。为此,将-g开关替换为-rgswin32c -dNOPAUSE -q -r300x300 ... 谢谢@HairyFotr。对于其他访问者,您应该使用 -sDEVICE=tiff24nc 用于 24 位 RGB,或使用 -sDEVICE=tiff12nc 用于 12 位(每个通道分别为 8/4 位)。【参考方案12】:

ABCPDF 也可以这样做——查看http://www.websupergoo.com/helppdf6net/default.html

【讨论】:

【参考方案13】:

pdf2tiff 怎么样? http://python.net/~gherman/pdf2tiff.html

【讨论】:

这还不能处理多页 tiff,所以不幸的是,这不适合我。不过感谢您的建议。

以上是关于将 pdf 文件转换为 tiff 文件的最佳方法 [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

使用 Ghostscript 将 PDF 转换为 TIFF 时未生成输出文件

通过 Windows 命令行将 TIFF 转换为 PDF [关闭]

Ghostscript 将 PDF 转换为大的 TIFF

使用 Ghostscript 将 PDF 转换为 TIFF 时保留页面尺寸

转换后的 tiff 文件 (GhostScript) 中缺少 Pdf 文本框标记

Java如何把一个PDF转为tif