ImageMagick 未授权将 PDF 转换为图像

Posted

技术标签:

【中文标题】ImageMagick 未授权将 PDF 转换为图像【英文标题】:ImageMagick not authorized to convert PDF to an image 【发布时间】:2019-03-22 13:12:12 【问题描述】:

我有一个程序,我需要在其中使用 Image Magick 将 PDF 转换为图像。我使用subprocess 包来做到这一点:

        cmd = 'magick convert -density 300 '+pdfFile+'['+str(rangeTuple[0])+'-'+str(rangeTuple[1])+'] -depth 8 '+'temp.tiff' #WINDOWS
        if(os.path.isfile('temp.tiff')):
            os.remove('temp.tiff')
        subprocess.call(cmd,shell=True)
        im = Image.open('temp.tiff')

我得到的错误是:

convert-im6.q16: not authorized `temp2.pdf' @ error/constitute.c/ReadImage/412.
convert-im6.q16: no images defined `temp.tiff' @ error/convert.c/ConvertImageCommand/3258.
Traceback (most recent call last):
  File "UKExtraction2.py", line 855, in <module>
    doItAllUpper("A0","UK5.csv","temp",59,70,"box",2,1000,firstPageCoordsUK,boxCoordUK,voterBoxCoordUK,internalBoxNumberCoordUK,externalBoxNumberCoordUK,addListInfoUK)
  File "UKExtraction2.py", line 776, in doItAllUpper
    doItAll(tempPDFName,outputCSV,2,pdfs,formatType,n_blocks,writeBlockSize,firstPageCoords,boxCoord,voterBoxCoord,internalBoxNumberCoord,externalBoxNumberCoord,addListInfo,pdfName)
  File "UKExtraction2.py", line 617, in doItAll
    mainProcess(pdfName,(0,noOfPages-1),formatType,n_blocks,outputCSV,writeBlockSize,firstPageCoords,boxCoord,voterBoxCoord,internalBoxNumberCoord,externalBoxNumberCoord,addListInfo,bigPDFName,basePages)
  File "UKExtraction2.py", line 542, in mainProcess
    im = Image.open('temp.tiff')
  File "/home/rohit/.local/lib/python3.6/site-packages/PIL/Image.py", line 2609, in open
    fp = builtins.open(filename, "rb")
FileNotFoundError: [Errno 2] No such file or directory: 'temp.tiff'

其中最重要的是:

convert-im6.q16: not authorized `temp2.pdf' @ error/constitute.c/ReadImage/412.

我认为这是因为 ImageMagick 无权访问 PDF。现在应该怎么办?我在Linux服务器上。任何帮助表示赞赏。

【问题讨论】:

请查看文档中的Security Policy。您需要通过编辑 policy.xml 文件来启用支持。 php ImagickException: not authorized的可能重复 它看起来像是一个临时补丁来保护这个安全漏洞:bugs.gentoo.org/664236 所以它应该在某个时候“消失”并再次“正常工作”。同时,您可以选择无法将 imagemagick 用于某些格式,或者存在漏洞(您可以通过以下建议获得)。 还有一件事,如果可能的话,人们应该考虑直接使用 GhostScript,而不是 ImageMagick,因为它执行相同的 PDF 转换任务比 IM 快得多。 见***.com/questions/52861946/… 【参考方案1】:

emcconville 是正确的。更具体地说,编辑 Imagemagick policy.xml 文件以取消注释此行:

  <!-- <policy domain="module" rights="none" pattern="PS,PDF,XPS" /> -->

并将其从 rights="none" 更改为 rights="read|write"

  <policy domain="module" rights="read|write" pattern="PS,PDF,XPS" />

我相信这是最近对 policy.xml 文件的补充,因为在 Ghostscript 委托中发现了一个安全漏洞。我认为这个漏洞现在已经在 Ghostscript 的当前版本 9.25 中得到修复。

注意:在某些系统上,策略行将包含 domain="coder" 而不是 domain="module"

【讨论】:

在 Mac Homebrew 上,我必须从 &lt;policy domain="coder" rights="none" pattern="EPS,PS2,PS3,PS,PDF,XPS" /&gt; 中删除 PDF 你为什么要这么做?只是取消注释并将权限更改为“读|写”是否不起作用? 我没有像你那样的注释行。我在整个文件中搜索了 PDF,它在我提到的那一行 这应该有效。 &lt;policy domain="module" rights="read|write" pattern="EPS,PS2,PS3,PS,PDF,XPS" /&gt;。注意我将 domain="coder" 更改为 domain="module"。也许 Homebrew 用错误的术语对其进行了错误编码? 在 Ubuntu 18.04 上 /etc/ImageMagick-6/policy.xml 接近尾声时,我不得不将权限从无更改为 domain="coder" rights="read|write" pattern="PDF"【参考方案2】:

快速简便的解决方案:

sudo mv /etc/ImageMagick-6/policy.xml /etc/ImageMagick-6/policy.xml.off

完成后,您可以使用恢复原件

sudo mv /etc/ImageMagick-6/policy.xml.off /etc/ImageMagick-6/policy.xml

【讨论】:

这很好用。谢谢你。但是,我建议将rm 替换为mv,并将尝试编辑您的答案。 这个 mv out and back in 解决方案很棒!我现在在涉及 pdf 文件的脚本中的所有众多转换命令中都使用了这个 undo-restore。绝望后再次可靠。谢谢!【参考方案3】:

我正在使用 Dockerfile 更新图像,突然间我得到了 policy.xml 文件。虽然 Ubuntu (xenial) 和 ImageMagick 的版本是一样的。

我最终删除了导致我的问题的单行。

RUN sed -i 's/^.*policy.*coder.*none.*PDF.*//' /etc/ImageMagick-6/policy.xml

希望这对某人有所帮助

【讨论】:

感谢您,这正是我需要的解决方案!【参考方案4】:

使用以下命令删除策略文件进行修复,如果需要,您还可以备份此策略文件。

rm /etc/<ImageMagick_PATH>/policy.xml

对我来说是 ImageMagick6,命令是:

sudo rm /etc/ImageMagick-6/policy.xml

【讨论】:

这有点过激了。

以上是关于ImageMagick 未授权将 PDF 转换为图像的主要内容,如果未能解决你的问题,请参考以下文章

ImageMagick 命令行:将 PDF 转换为高清图像

PHP ImageMagick 将大图像拆分为图块

使用 ImageMagick 将 pdf 转换为 png 时出错

Imagick 无法将 PDF 转换为 JPEG,但 ImageMagick 可以

无法使用 ImageMagick 和 GhostScript 将 PDF 转换为 JPG

使用 ImageMagick 将 PNG 文件转换为 PDF 时出现粗糙的边缘