ImageMagick 未授权将 PDF 转换为图像
Posted
技术标签:
【中文标题】ImageMagick 未授权将 PDF 转换为图像【英文标题】:ImageMagick not authorized to convert PDF to an image 【发布时间】:2019-03-22 13:12:12 【问题描述】:我有一个程序,我需要在其中使用 Image Magick 将 PDF 转换为图像。我使用subprocess
包来做到这一点:
cmd = 'magick convert -density 300 '+pdfFile+'['+str(rangeTuple[0])+'-'+str(rangeTuple[1])+'] -depth 8 '+'temp.tiff' #WINDOWS
if(os.path.isfile('temp.tiff')):
os.remove('temp.tiff')
subprocess.call(cmd,shell=True)
im = Image.open('temp.tiff')
我得到的错误是:
convert-im6.q16: not authorized `temp2.pdf' @ error/constitute.c/ReadImage/412.
convert-im6.q16: no images defined `temp.tiff' @ error/convert.c/ConvertImageCommand/3258.
Traceback (most recent call last):
File "UKExtraction2.py", line 855, in <module>
doItAllUpper("A0","UK5.csv","temp",59,70,"box",2,1000,firstPageCoordsUK,boxCoordUK,voterBoxCoordUK,internalBoxNumberCoordUK,externalBoxNumberCoordUK,addListInfoUK)
File "UKExtraction2.py", line 776, in doItAllUpper
doItAll(tempPDFName,outputCSV,2,pdfs,formatType,n_blocks,writeBlockSize,firstPageCoords,boxCoord,voterBoxCoord,internalBoxNumberCoord,externalBoxNumberCoord,addListInfo,pdfName)
File "UKExtraction2.py", line 617, in doItAll
mainProcess(pdfName,(0,noOfPages-1),formatType,n_blocks,outputCSV,writeBlockSize,firstPageCoords,boxCoord,voterBoxCoord,internalBoxNumberCoord,externalBoxNumberCoord,addListInfo,bigPDFName,basePages)
File "UKExtraction2.py", line 542, in mainProcess
im = Image.open('temp.tiff')
File "/home/rohit/.local/lib/python3.6/site-packages/PIL/Image.py", line 2609, in open
fp = builtins.open(filename, "rb")
FileNotFoundError: [Errno 2] No such file or directory: 'temp.tiff'
其中最重要的是:
convert-im6.q16: not authorized `temp2.pdf' @ error/constitute.c/ReadImage/412.
我认为这是因为 ImageMagick 无权访问 PDF。现在应该怎么办?我在Linux服务器上。任何帮助表示赞赏。
【问题讨论】:
请查看文档中的Security Policy。您需要通过编辑policy.xml
文件来启用支持。
php ImagickException: not authorized的可能重复
它看起来像是一个临时补丁来保护这个安全漏洞:bugs.gentoo.org/664236 所以它应该在某个时候“消失”并再次“正常工作”。同时,您可以选择无法将 imagemagick 用于某些格式,或者存在漏洞(您可以通过以下建议获得)。
还有一件事,如果可能的话,人们应该考虑直接使用 GhostScript,而不是 ImageMagick,因为它执行相同的 PDF 转换任务比 IM 快得多。
见***.com/questions/52861946/…
【参考方案1】:
emcconville 是正确的。更具体地说,编辑 Imagemagick policy.xml 文件以取消注释此行:
<!-- <policy domain="module" rights="none" pattern="PS,PDF,XPS" /> -->
并将其从 rights="none" 更改为 rights="read|write"
<policy domain="module" rights="read|write" pattern="PS,PDF,XPS" />
我相信这是最近对 policy.xml 文件的补充,因为在 Ghostscript 委托中发现了一个安全漏洞。我认为这个漏洞现在已经在 Ghostscript 的当前版本 9.25 中得到修复。
注意:在某些系统上,策略行将包含 domain="coder" 而不是 domain="module"
【讨论】:
在 Mac Homebrew 上,我必须从<policy domain="coder" rights="none" pattern="EPS,PS2,PS3,PS,PDF,XPS" />
中删除 PDF
你为什么要这么做?只是取消注释并将权限更改为“读|写”是否不起作用?
我没有像你那样的注释行。我在整个文件中搜索了 PDF,它在我提到的那一行
这应该有效。 <policy domain="module" rights="read|write" pattern="EPS,PS2,PS3,PS,PDF,XPS" />
。注意我将 domain="coder" 更改为 domain="module"。也许 Homebrew 用错误的术语对其进行了错误编码?
在 Ubuntu 18.04 上 /etc/ImageMagick-6/policy.xml
接近尾声时,我不得不将权限从无更改为 domain="coder" rights="read|write" pattern="PDF"
。【参考方案2】:
快速简便的解决方案:
sudo mv /etc/ImageMagick-6/policy.xml /etc/ImageMagick-6/policy.xml.off
完成后,您可以使用恢复原件
sudo mv /etc/ImageMagick-6/policy.xml.off /etc/ImageMagick-6/policy.xml
【讨论】:
这很好用。谢谢你。但是,我建议将rm
替换为mv
,并将尝试编辑您的答案。
这个 mv out and back in 解决方案很棒!我现在在涉及 pdf 文件的脚本中的所有众多转换命令中都使用了这个 undo-restore。绝望后再次可靠。谢谢!【参考方案3】:
我正在使用 Dockerfile 更新图像,突然间我得到了 policy.xml 文件。虽然 Ubuntu (xenial) 和 ImageMagick 的版本是一样的。
我最终删除了导致我的问题的单行。
RUN sed -i 's/^.*policy.*coder.*none.*PDF.*//' /etc/ImageMagick-6/policy.xml
希望这对某人有所帮助
【讨论】:
感谢您,这正是我需要的解决方案!【参考方案4】:使用以下命令删除策略文件进行修复,如果需要,您还可以备份此策略文件。
rm /etc/<ImageMagick_PATH>/policy.xml
对我来说是 ImageMagick6,命令是:
sudo rm /etc/ImageMagick-6/policy.xml
【讨论】:
这有点过激了。以上是关于ImageMagick 未授权将 PDF 转换为图像的主要内容,如果未能解决你的问题,请参考以下文章
使用 ImageMagick 将 pdf 转换为 png 时出错
Imagick 无法将 PDF 转换为 JPEG,但 ImageMagick 可以