Matlab 将 PDF 作为图像数组访问
Posted
技术标签:
【中文标题】Matlab 将 PDF 作为图像数组访问【英文标题】:Matlab access PDF as an array of images 【发布时间】:2012-11-15 15:33:29 【问题描述】:建立一个系统,在图片中搜索特定区域,并保存它。一切正常。大多数情况下,我将从 pdf 书籍中提取这些区域。
所以我正在寻找一种解决方案,将 matlab 中的 PDF 文件视为一组图像(每页都是一个图像)。到目前为止,我唯一发现的就是如何在 matlab 中打开 pdf 文件。
我想出的最佳解决方案是将 PDF 导出为尽可能多的 PNG 图像并遍历它们。这些想法没有什么不好,但我想知道我错过了什么
【问题讨论】:
【参考方案1】:从this page来看,直接将pdf导入matlab似乎是不可能的:
快速file exchange 搜索“pdf 导入”只会尝试提取文本,而不是图像。
因此,您将 pdf 保存为图像然后导入它们的所有方法似乎都是可行的方法。
【讨论】:
【参考方案2】:我同意萨尔瓦多·达利和丹尼斯的观点。要将 PDF 的每一页转换为 png 图像,我下载了 imagemagick 并按照此处的命令进行操作:
https://aleksandarjakovljevic.com/convert-pdf-images-using-imagemagick/ 具体来说: 转换 -density 150 -antialias "input_file_name.pdf" -resize 1024x -quality 100 "output_file_name-%03d.png"
当然,还有其他关于为此目的使用 ImageMagick 的讨论: Converting a PDF to PNG 和 Convert PDF to PNG using ImageMagick
这是一个旧线程,但这是我在问同样问题时发现的,所以我想我会详细说明,以防对同样登陆该线程的未来用户有所帮助。
【讨论】:
鼓励链接到外部资源,但请在链接周围添加上下文,以便您的其他用户了解它是什么以及为什么存在。始终引用重要链接中最相关的部分,以防目标站点无法访问或永久离线。以上是关于Matlab 将 PDF 作为图像数组访问的主要内容,如果未能解决你的问题,请参考以下文章