Matlab 将 PDF 作为图像数组访问

Posted

技术标签:

【中文标题】Matlab 将 PDF 作为图像数组访问【英文标题】:Matlab access PDF as an array of images 【发布时间】:2012-11-15 15:33:29 【问题描述】:

建立一个系统,在图片中搜索特定区域,并保存它。一切正常。大多数情况下,我将从 pdf 书籍中提取这些区域。

所以我正在寻找一种解决方案,将 matlab 中的 PDF 文件视为一组图像(每页都是一个图像)。到目前为止,我唯一发现的就是如何在 matlab 中打开 pdf 文件。

我想出的最佳解决方案是将 PDF 导出为尽可能多的 PNG 图像并遍历它们。这些想法没有什么不好,但我想知道我错过了什么

【问题讨论】:

【参考方案1】:

从this page来看,直接将pdf导入matlab似乎是不可能的:

快速file exchange 搜索“pdf 导入”只会尝试提取文本,而不是图像。

因此,您将 pdf 保存为图像然后导入它们的所有方法似乎都是可行的方法。

【讨论】:

【参考方案2】:

我同意萨尔瓦多·达利和丹尼斯的观点。要将 PDF 的每一页转换为 png 图像,我下载了 imagemagick 并按照此处的命令进行操作:

https://aleksandarjakovljevic.com/convert-pdf-images-using-imagemagick/ 具体来说: 转换 -density 150 -antialias "input_file_name.pdf" -resize 1024x -quality 100 "output_file_name-%03d.png"

当然,还有其他关于为此目的使用 ImageMagick 的讨论: Converting a PDF to PNG 和 Convert PDF to PNG using ImageMagick

这是一个旧线程,但这是我在问同样问题时发现的,所以我想我会详细说明,以防对同样登陆该线程的未来用户有所帮助。

【讨论】:

鼓励链接到外部资源,但请在链接周围添加上下文,以便您的其他用户了解它是什么以及为什么存在。始终引用重要链接中最相关的部分,以防目标站点无法访问或永久离线。

以上是关于Matlab 将 PDF 作为图像数组访问的主要内容,如果未能解决你的问题,请参考以下文章

怎么用ABBYY将PDF转换为JPEG图像

怎么用ABBYY将PDF转换为JPEG图像

matlab imadd关于2幅图像叠加问题

无法使用 Konva 将 PDF 图像作为图像对象加载到 HTML5 画布中

如何在 MATLAB 中将多个图像读入一个数组?

Matlab - 将训练(神经网络)图像特征插入 ms 访问数据库