JPG(文档)到 PDF(Linux 控制台)[关闭]

Posted

技术标签:

【中文标题】JPG(文档)到 PDF(Linux 控制台)[关闭]【英文标题】:JPG (documents) to PDF (linux console) [closed] 【发布时间】:2014-08-15 02:31:46 【问题描述】:

我有一些高质量的 JPG。它们是文件,我的意思是,没有照片,没有图片,主要是文字。

考虑到它们是文档,是否有任何方法可以将它们转换为 PDF,并且必须稍微转换、旋转、对齐、裁剪、可能晒太阳和连接?

当您扫描文档时,它并不完全笔直,也许从某种角度来看。我见过一些软件这样做(例如应用程序 CamScanner)。

在 linux 控制台有什么办法吗?

谢谢

【问题讨论】:

你能澄清你想要的问题吗? imagemagick 的 convert 将 jpg 转换为 pdf,以及执行您告诉它的转换。其他资源指定使用什么类型的样本,然后推荐某些转换,例如other SO question 和 whiteboard conversion。现有的 imagemagick 包装器是 textcleaner 这个问题有点令人困惑——你问的是使用 Linux 控制台,但你想在移动设备上管理它?这里的推论是您想使用手机上的 CLI 在移动设备本身上执行此操作,还是计划将图片下载到传统桌面并在那里进行操作? 也许您正在寻找这样的东西? exactcode.de/site/open_source/exactimage/hocr2pdf 【参考方案1】:

有很多命令行工具可以修改图片,我想这不是问题所在。但是将其转换为 PDF 是?

不研究参数,这里有将JPEG转换为PDF的命令:

jpegtopnm | pnmtotiff | tiff2pdf

【讨论】:

convert input.jpg output.pdf【参考方案2】:

安装包imagemagick(在ubuntu sudo apt-get install imagemagick)

convert *.jpg pictures.pdf

【讨论】:

【参考方案3】:

看看ScanTailor 项目。这是一个非常好的工具,可以准备主要由文本(如您所拥有)组成的各种扫描或拍照文档,作为任何 OCR 软件的准备(在开源中,您可以选择tesseract-ocr,可选择与gImageReader结合使用)。但是,仅支持也非常强大的批处理。如果你还需要一个cli接口,那么你需要自己修改源码,你可以在github上找到。

https://github.com/scantailor/scantailor/

如果您碰巧懂德语,可以在这里找到简要介绍: http://www.heise.de/open/artikel/Toolbox-Scan-Tailor-bringt-gescannte-Dokumente-in-Form-1787142.html

【讨论】:

【参考方案4】:

为什么没有 imagemagick?它或多或少是脚本图像处理的标准。我认为您不会找到替代方案。

【讨论】:

我的意思不是回答“使用 imagemagick”...我想没有更好的将 jpg 转换为 pdf 的工具...但是这个任务不仅仅是转换,而是转换之前的其他事情 我的回答是,如果你也想做图像处理(除非你想写一个 ;-)),你永远不会找到除此之外的任何工具(我很确定)。这就是我的意思,而不是“使用 imagemagick”!【参考方案5】:

Is there any way to convert them into a PDF considering they are documents and they have to be slightly transformed, rotated, aligned, cropped, maybe solarized and joined ?

使用转换命令可以使用各种选项,可以在手册页HERE 上看到,您可以使用命令行轻松地转换、旋转、对齐、裁剪图像文件。

【讨论】:

【参考方案6】:

当您扫描文档时,它并不完全笔直,也许从某种角度来看。我见过一些软件这样做(例如应用程序 CamScanner)。

但 CS 也需要人类的支持。没有人机交互,很难获得正确的观点等等。

如果你想做这样的事情,你可能需要自己实现它。您可以开始查看 OpenCV 示例。这是一个不错的:Automatic perspective correction for quadrilateral objects。

OpenCV 不支持 PDF 创建。因此,一旦您准备好图像并获得必要的参数(剪辑、透视、缩放),您就可以使用 ImageMagick 等其他工具/库从图像数据中创建 PDF。

【讨论】:

【参考方案7】:

我建议你使用 PDFTK。请点击此链接Adding an image to a pdf with pdftk 使用起来非常简单。 PDFTK 每天都变得越来越强大。使用 PDFTK,您可以确定要在 PDF 上放置图像的位置,并使用他们的 STAMP 工具包相应地调整其大小。希望这会有所帮助

【讨论】:

以上是关于JPG(文档)到 PDF(Linux 控制台)[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

pdf怎么转换成jpg图片格式

如何在AWS DynamoDB中存储图像配置文件(jpg文件)和PDF文档?

用java 实现 word、jpg转PDF

将PDF文件转换成为JPG图片的方法

java项目中的文档转换案例实战——PDF转换为JPG图片压缩包

怎么把pdf文件内容都转换成jpg图片