JPG(文档)到 PDF(Linux 控制台)[关闭]
Posted
技术标签:
【中文标题】JPG(文档)到 PDF(Linux 控制台)[关闭]【英文标题】:JPG (documents) to PDF (linux console) [closed] 【发布时间】:2014-08-15 02:31:46 【问题描述】:我有一些高质量的 JPG。它们是文件,我的意思是,没有照片,没有图片,主要是文字。
考虑到它们是文档,是否有任何方法可以将它们转换为 PDF,并且必须稍微转换、旋转、对齐、裁剪、可能晒太阳和连接?
当您扫描文档时,它并不完全笔直,也许从某种角度来看。我见过一些软件这样做(例如应用程序 CamScanner)。
在 linux 控制台有什么办法吗?
谢谢
【问题讨论】:
你能澄清你想要的问题吗? imagemagick 的 convert 将 jpg 转换为 pdf,以及执行您告诉它的转换。其他资源指定使用什么类型的样本,然后推荐某些转换,例如other SO question 和 whiteboard conversion。现有的 imagemagick 包装器是 textcleaner 这个问题有点令人困惑——你问的是使用 Linux 控制台,但你想在移动设备上管理它?这里的推论是您想使用手机上的 CLI 在移动设备本身上执行此操作,还是计划将图片下载到传统桌面并在那里进行操作? 也许您正在寻找这样的东西? exactcode.de/site/open_source/exactimage/hocr2pdf 【参考方案1】:有很多命令行工具可以修改图片,我想这不是问题所在。但是将其转换为 PDF 是?
不研究参数,这里有将JPEG转换为PDF的命令:
jpegtopnm | pnmtotiff | tiff2pdf
【讨论】:
convert input.jpg output.pdf
【参考方案2】:
安装包imagemagick(在ubuntu sudo apt-get install imagemagick)
和
convert *.jpg pictures.pdf
【讨论】:
【参考方案3】:看看ScanTailor 项目。这是一个非常好的工具,可以准备主要由文本(如您所拥有)组成的各种扫描或拍照文档,作为任何 OCR 软件的准备(在开源中,您可以选择tesseract-ocr,可选择与gImageReader结合使用)。但是,仅支持也非常强大的批处理。如果你还需要一个cli接口,那么你需要自己修改源码,你可以在github上找到。
https://github.com/scantailor/scantailor/
如果您碰巧懂德语,可以在这里找到简要介绍: http://www.heise.de/open/artikel/Toolbox-Scan-Tailor-bringt-gescannte-Dokumente-in-Form-1787142.html
【讨论】:
【参考方案4】:为什么没有 imagemagick?它或多或少是脚本图像处理的标准。我认为您不会找到替代方案。
【讨论】:
我的意思不是回答“使用 imagemagick”...我想没有更好的将 jpg 转换为 pdf 的工具...但是这个任务不仅仅是转换,而是转换之前的其他事情 我的回答是,如果你也想做图像处理(除非你想写一个 ;-)),你永远不会找到除此之外的任何工具(我很确定)。这就是我的意思,而不是“使用 imagemagick”!【参考方案5】:Is there any way to convert them into a PDF considering they are documents and they have to be slightly transformed, rotated, aligned, cropped, maybe solarized and joined ?
使用转换命令可以使用各种选项,可以在手册页HERE 上看到,您可以使用命令行轻松地转换、旋转、对齐、裁剪图像文件。
【讨论】:
【参考方案6】:当您扫描文档时,它并不完全笔直,也许从某种角度来看。我见过一些软件这样做(例如应用程序 CamScanner)。
但 CS 也需要人类的支持。没有人机交互,很难获得正确的观点等等。
如果你想做这样的事情,你可能需要自己实现它。您可以开始查看 OpenCV 示例。这是一个不错的:Automatic perspective correction for quadrilateral objects。
OpenCV 不支持 PDF 创建。因此,一旦您准备好图像并获得必要的参数(剪辑、透视、缩放),您就可以使用 ImageMagick 等其他工具/库从图像数据中创建 PDF。
【讨论】:
【参考方案7】:我建议你使用 PDFTK。请点击此链接Adding an image to a pdf with pdftk 使用起来非常简单。 PDFTK 每天都变得越来越强大。使用 PDFTK,您可以确定要在 PDF 上放置图像的位置,并使用他们的 STAMP 工具包相应地调整其大小。希望这会有所帮助
【讨论】:
以上是关于JPG(文档)到 PDF(Linux 控制台)[关闭]的主要内容,如果未能解决你的问题,请参考以下文章
如何在AWS DynamoDB中存储图像配置文件(jpg文件)和PDF文档?