为啥PDF文件大小这么小? [关闭]

Posted

技术标签:

【中文标题】为啥PDF文件大小这么小? [关闭]【英文标题】:Why is PDF file size so small? [closed]为什么PDF文件大小这么小? [关闭] 【发布时间】:2015-09-09 16:23:18 【问题描述】:

本学期我有几本 PDF 格式的教科书。这些是 1000 页的计算机科学教科书,里面充满了图形。当我下载它时,只用了几秒钟,这太棒了,我以为出了点问题。整个教科书为 9.7 MB。我打开它,果然,整个教科书都在那里,所有图像和所有内容都立即加载(而且我的互联网连接非常糟糕)

我只是想知道有什么惊人的压缩技术可以让你在 10 MB 的空间中存储 1000 页的教科书?

这是文件属性的截图,我很困惑。

【问题讨论】:

阅读教科书并找出答案! 什么样的图片,什么分辨率,多少? 文本不会占用太多空间。添加压缩使其更好。杀手是图像。包含 50 张低质量图像的 PDF,轻松运行在 50+ 兆字节以上。 平均而言,“10MB 中的 1000 个页面”中的每个页面占用高达 10,000 字节。你不会说任何关于页面大小、页边距和字体大小的信息,但是一本典型的教科书每页只有大约 3,000 个字符。所以“惊人”这个词并不完全正确。 (那是未压缩的。通常,PDF 中的数据也会被压缩。) 【参考方案1】:

typical text page is between 3k and 6k 令牌。因此,即使没有压缩,您的 1000 页书的文本也将适合 6MB。

普通压缩工具可以将纯 ASCII 文本减少 60-80%。

假设它是 75%,那么文本需要 0.25 x 6MB = 1.5MB。剩下 8.5 MB 用于图片。

对于像 svg 这样的大量基于矢量的图像,它们很小并且可以像文本一样压缩。但是 8.5 MB 并没有为大量嵌入位图留出空间。

【讨论】:

以上是关于为啥PDF文件大小这么小? [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

为啥同一本书的 ePub 文件比 mobi 或 PDF 文件小得多

为啥apk的大小这么小?

创建一个空文件, 为啥文件大小是0kb?

为啥保存我用 fitz 打开的文件会改变它的大小?

为啥文件复制之后大小显示为零

fpdf pdf文件大小