为啥7z的压缩率这么夸张

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了为啥7z的压缩率这么夸张相关的知识,希望对你有一定的参考价值。

2G的BMP位图文件压缩成7z格式才30MB....

7-Zip基于GNU LGPL协议发布的软件,通过全新算法使压缩比率大幅提升,7Z(7-zip)的压缩率是高于RAR,但在速度方面不及RAR。

支持格式:压缩 / 解压缩:7z, XZ, BZIP2, GZIP, TAR, ZIP 和 WIM;

仅解压缩,ARJ,CAB, CHM, CPIO, CramFS, DEB, DMG, FAT, HFS, ISO, LZH, LZMA, MBR, MSI, NSIS, NTFS, RAR, RPM, SquashFS, UDF, VHD, WIM, XAR, Z。

对于ZIP和GZIP格式,7-Zip能提供比使用 PKZip 及WinZip 高2~10%的压缩比率

7z 格式支持创建自解压(SFX)压缩文件,7z 格式支持加密功能(AES-256),集成Windows外壳扩展,强大的文件管理能力,强大的命令行版本支持 FAR Manager插件;

支持79种语言,7-Zip适用于Windows 10/Windows 8/Windows 7/ Vista / XP / 2008 / 2003 / 2000 / NT / ME / 98。并且7-Zip有面向Linux、Unix平台的命令行版本。


扩展资料


自动添加注释提高压缩率:

选择“注释”标签,点“浏览”选择压缩包注释文件,如“说明文件.htm”或“说明文件.txt”。

推荐把“常规”标签中的“压缩选项”里面的“创建固实压缩文件”和“锁定压缩文件”勾上,这样可以加大压缩率,还可以防止别人轻易修改压缩包。在“高级”标签里面还可以选择是否“后台压缩”和设置压缩密码。

7-Zip在解压缩和压缩率方面是优于WinRAR的,而且操作简便,基本操作上与WinRAR不相伯仲。但是由于普通用户除了会进行解压缩的操作,有时候也需要将文件压缩成RAR格式,毕竟rar是网上最流行的压缩格式。

而7-Zip虽然可以解开rar压缩包,却不具备制作RAR格式的功能,所以我们觉得对于普通用户来说压缩软件可能还是要首选WinRAR,而7-Zip则可以作为压缩/解压缩的首席备选软件。

参考资料:百度百科-7-Zip

参考资料:百度百科-压缩率

参考技术A   7Z的压缩率是高于RAR,但在速度方面不及RAR。
  7-Zip压缩率优势
  1.使用了 LZMA 与 LZMA2 算法的 7z 格式 拥有极高的压缩比。
  2.为 7z 与 ZIP 提供更完善的 AES-256加密算法。
  3.支持 FAR Manager插件
  很多朋友在使用WinRAR进行文件压缩时,常发现只能达到百分之几的压缩率,跟没压缩差不了多少。其实只要对WinRAR多做一些设置,就能得到最大限度的压缩率了。
参考技术B 7Z的压缩率是高于RAR,但在速度方面不及RAR,BMP的压缩空间本来就大,用RAR高压的话也不会大多少,如果你压EXE等低压打包文件一样是没压缩率的。本回答被提问者采纳

Kafka为啥读写数据效率这么高?

参考技术A

数据文件分段并建立索引,可以直接定位到每条数据,把普通的随机IO变成了顺序IO,提高了效率。

Topic主题 & Partition分区存储数据

Topic 在逻辑上可以被认为是一个 queue,每条消费都必须指定它的 Topic,可以简单理解为必须指明把这条消息放进哪个 queue 里。为了使得 Kafka 的吞吐率可以线性提高,物理上把 Topic 分成一个或多个 Partition,每个 Partition 在物理上对应一个文件夹,该文件夹下存储这个 Partition 的所有消息和索引文件。

每个日志文件都是一个 log entrie 序列,每个 log entrie 包含一个 4 字节整型数值(值为 N+5),1 个字节的 "magic value",4 个字节的 CRC 校验码,其后跟 N 个字节的消息体。每条消息都有一个当前 Partition 下唯一的 64 字节的 offset,它指明了这条消息的起始位置。磁盘上存储的消息格式如下:

这个 log entries 并非由一个文件构成,而是分成多个 segment,每个 segment 以该 segment 第一条消息的 offset 命名并以“.kafka”为后缀。另外会有一个索引文件,它标明了每个 segment 下包含的 log entry 的 offset 范围,如下图所示。

因为每条消息都被 append 到该 Partition 中,属于顺序写磁盘,因此效率非常高(经验证,顺序写磁盘效率比随机写内存还要高,这是 Kafka 高吞吐率的一个很重要的保证)。

Kafka性能与存储的数据文件大小无关

对于传统的 message queue 而言,一般会删除已经被消费的消息,而 Kafka 集群会保留所有的消息,无论其被消费与否。
因为 Kafka 读取特定消息的时间复杂度为 O(1),即与文件大小无关,所以这里删除过期文件与提高 Kafka 性能无关。

以上是关于为啥7z的压缩率这么夸张的主要内容,如果未能解决你的问题,请参考以下文章

如何知道 7-Zip 的压缩率?

[原]使用SevenZipSharp压缩/解压7z格式

文件夹大小基本差不多,可为啥压缩出来的文件包却相差那么大?

我认为 PNG 在大小方面比 gif 具有更好的文件压缩率。那为啥我的 PNG 比我的 gif 大?我用pycharm转换文件

linux 7z 命令编译安装

linux 7z 命令编译安装