Java--哈夫曼压缩原理

Posted Z && Y

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java--哈夫曼压缩原理相关的知识,希望对你有一定的参考价值。

1. 哈夫曼压缩原理

  • 首先要明确一点,计算机里面所有的文件都是以二进制的方式存储的。
  • 在计算机的存储单元中,一个ASCII码值占一个字节,1个字节等于8位(1Byte = 8bit)

可以参考这个网站:

ASCII码在线转换计算器


以"JavaJavaJavaJavaJavaJava"这个字符串为例,它在计算机内部是这样存储的(每一个字符的ASCII码转换为二进制存储起来):

public static void main(String[] args) {
        String beforeStr = "JavaJavaJavaJavaJavaJava";
        StringBuilder afterStr = new StringBuilder("");
//        把字符串的每一个字符的ASCII码转换为二进制存储起来
        for (int i = 0; i < beforeStr.length(); i++) {
            afterStr.append(binaryToDecimal((int) beforeStr.charAt(i)));
        }
        System.out.println(beforeStr + "\\n 在计算内是这样存储的: \\n" + afterStr);
        System.out.println("afterStr.length = " + afterStr.length());
    }

    //     十进制转换位二进制的算法
    public static String binaryToDecimal(int n) {
        StringBuilder str = new StringBuilder();
        while (n != 0) {
            str.insert(0, n % 2);
            n = n / 2;
        }
//        不满8位前面补0
        while (str.length() < 8) {
            str.insert(0, '0');
        }
        return str.toString();
    }


可以发现现在“JavaJavaJavaJavaJavaJava”转01字符串的长度位192

验证文件大小:

  1. 首先,我新建了一个文件

  2. 填充内容

  1. 查看大小

文件大小为24字节 = 24 * 8 = 192bit

以 “JavaJavaJavaJavaJavaJava” 这个字符串每个字符出现的次数为权值建立最优二叉数

所以“JavaJavaJavaJavaJavaJava”可以表示为:
001011001011001011001011001011001011  长度为36

所以压缩率为:
原来长度是 192,压缩了 (192-36) = 156
压缩率:156/ 192= 81.25%



以上是关于Java--哈夫曼压缩原理的主要内容,如果未能解决你的问题,请参考以下文章

Java- 哈夫曼(Huffman)压缩算法

高级数据结构---赫(哈)夫曼树及java代码实现

哈夫曼编码压缩解压缩实现&不同类型文件压缩比的测试

gzip压缩文件损坏修复原理和数据恢复方法

踩过无数坑实现的哈夫曼压缩(JAVA)

哈夫曼编码译码器 java