求:C语言的游程编码,要求将大量的二进制的数据压缩
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了求:C语言的游程编码,要求将大量的二进制的数据压缩相关的知识,希望对你有一定的参考价值。
for(m=1;m < 26;m++)
if(store_data[m-1] == store_data[m])
count++;
sprintf(buf,"%d",count);
else
if(store_data[m-1] == '1')
strcat(compress_data,"1");
else if(store_data[m-1] == '0')
strcat(compress_data,"0");
strcat(compress_data,buf);
strcat(compress_data,",");
count=1;
strcat(compress_data,"\0");
store_data是原始数据,compress_data是压缩后的数据,请问这样写为什么不行?非常感谢!!
所以应该怎么写啊,老哥,求教!
ZigZag编码
ZigZag编码
在网络传输和数据存储场景中,需要对数据进行压缩。数据压缩的算法非常多,但大部分的数据压缩算法的原理是通过某种编码方式不存储数据中的0比特位,因此0比特位越多,数据压缩的效果越好。ZigZag编码就是一种增加0比例位的编码方式。下面使用Java语言来描述ZigZag编码。
一、编码
正数
假设数据类型为byte的正数11,其二进制表示为:00001011
- 数据左移一位:
00010110
- 符号位(正数的符号为0)放到最后一位:
00010110
负数
假设数据类型为byte的负数-11,其二进制在计算机中是用补码表示的,计算过程如下。
正数原码:00001011
。
反码:11110100
补码(反码加1):11110101
处理过程:
- 左移一位:
11101010
- 符号位放到最后一位:
11101011
- 除最后一位外全部取反:
00010101
结论
正数经过处理后,前导0和后置0的个数不变。但是负数经过处理后,增加了三个前导0,可以用于压缩。
结合两种情况得出byte类型数据的编码公式:
ZigZag(n) = n>>7 ^ n<<1
-11的处理过程如下:
11110101 >> 7 = 11111111
11110101 << 1 = 11101010
11111111^11101010 = 00010101
二、解码
ZigZag的逆函数:
(ZigZag^{-1}(n))=(n>>>1)^ -(n&1)
负数00010101
的解码过程:
- n>>>1:
00001010
n&1:
00000001
- -(n&1):
11111111
1111111^0000101=11110101
以上是关于求:C语言的游程编码,要求将大量的二进制的数据压缩的主要内容,如果未能解决你的问题,请参考以下文章
C++程序编写压缩器/解压器(长度-游程编码的压缩/解压+霍夫曼编码压缩/解压 (霍夫曼树))