利用C++行程编码编写一款压缩软件,思路:读取,编码,解码。

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了利用C++行程编码编写一款压缩软件,思路:读取,编码,解码。相关的知识,希望对你有一定的参考价值。

求大神,解决问题给悬赏

用哈夫曼压缩文件(C语言)
利用哈夫曼编码制作压缩软件,内容如下:
#include <stdio.h> 
#include <string.h> 
#include <stdlib.h> 
#include <conio.h>
struct head 

unsigned char b;           //记录字符在数组中的位置
long count;             //字符出现频率(权值) 
long parent,lch,rch;    //定义哈夫曼树指针变量
char bits[256];         //定义存储哈夫曼编码的数组
 
header[512],tmp;
/*压缩*/
void compress() 

char filename[255],outputfile[255],buf[512]; 
unsigned char c; 
long i,j,m,n,f; 
long min1,pt1,flength,length1,length2; 
double div;
FILE *ifp,*ofp; 
printf("\\t请您输入需要压缩的文件:"); 
gets(filename); 
ifp=fopen(filename,"rb"); 
if(ifp==NULL) 

   printf("\\n\\t文件打开失败!\\n\\n"); 
   return; 

printf("\\t请您输入压缩后的文件名:"); 
gets(outputfile); 
ofp=fopen(strcat(outputfile,".hub"),"wb"); 
if(ofp==NULL) 

   printf("\\n\\t压缩文件失败!\\n\\n"); 
   return; 

flength=0; 
while(!feof(ifp)) 

   fread(&c,1,1,ifp); 
   header[c].count++;    //字符重复出现频率+1
   flength++;            //字符出现原文件长度+1

flength--; 
length1=flength;          //原文件长度用作求压缩率的分母
header[c].count--; 
for(i=0;i<512;i++) 

   if(header[i].count!=0) header[i].b=(unsigned char)i; 
   /*将每个哈夫曼码值及其对应的ASCII码存放在一维数组header[i]中,
   且编码表中的下标和ASCII码满足顺序存放关系*/
   else header[i].b=0; 
   header[i].parent=-1;header[i].lch=header[i].rch=-1;    //对结点进行初始化
 
for(i=0;i<256;i++)    //根据频率(权值)大小,对结点进行排序,选择较小的结点进树

   for(j=i+1;j<256;j++)
   
    if(header[i].count<header[j].count)
    
     tmp=header[i];
     header[i]=header[j]; 
     header[j]=tmp; 
     
    

for(i=0;i<256;i++) if(header[i].count==0) break; 
n=i;       //外部叶子结点数为n个时,内部结点数为n-1,整个哈夫曼树的需要的结点数为2*n-1.
m=2*n-1;
for(i=n;i<m;i++)   //构建哈夫曼树

   min1=999999999;   //预设的最大权值,即结点出现的最大次数
   for(j=0;j<i;j++) 
   
    if(header[j].parent!=-1) continue;    
    //parent!=-1说明该结点已存在哈夫曼树中,跳出循环重新选择新结点*/
    if(min1>header[j].count) 
    
     pt1=j; 
     min1=header[j].count; 
     continue; 
     
   
   header[i].count=header[pt1].count; 
   header[pt1].parent=i;   //依据parent域值(结点层数)确定树中结点之间的关系
   header[i].lch=pt1;   //计算左分支权值大小
   min1=999999999;   
   for(j=0;j<i;j++) 
   
    if(header[j].parent!=-1) continue; 
    if(min1>header[j].count) 
    
     pt1=j; 
     min1=header[j].count; 
     continue; 
     
   
   header[i].count+=header[pt1].count; 
   header[i].rch=pt1;   //计算右分支权值大小
   header[pt1].parent=i; 

for(i=0;i<n;i++)   //哈夫曼无重复前缀编码

   f=i; 
   header[i].bits[0]=0;   //根结点编码0   
   while(header[f].parent!=-1) 
   
    j=f; 
    f=header[f].parent; 
    if(header[f].lch==j)   //置左分支编码0
    
     j=strlen(header[i].bits); 
     memmove(header[i].bits+1,header[i].bits,j+1);
     //依次存储连接“0”“1”编码
     header[i].bits[0]=\'0\'; 
    
    else   //置右分支编码1
    
     j=strlen(header[i].bits); 
     memmove(header[i].bits+1,header[i].bits,j+1); 
     header[i].bits[0]=\'1\'; 
     
    

fseek(ifp,0,SEEK_SET);   //从文件开始位置向前移动0字节,即定位到文件开始位置
fwrite(&flength,sizeof(int),1,ofp);
/*用来将数据写入文件流中,参数flength指向欲写入的数据地址,
总共写入的字符数以参数size*int来决定,返回实际写入的int数目1*/ 
fseek(ofp,8,SEEK_SET); 
buf[0]=0;   //定义缓冲区,它的二进制表示00000000
f=0; 
pt1=8; 
/*假设原文件第一个字符是"A",8位2进制为01000001,编码后为0110识别编码第一个\'0\',
那么我们就可以将其左移一位,看起来没什么变化。下一个是\'1\',应该|1,结果00000001 
同理4位都做完,应该是00000110,由于字节中的8位并没有全部用完,我们应该继续读下一个字符,
根据编码表继续拼完剩下的4位,如果字符的编码不足4位,还要继续读一个字符,
如果字符编码超过4位,那么我们将把剩下的位信息拼接到一个新的字节里*/
while(!feof(ifp)) 

   c=fgetc(ifp); 
   f++; 
   for(i=0;i<n;i++) 
   
    if(c==header[i].b) break; 
   
   strcat(buf,header[i].bits); 
   j=strlen(buf);
   c=0; 
   while(j>=8)   //对哈夫曼编码位操作进行压缩存储
   
    for(i=0;i<8;i++) 
    
     if(buf[i]==\'1\') c=(c<<1)|1; 
     else c=c<<1; 
    
    fwrite(&c,1,1,ofp); 
    pt1++;   //统计压缩后文件的长度
    strcpy(buf,buf+8);   //一个字节一个字节拼接
    j=strlen(buf); 
   
   if(f==flength) break; 

if(j>0)    //对哈夫曼编码位操作进行压缩存储

   strcat(buf,"00000000"); 
   for(i=0;i<8;i++) 
   
    if(buf[i]==\'1\') c=(c<<1)|1; 
    else c=c<<1; 
   
   fwrite(&c,1,1,ofp); 
   pt1++; 

fseek(ofp,4,SEEK_SET); 
fwrite(&pt1,sizeof(long),1,ofp); 
fseek(ofp,pt1,SEEK_SET); 
fwrite(&n,sizeof(long),1,ofp); 
for(i=0;i<n;i++) 

   fwrite(&(header[i].b),1,1,ofp); 
   c=strlen(header[i].bits); 
   fwrite(&c,1,1,ofp); 
   j=strlen(header[i].bits); 
   if(j%8!=0)   //若存储的位数不是8的倍数,则补0   
   
    for(f=j%8;f<8;f++) 
     strcat(header[i].bits,"0"); 
   
   while(header[i].bits[0]!=0) 
   
    c=0; 
    for(j=0;j<8;j++)   //字符的有效存储不超过8位,则对有效位数左移实现两字符编码的连接
    
     if(header[i].bits[j]==\'1\') c=(c<<1)|1;   //|1不改变原位置上的“0”“1”值
     else c=c<<1; 
    
    strcpy(header[i].bits,header[i].bits+8);   //把字符的编码按原先存储顺序连接
    fwrite(&c,1,1,ofp); 
    
 
length2=pt1--;
div=((double)length1-(double)length2)/(double)length1;   //计算文件的压缩率
fclose(ifp); 
fclose(ofp); 
printf("\\n\\t压缩文件成功!\\n"); 
printf("\\t压缩率为 %f%%\\n\\n",div*100); 
return; 

/*解压缩*/
void uncompress() 

char filename[255],outputfile[255],buf[255],bx[255]; 
unsigned char c; 
long i,j,m,n,f,p,l; 
long flength; 
FILE *ifp,*ofp; 
printf("\\t请您输入需要解压缩的文件:"); 
gets(filename); 
ifp=fopen(strcat(filename,".hub"),"rb"); 
if(ifp==NULL) 

   printf("\\n\\t文件打开失败!\\n"); 
   return; 

printf("\\t请您输入解压缩后的文件名:"); 
gets(outputfile); 
ofp=fopen(outputfile,"wb"); 
if(ofp==NULL) 

   printf("\\n\\t解压缩文件失败!\\n"); 
   return; 

fread(&flength,sizeof(long),1,ifp);   //读取原文件长度,对文件进行定位
fread(&f,sizeof(long),1,ifp); 
fseek(ifp,f,SEEK_SET); 
fread(&n,sizeof(long),1,ifp); 
for(i=0;i<n;i++) 

   fread(&header[i].b,1,1,ifp); 
   fread(&c,1,1,ifp); 
   p=(long)c;   //读取原文件字符的权值
   header[i].count=p; 
   header[i].bits[0]=0; 
   if(p%8>0) m=p/8+1; 
   else m=p/8; 
   for(j=0;j<m;j++) 
   
    fread(&c,1,1,ifp); 
    f=c; 
    itoa(f,buf,2);   //将f转换为二进制表示的字符串
    f=strlen(buf); 
    for(l=8;l>f;l--) 
    
     strcat(header[i].bits,"0"); 
    
    strcat(header[i].bits,buf); 
    
   header[i].bits[p]=0; 
 
for(i=0;i<n;i++)   //根据哈夫曼编码的长短,对结点进行排序

   for(j=i+1;j<n;j++) 
   
    if(strlen(header[i].bits)>strlen(header[j].bits)) 
    
     tmp=header[i]; 
     header[i]=header[j]; 
     header[j]=tmp; 
     
    
 
p=strlen(header[n-1].bits); 
fseek(ifp,8,SEEK_SET); 
m=0; 
bx[0]=0; 
while(1)    //通过哈夫曼编码的长短,依次解码,从原来的位存储还原到字节存储

   while(strlen(bx)<(unsigned int)p) 
   
    fread(&c,1,1,ifp); 
    f=c; 
    itoa(f,buf,2); 
    f=strlen(buf); 
    for(l=8;l>f;l--) //在单字节内对相应位置补0
    
     strcat(bx,"0"); 
    
    strcat(bx,buf); 
   
   for(i=0;i<n;i++) 
   
    if(memcmp(header[i].bits,bx,header[i].count)==0) break; 
   
   strcpy(bx,bx+header[i].count);   /*从压缩文件中的按位存储还原到按字节存储字符,
           字符位置不改变*/
   c=header[i].b; 
   fwrite(&c,1,1,ofp); 
   m++;   //统计解压缩后文件的长度
   if(m==flength) break;   //flength是原文件长度
 
fclose(ifp); 
fclose(ofp); 
printf("\\n\\t解压缩文件成功!\\n"); 
if(m==flength)   //对解压缩后文件和原文件相同性比较进行判断(根据文件大小)
   printf("\\t解压缩文件与原文件相同!\\n\\n"); 
else printf("\\t解压缩文件与原文件不同!\\n\\n");
return; 

/*主函数*/
int main() 

int c; 
while(1)   //菜单工具栏

   printf("\\t _______________________________________________\\n");
   printf("\\n");
   printf("\\t             * 压缩、解压缩 小工具 *            \\n");
   printf("\\t _______________________________________________\\n");   
   printf("\\t _______________________________________________\\n");
   printf("\\t|                                               |\\n");   
   printf("\\t| 1.压缩                                       |\\n");   
   printf("\\t| 2.解压缩                                     |\\n");   
   printf("\\t| 0.退出                                       |\\n");
   printf("\\t|_______________________________________________|\\n");
   printf("\\n");
   printf("\\t                 说明:(1)采用哈夫曼编码\\n");
   printf("\\t                       (2)适用于文本文件\\n"); 
   printf("\\n");
   do   //对用户输入进行容错处理
   
    printf("\\n\\t*请选择相应功能(0-2):");     
    c=getch(); 
    printf("%c\\n",c); 
    if(c!=\'0\' && c!=\'1\' && c!=\'2\')
     
     printf("\\t@_@请检查您的输入在0~2之间!\\n");
     printf("\\t请再输入一遍!\\n");
    
   while(c!=\'0\' && c!=\'1\' && c!=\'2\'); 
   if(c==\'1\') compress();          //调用压缩子函数
   else if(c==\'2\') uncompress();   //调用解压缩子函数
   else 
   
    printf("\\t欢迎您再次使用该工具^_^\\n"); 
    exit(0);                    //退出该工具
   
   system("pause");   //任意键继续
   system("cls");     //清屏

return 0;
追问

不要哈弗曼编码,要游程编码

参考技术A 很简单:
记录第一各字节,然后读取其后面的一个字节,如果和前一个字节相同,合计该字节的个数。继续向后读取,合计...直到读到不同的字节,如果这个字节和前面的不同,则开始计数这个字节的个数。依次读取到文件的末尾。
比如
AAAAABBBBCCCCCCCDDDDD。用行程编码结果为:A5B4C7D5

相信聪明的你对如何解码也胸有成竹了吧!!!!追问

求源代码啊,…我是一点也不懂

图像压缩基于行程编码实现的图像压缩matlab源码

一、简介
1、行程编码概述(RLE)
在图像压缩上,行程编码(RLE)一般用于压缩二值化图像,因为它是基于重复的压缩算法,比如:

二维图像降维后(压缩前):0 0 0 0 0 255 255 255 0 0 255
行程编码压缩后:5 0 3 255 2 0 1 255
(压缩格式为:数量+像素+数量+像素…)

如果有大量的像素连续重复,那么压缩率会更高。
编码是方法建立在图像统计特性的基础上的。例如,在传真通信中的文件大多是二值图像,即每个像素的灰度值只有0和1两种取值。将一行中颜色值相同的相邻象素用一个计数值和该颜色值来代替。例如aaabccccccddeee可以表示为3a1b6c2d3e,,即有3个a,1个b,6个c,2个d,3个e。如果一幅图象是由很多块颜色相同的大面积区域组成,那么采用行程编码的压缩效率是惊人的。然而,该算法也导致了一个致命弱点,如果图象中每两个相邻点的颜色都不同,用这种算法不但不能压缩,反而数据量增加一倍。因此对有大面积色块的图像用行程编码效果比较好。
行程编码的可行性讨论:行程编码的压缩方法对于自然图片来说是不太可行的,因为自然图片像素点错综复杂,同色像素连续性差,如果硬要用行程编码方法来编码就适得其反,图像体积不但没减少,反而加倍。鉴于计算机桌面图,图像的色块大,同色像素点连续较多,所以行程编码对于计算机桌面图像来说是一种较好的编码方法。
2 图像压缩
2.1 图像压缩:图像压缩就是对图像数据按照一定的规则进行变换和组合,用尽可能少的数据量来表示影像,形象的说,就是对影像数据的瘦身。

2.2 图像压缩的必要性:多媒体数据的显著特点就是数据量非常大。例如,一张彩色相片的数据量可达10MB;视频影像和声音由于连续播放,数据量更加庞大。这对计算机的存储以及网络传输都造成了极大的负担。

2.3 图像压缩的可行性:
1)原始图像数据是高度相关的,存在很大的冗余。数据冗余造成比特数浪费,消除这些冗余可以节约码字,也就是达到了数据压缩的目的。大多数图像内相邻像素之间有较大的相关性,这称为空间冗余。序列图像前后帧内相邻之间有较大的相关性,这称为时间冗余。

2)若用相同码长来表示不同出现概率的符号也会造成比特数的浪费,这种浪费称为符号编码冗余。如果采用可变长编码技术,对出现概率高的符号用短码字表示,对出现概率低的符号用长码字表示,这样就可大大消除符号编码冗余。再次,有些图像信息(如色度信息、高频信息)在通常的视感觉过程中与另外一些信息相比来说不那么重要,这些信息可以认为是心里视觉冗余,去除这些信息并不会明显地降低人眼所感受到的图像质量,因此在压缩的过程中可以去除这些人眼不敏感的信息,从而实现数据压缩。

二、源代码
 

function yc
%%行程编码算法
%例如aaabccccccddeee才可以表示为3a1b6c2d3e
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%读图
I=imread('Lena.jpg');
[m n l]=size(I);
fid=fopen('yc.txt','w');
%yc.txt是行程编码算法的灰度级及其相应的编码表
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%行程编码算法
 
sum=0;
for k=1:l 
    for i=1:m
        num=0;
         J=[];
         value=I(i,1,k);
        for j=2:n
            if I(i,j,k)==value
                num=num+1;
%统计相邻像素灰度级相等的个数
                if j==n
                     J=[J,num,value];
                end
            else J=[J,num,value];
%J的形式是先是灰度的个数及该灰度的值
                value=I(i,j,k);
            num=1;
            end
        end
        col(i,k)=size(J,2);
%记录Y中每行行程行程编码数
        sum=sum+col(i,k);
        Y(i,1:col(i,k),k)=J;
%将I中每一行的行程编码J存入Y的相应行中
    end
end
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%输出相关数据
[m1,n1,l1]=size(Y);
disp('原图像大小:')
whos('I');
disp('压缩图像大小:')
whos('Y');
disp('图像的压缩比:');
disp(m*n*l/sum);

三、运行结果

在这里插入图片描述
在这里插入图片描述

四、备注

完整代码或者仿真咨询添加QQ1575304183

以上是关于利用C++行程编码编写一款压缩软件,思路:读取,编码,解码。的主要内容,如果未能解决你的问题,请参考以下文章

行程长度编码的RLE 压缩算法的基本原理

图像压缩基于行程编码实现的图像压缩matlab源码

openjudge-字符串32-行程长度编码(压缩代码)

C++程序编写压缩器/解压器(长度-游程编码的压缩/解压+霍夫曼编码压缩/解压 (霍夫曼树))

行程长度编码

AC日记——行程长度编码 openjudge 1.7 32