利用C++行程编码编写一款压缩软件，思路：读取，编码，解码。

Posted 2023-04-12

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了利用C++行程编码编写一款压缩软件，思路：读取，编码，解码。相关的知识，希望对你有一定的参考价值。

求大神，解决问题给悬赏

用哈夫曼压缩文件(C语言）
利用哈夫曼编码制作压缩软件，内容如下：
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <conio.h>
struct head

unsigned char b;           //记录字符在数组中的位置
long count;             //字符出现频率（权值）
long parent,lch,rch;    //定义哈夫曼树指针变量
char bits[256];         //定义存储哈夫曼编码的数组

header[512],tmp;
/*压缩*/
void compress()

char filename[255],outputfile[255],buf[512];
unsigned char c;
long i,j,m,n,f;
long min1,pt1,flength,length1,length2;
double div;
FILE *ifp,*ofp;
printf("\\t请您输入需要压缩的文件：");
gets(filename);
ifp=fopen(filename,"rb");
if(ifp==NULL)

   printf("\\n\\t文件打开失败!\\n\\n");
   return;

printf("\\t请您输入压缩后的文件名：");
gets(outputfile);
ofp=fopen(strcat(outputfile,".hub"),"wb");
if(ofp==NULL)

   printf("\\n\\t压缩文件失败!\\n\\n");
   return;

flength=0;
while(!feof(ifp))

   fread(&c,1,1,ifp);
   header[c].count++;    //字符重复出现频率+1
   flength++;            //字符出现原文件长度+1

flength--;
length1=flength;          //原文件长度用作求压缩率的分母
header[c].count--;
for(i=0;i<512;i++)

   if(header[i].count!=0) header[i].b=(unsigned char)i;
   /*将每个哈夫曼码值及其对应的ASCII码存放在一维数组header[i]中，
   且编码表中的下标和ASCII码满足顺序存放关系*/
   else header[i].b=0;
   header[i].parent=-1;header[i].lch=header[i].rch=-1;    //对结点进行初始化

for(i=0;i<256;i++)    //根据频率（权值）大小，对结点进行排序，选择较小的结点进树

   for(j=i+1;j<256;j++)

    if(header[i].count<header[j].count)

     tmp=header[i];
     header[i]=header[j];
     header[j]=tmp;



for(i=0;i<256;i++) if(header[i].count==0) break;
n=i;       //外部叶子结点数为n个时，内部结点数为n-1，整个哈夫曼树的需要的结点数为2*n-1.
m=2*n-1;
for(i=n;i<m;i++)   //构建哈夫曼树

   min1=999999999;   //预设的最大权值，即结点出现的最大次数
   for(j=0;j<i;j++)

    if(header[j].parent!=-1) continue;
    //parent!=-1说明该结点已存在哈夫曼树中，跳出循环重新选择新结点*/
    if(min1>header[j].count)

     pt1=j;
     min1=header[j].count;
     continue;


   header[i].count=header[pt1].count;
   header[pt1].parent=i;   //依据parent域值（结点层数）确定树中结点之间的关系
   header[i].lch=pt1;   //计算左分支权值大小
   min1=999999999;
   for(j=0;j<i;j++)

    if(header[j].parent!=-1) continue;
    if(min1>header[j].count)

     pt1=j;
     min1=header[j].count;
     continue;


   header[i].count+=header[pt1].count;
   header[i].rch=pt1;   //计算右分支权值大小
   header[pt1].parent=i;

for(i=0;i<n;i++)   //哈夫曼无重复前缀编码

   f=i;
   header[i].bits[0]=0;   //根结点编码0
   while(header[f].parent!=-1)

    j=f;
    f=header[f].parent;
    if(header[f].lch==j)   //置左分支编码0

     j=strlen(header[i].bits);
     memmove(header[i].bits+1,header[i].bits,j+1);
     //依次存储连接“0”“1”编码
     header[i].bits[0]=\'0\';

    else   //置右分支编码1

     j=strlen(header[i].bits);
     memmove(header[i].bits+1,header[i].bits,j+1);
     header[i].bits[0]=\'1\';



fseek(ifp,0,SEEK_SET);   //从文件开始位置向前移动0字节，即定位到文件开始位置
fwrite(&flength,sizeof(int),1,ofp);
/*用来将数据写入文件流中，参数flength指向欲写入的数据地址，
总共写入的字符数以参数size*int来决定，返回实际写入的int数目1*/
fseek(ofp,8,SEEK_SET);
buf[0]=0;   //定义缓冲区,它的二进制表示00000000
f=0;
pt1=8;
/*假设原文件第一个字符是"A"，8位2进制为01000001，编码后为0110识别编码第一个\'0\'，
那么我们就可以将其左移一位，看起来没什么变化。下一个是\'1\'，应该|1，结果00000001
同理4位都做完，应该是00000110，由于字节中的8位并没有全部用完，我们应该继续读下一个字符，
根据编码表继续拼完剩下的4位，如果字符的编码不足4位，还要继续读一个字符，
如果字符编码超过4位，那么我们将把剩下的位信息拼接到一个新的字节里*/
while(!feof(ifp))

   c=fgetc(ifp);
   f++;
   for(i=0;i<n;i++)

    if(c==header[i].b) break;

   strcat(buf,header[i].bits);
   j=strlen(buf);
   c=0;
   while(j>=8)   //对哈夫曼编码位操作进行压缩存储

    for(i=0;i<8;i++)

     if(buf[i]==\'1\') c=(c<<1)|1;
     else c=c<<1;

    fwrite(&c,1,1,ofp);
    pt1++;   //统计压缩后文件的长度
    strcpy(buf,buf+8);   //一个字节一个字节拼接
    j=strlen(buf);

   if(f==flength) break;

if(j>0)    //对哈夫曼编码位操作进行压缩存储

   strcat(buf,"00000000");
   for(i=0;i<8;i++)

    if(buf[i]==\'1\') c=(c<<1)|1;
    else c=c<<1;

   fwrite(&c,1,1,ofp);
   pt1++;

fseek(ofp,4,SEEK_SET);
fwrite(&pt1,sizeof(long),1,ofp);
fseek(ofp,pt1,SEEK_SET);
fwrite(&n,sizeof(long),1,ofp);
for(i=0;i<n;i++)

   fwrite(&(header[i].b),1,1,ofp);
   c=strlen(header[i].bits);
   fwrite(&c,1,1,ofp);
   j=strlen(header[i].bits);
   if(j%8!=0)   //若存储的位数不是8的倍数，则补0

    for(f=j%8;f<8;f++)
     strcat(header[i].bits,"0");

   while(header[i].bits[0]!=0)

    c=0;
    for(j=0;j<8;j++)   //字符的有效存储不超过8位，则对有效位数左移实现两字符编码的连接

     if(header[i].bits[j]==\'1\') c=(c<<1)|1;   //|1不改变原位置上的“0”“1”值
     else c=c<<1;

    strcpy(header[i].bits,header[i].bits+8);   //把字符的编码按原先存储顺序连接
    fwrite(&c,1,1,ofp);


length2=pt1--;
div=((double)length1-(double)length2)/(double)length1;   //计算文件的压缩率
fclose(ifp);
fclose(ofp);
printf("\\n\\t压缩文件成功!\\n");
printf("\\t压缩率为 %f%%\\n\\n",div*100);
return;

/*解压缩*/
void uncompress()

char filename[255],outputfile[255],buf[255],bx[255];
unsigned char c;
long i,j,m,n,f,p,l;
long flength;
FILE *ifp,*ofp;
printf("\\t请您输入需要解压缩的文件：");
gets(filename);
ifp=fopen(strcat(filename,".hub"),"rb");
if(ifp==NULL)

   printf("\\n\\t文件打开失败!\\n");
   return;

printf("\\t请您输入解压缩后的文件名：");
gets(outputfile);
ofp=fopen(outputfile,"wb");
if(ofp==NULL)

   printf("\\n\\t解压缩文件失败!\\n");
   return;

fread(&flength,sizeof(long),1,ifp);   //读取原文件长度，对文件进行定位
fread(&f,sizeof(long),1,ifp);
fseek(ifp,f,SEEK_SET);
fread(&n,sizeof(long),1,ifp);
for(i=0;i<n;i++)

   fread(&header[i].b,1,1,ifp);
   fread(&c,1,1,ifp);
   p=(long)c;   //读取原文件字符的权值
   header[i].count=p;
   header[i].bits[0]=0;
   if(p%8>0) m=p/8+1;
   else m=p/8;
   for(j=0;j<m;j++)

    fread(&c,1,1,ifp);
    f=c;
    itoa(f,buf,2);   //将f转换为二进制表示的字符串
    f=strlen(buf);
    for(l=8;l>f;l--)

     strcat(header[i].bits,"0");

    strcat(header[i].bits,buf);

   header[i].bits[p]=0;

for(i=0;i<n;i++)   //根据哈夫曼编码的长短，对结点进行排序

   for(j=i+1;j<n;j++)

    if(strlen(header[i].bits)>strlen(header[j].bits))

     tmp=header[i];
     header[i]=header[j];
     header[j]=tmp;



p=strlen(header[n-1].bits);
fseek(ifp,8,SEEK_SET);
m=0;
bx[0]=0;
while(1)    //通过哈夫曼编码的长短，依次解码，从原来的位存储还原到字节存储

   while(strlen(bx)<(unsigned int)p)

    fread(&c,1,1,ifp);
    f=c;
    itoa(f,buf,2);
    f=strlen(buf);
    for(l=8;l>f;l--) //在单字节内对相应位置补0

     strcat(bx,"0");

    strcat(bx,buf);

   for(i=0;i<n;i++)

    if(memcmp(header[i].bits,bx,header[i].count)==0) break;

   strcpy(bx,bx+header[i].count);   /*从压缩文件中的按位存储还原到按字节存储字符，
           字符位置不改变*/
   c=header[i].b;
   fwrite(&c,1,1,ofp);
   m++;   //统计解压缩后文件的长度
   if(m==flength) break;   //flength是原文件长度

fclose(ifp);
fclose(ofp);
printf("\\n\\t解压缩文件成功!\\n");
if(m==flength)   //对解压缩后文件和原文件相同性比较进行判断（根据文件大小）
   printf("\\t解压缩文件与原文件相同!\\n\\n");
else printf("\\t解压缩文件与原文件不同!\\n\\n");
return;

/*主函数*/
int main()

int c;
while(1)   //菜单工具栏

   printf("\\t _______________________________________________\\n");
   printf("\\n");
   printf("\\t             * 压缩、解压缩小工具 *            \\n");
   printf("\\t _______________________________________________\\n");
   printf("\\t _______________________________________________\\n");
   printf("\\t|                                               |\\n");
   printf("\\t| 1.压缩                                       |\\n");
   printf("\\t| 2.解压缩                                     |\\n");
   printf("\\t| 0.退出                                       |\\n");
   printf("\\t|_______________________________________________|\\n");
   printf("\\n");
   printf("\\t                 说明：（1）采用哈夫曼编码\\n");
   printf("\\t                       （2）适用于文本文件\\n");
   printf("\\n");
   do   //对用户输入进行容错处理

    printf("\\n\\t*请选择相应功能(0-2):");
    c=getch();
    printf("%c\\n",c);
    if(c!=\'0\' && c!=\'1\' && c!=\'2\')

     printf("\\t@_@请检查您的输入在0~2之间！\\n");
     printf("\\t请再输入一遍！\\n");

   while(c!=\'0\' && c!=\'1\' && c!=\'2\');
   if(c==\'1\') compress();          //调用压缩子函数
   else if(c==\'2\') uncompress();   //调用解压缩子函数
   else

    printf("\\t欢迎您再次使用该工具^_^\\n");
    exit(0);                    //退出该工具

   system("pause");   //任意键继续
   system("cls");     //清屏

return 0;
追问

不要哈弗曼编码，要游程编码

参考技术A 很简单：
记录第一各字节，然后读取其后面的一个字节，如果和前一个字节相同，合计该字节的个数。继续向后读取，合计...直到读到不同的字节，如果这个字节和前面的不同，则开始计数这个字节的个数。依次读取到文件的末尾。
比如
AAAAABBBBCCCCCCCDDDDD。用行程编码结果为：A5B4C7D5

相信聪明的你对如何解码也胸有成竹了吧！！！！追问

求源代码啊，…我是一点也不懂

图像压缩基于行程编码实现的图像压缩matlab源码

一、简介
1、行程编码概述（RLE）
在图像压缩上，行程编码（RLE）一般用于压缩二值化图像，因为它是基于重复的压缩算法，比如：

二维图像降维后（压缩前）：0 0 0 0 0 255 255 255 0 0 255
行程编码压缩后：5 0 3 255 2 0 1 255
（压缩格式为：数量+像素+数量+像素…）

如果有大量的像素连续重复，那么压缩率会更高。
编码是方法建立在图像统计特性的基础上的。例如，在传真通信中的文件大多是二值图像，即每个像素的灰度值只有0和1两种取值。将一行中颜色值相同的相邻象素用一个计数值和该颜色值来代替。例如aaabccccccddeee可以表示为3a1b6c2d3e，，即有3个a，1个b，6个c，2个d，3个e。如果一幅图象是由很多块颜色相同的大面积区域组成，那么采用行程编码的压缩效率是惊人的。然而，该算法也导致了一个致命弱点，如果图象中每两个相邻点的颜色都不同，用这种算法不但不能压缩，反而数据量增加一倍。因此对有大面积色块的图像用行程编码效果比较好。
行程编码的可行性讨论：行程编码的压缩方法对于自然图片来说是不太可行的，因为自然图片像素点错综复杂，同色像素连续性差，如果硬要用行程编码方法来编码就适得其反，图像体积不但没减少，反而加倍。鉴于计算机桌面图，图像的色块大，同色像素点连续较多，所以行程编码对于计算机桌面图像来说是一种较好的编码方法。
2 图像压缩
2.1 图像压缩：图像压缩就是对图像数据按照一定的规则进行变换和组合，用尽可能少的数据量来表示影像，形象的说，就是对影像数据的瘦身。

2.2 图像压缩的必要性：多媒体数据的显著特点就是数据量非常大。例如，一张彩色相片的数据量可达10MB；视频影像和声音由于连续播放，数据量更加庞大。这对计算机的存储以及网络传输都造成了极大的负担。

2.3 图像压缩的可行性：
1）原始图像数据是高度相关的，存在很大的冗余。数据冗余造成比特数浪费，消除这些冗余可以节约码字，也就是达到了数据压缩的目的。大多数图像内相邻像素之间有较大的相关性，这称为空间冗余。序列图像前后帧内相邻之间有较大的相关性，这称为时间冗余。

2）若用相同码长来表示不同出现概率的符号也会造成比特数的浪费，这种浪费称为符号编码冗余。如果采用可变长编码技术，对出现概率高的符号用短码字表示，对出现概率低的符号用长码字表示，这样就可大大消除符号编码冗余。再次，有些图像信息（如色度信息、高频信息）在通常的视感觉过程中与另外一些信息相比来说不那么重要，这些信息可以认为是心里视觉冗余，去除这些信息并不会明显地降低人眼所感受到的图像质量，因此在压缩的过程中可以去除这些人眼不敏感的信息，从而实现数据压缩。

二、源代码

function yc
%%行程编码算法
%例如aaabccccccddeee才可以表示为3a1b6c2d3e
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%读图
I=imread('Lena.jpg');
[m n l]=size(I);
fid=fopen('yc.txt','w');
%yc.txt是行程编码算法的灰度级及其相应的编码表
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%行程编码算法
 
sum=0;
for k=1:l 
    for i=1:m
        num=0;
         J=[];
         value=I(i,1,k);
        for j=2:n
            if I(i,j,k)==value
                num=num+1;
%统计相邻像素灰度级相等的个数
                if j==n
                     J=[J,num,value];
                end
            else J=[J,num,value];
%J的形式是先是灰度的个数及该灰度的值
                value=I(i,j,k);
            num=1;
            end
        end
        col(i,k)=size(J,2);
%记录Y中每行行程行程编码数
        sum=sum+col(i,k);
        Y(i,1:col(i,k),k)=J;
%将I中每一行的行程编码J存入Y的相应行中
    end
end
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%输出相关数据
[m1,n1,l1]=size(Y);
disp('原图像大小:')
whos('I');
disp('压缩图像大小:')
whos('Y');
disp('图像的压缩比:');
disp(m*n*l/sum);

三、运行结果

在这里插入图片描述

四、备注

完整代码或者仿真咨询添加QQ1575304183

以上是关于利用C++行程编码编写一款压缩软件，思路：读取，编码，解码。的主要内容，如果未能解决你的问题，请参考以下文章