
Posted powerkeke



1. 问题

通常的编码方法有固定长度编码和不等长度编码两种。这是一个设计最优编码方案的问题,目的是使总码长度最短。这个问题利用字符的使用频率来编码,是不等长编码方法,使得经常使用的字符编码较短,不常使用的字符编码较长。如果采用等长的编码方案,假设所有字符的编码都等长,则表示 n 个不同的字符需要 log n 位。例如,3 个不同的字符 ab、c,至少需要 2 位二进制数表示,a 00,b 01,c 10。如果每个字符的使用频率相等,固定长度编码是空间效率最高的方法。





例如,ABCD 四个字符如果编码如下。


那么现在有一列数 0110,该怎样翻译呢?是翻译为 ABBA,ABD,CBA,还是 CD?那么如何消除二义性呢?解决的办法是:任何一个字符的编码不能是另一个字符编码的前缀,即前缀码特性。1952 ,数学家 D.A.Huffman 提出了根据字符在文件中出现的频率,01 的数字串表示各字符的最佳编码方式,称为哈夫曼(Huffman)编码。哈夫曼编码很好地解决了上述两个关键问题,被广泛应用于数据压缩,尤其是远距离通信和大容量数据存储方面,常用的JPEG 图片就是采用哈夫曼编码压缩的。 


2. 解析

哈夫曼编码的基本思想是以字符的使用频率作为权构建一棵哈夫曼树,然后利用哈夫曼树对字符进行编码。构造一棵哈夫曼树,是将所要编码的字符作为叶子结点,该字符在文件中的使用频率作为叶子结点的权值,以自底向上的方式,通过 n1 次的“合并”运算后构造出的一棵树,核心思想是权值越大的叶子离根越近。


3. 分析

n + (n + 1) + (n + 2) + ... +(n + (n -2)) = (n -1) *(3n - 2) /2=O(N²)

4. 源码

project name:哈夫曼树
Time Complexity: O(n²)
#include <iostream>
using namespace std;

#define MAXCODELEN 100
#define MAXHAFF 100
#define MAXCODE 100
#define MAXWEIGHT 10000;

typedef struct Haffman {
    int weight;
    char ch;
    int parent;
    int leftChild;
    int rightChild;
} HaffmaNode;

typedef struct Code {
    int code[MAXCODELEN];
    int start;
} HaffmaCode;

HaffmaNode haffman[MAXHAFF];
HaffmaCode code[MAXCODE];

void buildHaffman(int all) {
    //哈夫曼节点的初始化之前的工作, weight为0,parent,leftChile,rightChile都为-1
    for (int i = 0; i < all * 2 - 1; ++i) {
        haffman[i].weight = 0;
        haffman[i].parent = -1;
        haffman[i].leftChild = -1;
        haffman[i].rightChild = -1;
    std::cout << "请输入需要哈夫曼编码的字符和权重大小" << std::endl;
    for (int i = 0; i < all; i++) {
        std::cout << "请分别输入第个" << i << "哈夫曼字符和权重" << std::endl;
        std::cin >> haffman[i].ch;
        std::cin >> haffman[i].weight;
    //每次找出最小的权重的节点,生成新的节点,需要all - 1 次合并
    int x1, x2, w1, w2;
    for (int i = 0; i < all - 1; ++i) {
        x1 = x2 = -1;
        w1 = w2 = MAXWEIGHT;
        //注意这里每次是all + i次里面便利
        for (int j = 0; j < all + i; ++j) {
            if (haffman[j].parent == -1 && haffman[j].weight < w1) {
                w2 = w1;
                x2 = x1;
                x1 = j;
                w1 = haffman[j].weight;
            //这里用else if而不是if,是因为它们每次只选1个就可以了。
            else if (haffman[j].parent == -1 && haffman[j].weight < w2) {
                x2 = j;
                w2 = haffman[j].weight;
        haffman[all + i].leftChild = x1;
        haffman[all + i].rightChild = x2;
        haffman[all + i].weight = w1 + w2;
        haffman[x1].parent = all + i;
        haffman[x2].parent = all + i;
        std::cout << "x1 is" << x1 << " x1 parent is" << haffman[x1].parent
                  << " x2 is" << x2 << " x2 parent is " << haffman[x2].parent
                  << " new Node is " << all + i << "new weight is"
                  << haffman[all + i].weight << std::endl;
void printCode(int all) {
    HaffmaCode hCode;
    int curParent;
    int c;
    for (int i = 0; i < all; ++i) {
        hCode.start = all - 1;
        c = i;
        curParent = haffman[i].parent;
        while (curParent != -1) {
            if (haffman[curParent].leftChild == c) {
                hCode.code[hCode.start] = 0;
                std::cout << "hCode.code[" << hCode.start << "] = 0"
                          << std::endl;
            } else {
                hCode.code[hCode.start] = 1;
                std::cout << "hCode.code[" << hCode.start << "] = 1"
                          << std::endl;
            c = curParent;
            curParent = haffman[c].parent;
        for (int j = hCode.start + 1; j < all; ++j) {
            code[i].code[j] = hCode.code[j];
        code[i].start = hCode.start;
int main() {
    std::cout << "请输入有多少个哈夫曼字符" << std::endl;
    int all = 0;
    std::cin >> all;
    if (all <= 0) {
        std::cout << "您输入的个数有误" << std::endl;
        return -1;
    for (int i = 0; i < all; ++i) {
        std::cout << haffman[i].ch << ": Haffman Code is:";
        for (int j = code[i].start + 1; j < all; ++j) {
            std::cout << code[i].code[j];
        std::cout << std::endl;
    return 0;





数据结构之哈弗曼编码的(Huffman Coding)加密解密压缩

leetcode_1292. Maximum Side Length of a Square with Sum Less than or Equal to Threshold_[二维前缀和](代码片段

markdown 打字稿...编码说明,提示,作弊,指南,代码片段和教程文章
