C/C++ 数据结构与算法【哈夫曼树】哈夫曼树详细解析【一样平常学习，考研 ...

数据人与超自然意识 · 2025-1-2 19:34:25

哈夫曼树（最优二叉树）

1）基础概念

**路径：**从树中一个结点到另一个结点之间的分支构成这两个结点间的路径。
**结点的路径长度：**两结点间路径上的分支数。

**树的路径长度：**从树根到每一个结点的路径长度之和。记作：TL。

结点数目相同的二叉树中，完全二叉树是路径长度最短的二叉树。
**权：**将树中结点赋给一个有着某种含义的数值，则这个数值称为该结点的权。
**结点的带权路径长度：**从根结点到该结点之间的路径长度与该结点的权的乘积。
**树的带权路径长度：**树中全部叶子结点的带权路径长度之和。

2）构造哈夫曼树

顺序存储结构——一维结构数组

（1）界说结构

typedef struct {
int weight;
int parent, lch, rch;
}HTNode, * HuffmanTree;
HuffmanTree H;

复制代码

（2）步骤：

初始化HT [1…2n-1]：lch = rch = parent = 0；
输入初始几个叶子结点：置HT[1…n]的 weight 值；
进行以下n-1次归并，依次产生n-1个结点HT，i = n + 1…2n-1：

在HT[1…i-1]中选两个未被选过(从parent ==0 的结点中选)的weight最小的两个结点 HT[S1] 和 HT[S2]，s1、s2为两个最小结点下标；

修改 HT[s1] 和 HT[s2] 的parent值：HT[s1].parent = i; HT[s2] .parent = i;

修改新产生的HT：

HT[i].weight = HT[s1].weight + HT[s2].weight;
HTli].Ich = s1;
HT[i].rch = s2;

复制代码

void CreatHuffmanTree(HuffmanTree& HT, int n) { //构造哈夫曼树--哈夫曼算法
if (n <= 1) return;
int m = 2 * n - 1; // 数组共2n-1个元素
HT = new HTNode[m + 1]; // 动态分配内存，0号单元未用，HT[m]表示根结点
// 初始化2n-1个元素的lch、rch、parent为0
for (int i = 1; i <= m; ++i) {
HT[i].lch = HT[i].rch = HT[i].parent = 0;
}
// 输入前n个元素的weight值
cout << "请输入" << n << "个字符的频率：" << endl;
for (int i = 1; i <= n; ++i) {
cin >> HT[i].weight;
}
// 构建哈夫曼树
for (int i = n + 1; i <= m; i++) {
int s1, s2;
Select(HT, i - 1, s1, s2);
HT[s1].parent = i;
HT[s2].parent = i;
HT[i].lch = s1;
HT[i].rch = s2;
HT[i].weight = HT[s1].weight + HT[s2].weight;
}
}

复制代码

（3）总代码：

权值为整数：

#include <iostream>#include <limits.h>using namespace std;// 界说哈夫曼树节点结构typedef struct { int weight; int parent, lch, rch;} HTNode;typedef HTNode* HuffmanTree;// 选择两个双亲域为0且权值最小的结点void Select(const HTNode* HT, int i, int& s1, int& s2) { s1 = s2 = -1; int min1 = INT_MAX, min2 = INT_MAX; for (int j = 1; j <= i; ++j) {       if (HT[j].parent == 0 && HT[j].weight < min1) {          min2 = min1;          s2 = s1;          min1 = HT[j].weight;          s1 = j;       }       else if (HT[j].parent == 0 && HT[j].weight < min2) {          min2 = HT[j].weight;          s2 = j;       } }}void CreatHuffmanTree(HuffmanTree& HT, int n) { //构造哈夫曼树--哈夫曼算法
if (n <= 1) return;
int m = 2 * n - 1; // 数组共2n-1个元素
HT = new HTNode[m + 1]; // 动态分配内存，0号单元未用，HT[m]表示根结点
// 初始化2n-1个元素的lch、rch、parent为0
for (int i = 1; i <= m; ++i) {
      HT[i].lch = HT[i].rch = HT[i].parent = 0;
}
// 输入前n个元素的weight值
cout << "请输入" << n << "个字符的频率：" << endl;
for (int i = 1; i <= n; ++i) {
      cin >> HT[i].weight;
}
// 构建哈夫曼树
for (int i = n + 1; i <= m; i++) {
      int s1, s2;
      Select(HT, i - 1, s1, s2);
      HT[s1].parent = i;
      HT[s2].parent = i;
      HT[i].lch = s1;
      HT[i].rch = s2;
      HT[i].weight = HT[s1].weight + HT[s2].weight;
}
}
int main() { int n; cout << "请输入叶子节点的数目："; cin >> n; HuffmanTree HT; CreatHuffmanTree(HT, n); // 打印哈夫曼树（示例） cout << "哈夫曼树构造完成，打印结果如下：" << endl; for (int i = 1; i < 2 * n; ++i) {       cout << "Node " << i << ": Weight=" << HT[i].weight          << ", Parent=" << HT[i].parent          << ", Left Child=" << HT[i].lch          << ", Right Child=" << HT[i].rch << endl; } delete[] HT; // 开释动态分配的内存 return 0;}
复制代码
权值为浮点数

#include <iostream>
#include <limits.h> // 如果不再使用 INT_MAX，可以不需要这个头文件
using namespace std;
// 定义哈夫曼树节点结构，将 weight 改为 double 类型
typedef struct {
double weight;  // 权值改为 double 类型
int parent, lch, rch;
} HTNode;
typedef HTNode* HuffmanTree;
// 选择两个双亲域为0且权值最小的结点
void Select(const HTNode* HT, int i, int& s1, int& s2) {
s1 = s2 = -1;
double min1 = DBL_MAX, min2 = DBL_MAX; // 使用 DBL_MAX 作为最大值初始化
for (int j = 1; j <= i; ++j) {
      if (HT[j].parent == 0 && HT[j].weight < min1) {
         min2 = min1;
         s2 = s1;
         min1 = HT[j].weight;
         s1 = j;
      }
      else if (HT[j].parent == 0 && HT[j].weight < min2) {
         min2 = HT[j].weight;
         s2 = j;
      }
}
}
void CreatHuffmanTree(HuffmanTree& HT, int n) { //构造哈夫曼树--哈夫曼算法
if (n <= 1) return;
int m = 2 * n - 1; // 数组共2n-1个元素
HT = new HTNode[m + 1]; // 动态分配内存，0号单元未用，HT[m]表示根结点
// 初始化2n-1个元素的lch、rch、parent为0
for (int i = 1; i <= m; ++i) {
      HT[i].lch = HT[i].rch = HT[i].parent = 0;
      HT[i].weight = 0.0; // 初始化 weight 为 0.0
}
// 输入前n个元素的weight值
cout << "请输入" << n << "个字符的小数频率：" << endl;
for (int i = 1; i <= n; ++i) {
      cin >> HT[i].weight;
}
// 构建哈夫曼树
for (int i = n + 1; i <= m; i++) {
      int s1, s2;
      Select(HT, i - 1, s1, s2);
      HT[s1].parent = i;
      HT[s2].parent = i;
      HT[i].lch = s1;
      HT[i].rch = s2;
      HT[i].weight = HT[s1].weight + HT[s2].weight;
}
}
int main() {
int n;
cout << "请输入叶子节点的数量：";
cin >> n;
HuffmanTree HT;
CreatHuffmanTree(HT, n);
// 打印哈夫曼树（示例）
cout << "哈夫曼树构造完成，打印结果如下：" << endl;
for (int i = 1; i <= 2 * n - 1; ++i) { // 注意这里应该是 2*n-1 而不是 2*n
      cout << "Node " << i << ": Weight=" << HT[i].weight
         << ", Parent=" << HT[i].parent
         << ", Left Child=" << HT[i].lch
         << ", Right Child=" << HT[i].rch << endl;
}
delete[] HT; // 释放动态分配的内存
return 0;
}
复制代码
（4）运行结果：

3）哈夫曼编码

在远程通讯中，要将待传字符转换成由二进制的字符串：

若将编码设计为长度不等的二进制编码，即让待传字符串中出现次数较多的字符采用尽可能短的编码，则转换的二进制字符串便可能减少。

问题1 ：什么样的前缀码能使得电文总长最短？

——哈夫曼编码
方法:
1、统计字符集中每个字符在电文中出现的均匀概率（概率越大要求编码越短）。
2、利用哈夫曼树的特点：权越大的叶子离根越近；将每个字符的概率值作为权值，构造哈夫曼树。则概率越大的结点，路径越短。
3、在哈夫曼树的每个分支上标上0或1：

结点的左分支标0，右分支桥 1。

把从根到每个吐子的路径上的标号连接起来，作为该叶子代表的字符的编码。

问题2 ：为什么哈夫曼编码可以或许包管是前缀编码?

因为没有一片树叶是另一片树叶的祖先，所以每个叶结点的编码就不可能是其它叶结点编码的前缀。
问题 3 ：为什么哈夫曼编码可以或许包管字符编码总长最短?

因为哈夫曼树的带权路径长度最短，故字符编码的总长最短。

性质1 哈夫曼编码是前缀码

性质2 哈夫曼编码是最优前缀码

算法实现：

// 从叶子到根逆向求每个字符的哈夫曼编码，存储在编码表HC中
void CreatHuffmanCode(const HuffmanTree& HT, HuffmanCode& HC, int n) {
HC = new char*[n + 1]; // 分配n个字符编码的头指针数组
char* cd = new char[n]; // 分配临时存放编码的动态数组空间
cd[n - 1] = '\0'; // 编码结束符
for (int i = 1; i <= n; ++i) {
      int start = n - 1;
      int c = i;
      int f = HT[i].parent;
      // 从叶子结点开始向上回溯，直到根结点
      while (f != 0) {
         --start;
         if (HT[f].lch == c)
            cd[start] = '0'; // 结点c是f的左孩子，则生成代码0
         else
            cd[start] = '1'; // 结点c是f的右孩子，则生成代码1
         c = f;
         f = HT[f].parent;
      }
      // 计算编码长度并分配适当的空间
      int codeLength = n - start;
      HC[i] = new char[codeLength];
      strncpy(HC[i], &cd[start], codeLength);
      HC[i][codeLength - 1] = '\0'; // 确保字符串以空字符终止
}
delete[] cd; // 释放临时空间
}
复制代码
strncpy(HC, &cd[start], codeLength);语句在C++中确实可以用于复制字符数组，但它有一些潜在的问题和局限性。特别是当你使用strncpy时，假如目标缓冲区没有充足的空间来包罗源字符串加上制止空字符（\0），它不会自动添加制止空字符，这可能会导致后续利用出现问题。
此外，在现代C++中，更推荐使用std::string来处理字符串，因为它们更安全、更方便，并且可以克制手动管理内存的复杂性和风险。

// 从叶子到根逆向求每个字符的哈夫曼编码，存储在编码表HC中
void CreatHuffmanCode(const HuffmanTree& HT, HuffmanCode& HC, int n) {
HC.resize(n + 1); // 分配n个字符编码的空间
for (int i = 1; i <= n; ++i) {
      string code = "";
      int c = i;
      int f = HT[i].parent;
      // 从叶子结点开始向上回溯，直到根结点
      while (f != 0) {
         if (HT[f].lch == c)
            code = '0' + code; // 结点c是f的左孩子，则生成代码0
         else
            code = '1' + code; // 结点c是f的右孩子，则生成代码1
         c = f;
         f = HT[f].parent;
      }
      HC[i] = code;
}
}
复制代码
总代码实现：

#include <iostream>
#include <cstring> // 用于 strcpy 和 strlen
#include <limits>  // 用于 std::numeric_limits
using namespace std;
// 定义哈夫曼树节点结构
typedef struct HTNode {
double weight; // 权重改为 double 类型
int parent, lch, rch;
} HTNode;
typedef HTNode* HuffmanTree;
// 定义哈夫曼编码结构
typedef char** HuffmanCode;
// 选择两个双亲域为0且权值最小的结点
void Select(const HTNode* HT, int i, int& s1, int& s2) {
s1 = s2 = -1;
double min1 = numeric_limits<double>::max(), min2 = numeric_limits<double>::max();
for (int j = 1; j <= i; ++j) {
      if (HT[j].parent == 0 && HT[j].weight < min1) {
         min2 = min1;
         s2 = s1;
         min1 = HT[j].weight;
         s1 = j;
      } else if (HT[j].parent == 0 && HT[j].weight < min2) {
         min2 = HT[j].weight;
         s2 = j;
      }
}
}
// 构造哈夫曼树--哈夫曼算法
void CreatHuffmanTree(HuffmanTree &HT, int n) {
if (n <= 1) return;
int m = 2 * n - 1; // 数组共2n-1个元素
HT = new HTNode[m + 1]; // 动态分配内存，0号单元未用，HT[m]表示根结点
// 初始化2n-1个元素的lch、rch、parent为0
for (int i = 1; i <= m; ++i) {
      HT[i].lch = HT[i].rch = HT[i].parent = 0;
      HT[i].weight = 0.0; // 初始化权重为 0.0
}
// 输入前n个元素的weight值
cout << "请输入" << n << "个字符的频率（浮点数）：" << endl;
for (int i = 1; i <= n; ++i) {
      cin >> HT[i].weight;
}
// 构建哈夫曼树
for (int i = n + 1; i <= m; i++) {
      int s1, s2;
      Select(HT, i - 1, s1, s2);
      HT[s1].parent = i;
      HT[s2].parent = i;
      HT[i].lch = s1;
      HT[i].rch = s2;
      HT[i].weight = HT[s1].weight + HT[s2].weight;
}
}
// 从叶子到根逆向求每个字符的哈夫曼编码，存储在编码表HC中
void CreatHuffmanCode(HuffmanTree HT, HuffmanCode& HC, int n) {
HC = new char*[n + 1]; // 分配n个字符编码的头指针数组
char* cd = new char[n]; // 分配临时存放编码的动态数组空间
cd[n - 1] = '\0'; // 编码结束符
for (int i = 1; i <= n; ++i) {
      int start = n - 1;
      int c = i;
      int f = HT[i].parent;
      // 从叶子结点开始向上回溯，直到根结点
      while (f != 0) {
         --start;
         if (HT[f].lch == c)
            cd[start] = '0'; // 结点c是f的左孩子，则生成代码0
         else
            cd[start] = '1'; // 结点c是f的右孩子，则生成代码1
         c = f;
         f = HT[f].parent;
      }
      // 计算编码长度并分配适当的空间
      int codeLength = n - start;
      HC[i] = new char[codeLength];
      strncpy(HC[i], &cd[start], codeLength);
      HC[i][codeLength - 1] = '\0'; // 确保字符串以空字符终止
}
delete[] cd; // 释放临时空间
}
// 测试函数
int main() {
int n;
cout << "请输入叶子节点的数量：";
cin >> n;
HuffmanTree HT;
CreatHuffmanTree(HT, n);
HuffmanCode HC;
CreatHuffmanCode(HT, HC, n);
// 打印哈夫曼编码
cout << "哈夫曼编码如下：" << endl;
for (int i = 1; i <= n; ++i) {
      cout << "Character " << i << ": " << HC[i] << endl;
}
// 清理资源
for (int i = 1; i <= n; ++i) {
      delete[] HC[i];
}
delete[] HC;
delete[] HT;
return 0;
}
复制代码
改进后的代码：

#include <iostream>
#include <vector>
#include <string>
#include <limits>
using namespace std;
// 定义哈夫曼树节点结构
typedef struct HTNode {
double weight; // 权重改为 double 类型
int parent, lch, rch;
} HTNode;
typedef HTNode* HuffmanTree;
// 选择两个双亲域为0且权值最小的结点
void Select(const vector<HTNode>& HT, int i, int& s1, int& s2) {
s1 = s2 = -1;
double min1 = numeric_limits<double>::max(), min2 = numeric_limits<double>::max();
for (int j = 1; j <= i; ++j) {
      if (HT[j].parent == 0 && HT[j].weight < min1) {
         min2 = min1;
         s2 = s1;
         min1 = HT[j].weight;
         s1 = j;
      } else if (HT[j].parent == 0 && HT[j].weight < min2) {
         min2 = HT[j].weight;
         s2 = j;
      }
}
}
// 构造哈夫曼树--哈夫曼算法
void CreatHuffmanTree(vector<HTNode>& HT, int n) {
if (n <= 1) return;
int m = 2 * n - 1; // 数组共2n-1个元素
// 初始化2n-1个元素的lch、rch、parent为0，权重为0.0
HT.resize(m + 1);
for (int i = 1; i <= m; ++i) {
      HT[i] = {0.0, 0, 0, 0};
}
// 输入前n个元素的weight值
cout << "请输入" << n << "个字符的频率（浮点数）：" << endl;
for (int i = 1; i <= n; ++i) {
      cin >> HT[i].weight;
}
// 构建哈夫曼树
for (int i = n + 1; i <= m; i++) {
      int s1, s2;
      Select(HT, i - 1, s1, s2);
      HT[s1].parent = i;
      HT[s2].parent = i;
      HT[i].lch = s1;
      HT[i].rch = s2;
      HT[i].weight = HT[s1].weight + HT[s2].weight;
}
}
// 从叶子到根逆向求每个字符的哈夫曼编码，存储在编码表HC中
void CreatHuffmanCode(const vector<HTNode>& HT, vector<string>& HC, int n) {
HC.resize(n + 1); // 分配n个字符编码的空间
for (int i = 1; i <= n; ++i) {
      string code = "";
      int c = i;
      int f = HT[i].parent;
      // 从叶子结点开始向上回溯，直到根结点
      while (f != 0) {
         if (HT[f].lch == c)
            code = '0' + code; // 结点c是f的左孩子，则生成代码0
         else
            code = '1' + code; // 结点c是f的右孩子，则生成代码1
         c = f;
         f = HT[f].parent;
      }
      HC[i] = code;
}
}
// 测试函数
int main() {
int n;
cout << "请输入叶子节点的数量：";
cin >> n;
vector<HTNode> HT;
CreatHuffmanTree(HT, n);
vector<string> HC;
CreatHuffmanCode(HT, HC, n);
// 打印哈夫曼编码
cout << "哈夫曼编码如下：" << endl;
for (int i = 1; i <= n; ++i) {
      cout << "Character " << i << ": " << HC[i] << endl;
}
return 0;
}
复制代码
改进后：

#include <iostream>
#include <cstring> // 用于 strcpy 和 strlen
#include <limits>  // 用于 std::numeric_limits
using namespace std;
// 定义哈夫曼树节点结构
typedef struct HTNode {
double weight; // 权重改为 double 类型
int parent, lch, rch;
} HTNode;
typedef HTNode* HuffmanTree;
// 定义哈夫曼编码结构
typedef char** HuffmanCode;
// 选择两个双亲域为0且权值最小的结点
void Select(const HTNode* HT, int i, int& s1, int& s2) {
s1 = s2 = -1;
double min1 = numeric_limits<double>::max(), min2 = numeric_limits<double>::max();
for (int j = 1; j <= i; ++j) {
      if (HT[j].parent == 0 && HT[j].weight < min1) {
         min2 = min1;
         s2 = s1;
         min1 = HT[j].weight;
         s1 = j;
      } else if (HT[j].parent == 0 && HT[j].weight < min2) {
         min2 = HT[j].weight;
         s2 = j;
      }
}
}
// 构造哈夫曼树--哈夫曼算法
void CreatHuffmanTree(HuffmanTree &HT, int n) {
if (n <= 1) return;
int m = 2 * n - 1; // 数组共2n-1个元素
HT = new HTNode[m + 1]; // 动态分配内存，0号单元未用，HT[m]表示根结点
// 初始化2n-1个元素的lch、rch、parent为0
for (int i = 1; i <= m; ++i) {
      HT[i].lch = HT[i].rch = HT[i].parent = 0;
      HT[i].weight = 0.0; // 初始化权重为 0.0
}
// 输入前n个元素的weight值
cout << "请输入" << n << "个字符的频率）：" << endl;
for (int i = 1; i <= n; ++i) {
      cin >> HT[i].weight;
}
// 构建哈夫曼树
for (int i = n + 1; i <= m; i++) {
      int s1, s2;
      Select(HT, i - 1, s1, s2);
      HT[s1].parent = i;
      HT[s2].parent = i;
      HT[i].lch = s1;
      HT[i].rch = s2;
      HT[i].weight = HT[s1].weight + HT[s2].weight;
}
}
// 从叶子到根逆向求每个字符的哈夫曼编码，存储在编码表HC中
void CreatHuffmanCode(HuffmanTree HT, HuffmanCode& HC, int n) {
HC = new char*[n + 1]; // 分配n个字符编码的头指针数组
for (int i = 1; i <= n; ++i) {
      string code = ""; // 使用string来构建编码
      int c = i;
      int f = HT[i].parent;
      // 从叶子结点开始向上回溯，直到根结点
      while (f != 0) {
         if (HT[f].lch == c)
            code = '0' + code; // 结点c是f的左孩子，则生成代码0
         else
            code = '1' + code; // 结点c是f的右孩子，则生成代码1
         c = f;
         f = HT[f].parent;
      }
      // 将string转换为C风格字符串并分配适当的空间
      HC[i] = new char[code.length() + 1];
      strcpy(HC[i], code.c_str());
}
}
// 测试函数
int main() {
int n;
cout << "请输入叶子节点的数量：";
cin >> n;
if (n <= 0) {
      cerr << "叶子节点数量必须大于0." << endl;
      return 1;
}
HuffmanTree HT;
CreatHuffmanTree(HT, n);
HuffmanCode HC;
CreatHuffmanCode(HT, HC, n);
// 打印哈夫曼编码
cout << "哈夫曼编码如下：" << endl;
for (int i = 1; i <= n; ++i) {
      cout << "Character " << i << ": " << HC[i] << endl;
}
// 清理资源
for (int i = 1; i <= n; ++i) {
      delete[] HC[i];
}
delete[] HC;
delete[] HT;
return 0;
}
复制代码
运行结果：

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

C/C++ 数据结构与算法【哈夫曼树】哈夫曼树详细解析【一样平常学习，考研 ...

本帖子中包含更多资源

0 个回复

快速回复

楼主热帖

标签云

浏览过的版块

C/C++ 数据结构与算法【哈夫曼树】 哈夫曼树详细解析【一样平常学习，考研 ...

本帖子中包含更多资源

0 个回复

快速回复

楼主热帖

标签云

浏览过的版块

C/C++ 数据结构与算法【哈夫曼树】哈夫曼树详细解析【一样平常学习，考研 ...