贪心算法-构造哈夫曼数及生成哈夫曼编码,编程实现

立山 · 2022-11-20 14:12:09

哈夫曼树

1.概念：

给定n个权值最为n个叶子的节点，构建成一颗二叉树。如果次树的带权路径长度最小，则称此二叉树为最优二叉树，也叫哈夫曼树。
WLP：带权路径长度
- 公式：
  [img=45%,45%/]https://img2022.cnblogs.com/blog/2291187/202211/2291187-20221120131450130-1355213385.png[/img]
- Wk:第k个叶子的节点权值
- Lk:根节点到第k个叶子的节点长度

例如下列二叉树：

给定4个叶子节点，权值分别为{2，3，5，8}，可以构造出4中形状不同的二叉树，但它们的带权路径长度可能不同。

[img=45%,45%/]https://img2022.cnblogs.com/blog/2291187/202211/2291187-20221120131621096-707303050.png[/img]如上图可看出：1、最后两个树的带权路径长度相同且也是最小的，所以可看作哈夫曼树
2、权值最小的节点越靠下，越大越靠近根节点
2.构建哈夫曼树

（1）、在{2，3，5，8}这几个节点看作叶子节点（即后面没有子节点）
[img=45%,45%/]https://img2022.cnblogs.com/blog/2291187/202211/2291187-20221120131810637-1862349395.png[/img]
（2）、在这几个节点中选出权值最小和次小的两个节点。构成一个新二叉树（最小为左字节的、次小为右子节点），新二叉树的权值为这两个权值之和.
[img=35%,35%/]https://img2022.cnblogs.com/blog/2291187/202211/2291187-20221120131911264-1161635956.png[/img]（3）、删除已经使用过的节点。将新创建的节点加入到还没被使用过的节点集合中，找出最小和次小的节点权值。又构成一颗新的二叉树。
[img=45%,45%/]https://img2022.cnblogs.com/blog/2291187/202211/2291187-20221120132008656-121294881.png[/img]（4）、重复(2)的操作
[img=45%,45%/]https://img2022.cnblogs.com/blog/2291187/202211/2291187-20221120132100035-1281422288.png[/img]
（5）、重复上面操作：删除已使用的节点，将新的节点加入未使用节点的集合中，发现只有一个节点，其权值为18.则此哈夫曼树创建完成，根节点权值为18.
代码如下：

import java.util.ArrayList;
import java.util.Collections;
import java.util.List;
/**
* 构造哈夫曼树
*/
public class test1 {
public static void main(String[] args) {
int[] arr={2,3,5,8};
//调用自定义的哈夫曼树方法，生成哈夫曼树
hafmantree(arr);
}
/**
* ,构造哈夫曼数方法
*
* @param arry
*/
public static void hafmantree(int[] arry) {
//创建集合用于存放节点值
List<Node> nlis = new ArrayList<Node>();
//遍历集合
for (int value : arry) {
//将每个数组元素看作Node节点对象，并存入list集合内
nlis.add(new Node(value));
}
/*
由于集合中存入的是一个个的Node对象，而Node对象已经被我们声明成了按照从小到大的可排序对象。
所以这里我们为可以通过Collections工具类中的sort方法进行排序
*/
//循环条件：只有一个节点，即最终根节点
while (nlis.size() > 1) {
Collections.sort(nlis);
//查看集合中还未被使用的节点
System.out.println(nlis);
//到了这里说明集合中的所有节点（权值）都是按照从小到大的顺序
//获取最小的节点值（二叉树左节点）:子节点
Node lileft = nlis.get(0);
//获取第2小的节点值（二叉树右节点）：子节点
Node lireght = nlis.get(1);
/*创建新的Node节点对象（二叉树）:
此节点对象是最小的两个节点之和所生成的最新的节点。三个节点可以看成一个二叉树，即：
根节点(insternode对象)、左子节点(lileft.value)、右子节点(lireght.value)
*/
Node insternode = new Node(lileft.value + lireght.value);
//此二叉树的左节点
insternode.left = lileft;
//此二叉树的右节点
insternode.right = lireght;
//删除已经被处理过的节点
nlis.remove(lileft);
nlis.remove(lireght);
//将最新的节点加入到list集合中
nlis.add(insternode);
//重新对最新的list数组进行排序
Collections.sort(nlis);
}
//查看最终根节点
System.out.println(nlis);
}
}
/**
* ,构造哈夫曼数节点类,
* 此类也可以看成一个二叉树：根节点(Node对象)、左节子点(left)、右字节点(right)
* 实现Comparable接口：说明此类是可通过Collections工具类排序的，
*/
class Node implements Comparable<Node> {
int value; //每个节点的值（权值）
Node left; //每个二叉树的左指向节点
Node right; //每个二叉树的右指向节点
//构造方法，这里只需要初始化value实例变量，用于对象的赋值，而 left 与 right 本身就是此对象，可直接用于value赋值
public Node(int value) {
this.value = value;
}
@Override
public String toString() {
return "Node{" +
"value=" + value +
'}';
}
//支持从小到大排序
@Override
public int compareTo(Node o) {
return this.value - o.value;
}
}

复制代码

结果：
[img=45%,45%/]https://img2022.cnblogs.com/blog/2291187/202211/2291187-20221120132248314-1579160233.png[/img]3.构建哈夫曼编码

这里是对一段字符串进行哈夫曼编码，所以需要先处理字符串
在哈夫曼树的基础上，规定了路径编码。
遍历已经创建好了的哈夫曼树，从它的根节点遍历次树到叶子节点，左子路径编码：0 、右子路径编码：1

import java.util.*;
/**
* 构造哈夫曼数+生成哈夫曼编码,编程实现。
*/
public class test1 {
public static void main(String[] args) {
//需要转换为哈夫曼编码的字符串
String valus="asdsgddbhj ,sjsh";
//将字符串存以node对象存入list集合中
List<Node> list = ListAndNode(valus);
//生成哈夫曼树
Node node = HFMTree(list);
//得到哈夫曼编码
HFMTable(node,"",andindex);
System.out.println(yezijied); //{32=1010, 97=1011, 98=1100, 115=01, 100=111, 103=1101, 104=001, 106=100, 44=000}
}
/*
第四步：
创建哈夫曼编码表：将叶子节点以0、1表示。0===》向左子节点走。1===》向右子节点走
yezijied:存放叶子节点对应的哈夫曼编码。此集合作业与全局
andindex：拼接编码。(拼接对应的0或1，形参最终的哈夫曼编码)
*/
static Map<Byte,String> yezijied=new HashMap<>();
static StringBuilder andindex=new StringBuilder();
/**
*
* @param node：节点
* @param index：路径表示：左路径为0.右路劲为1
* @param sub：拼接路径，使其成为对应叶子节点的哈夫曼码
*/
public static void HFMTable(Node node,String index,StringBuilder sub){
//
StringBuilder gitindex=new StringBuilder(sub);
//拼接路径
gitindex.append(index);
//如果节点为空就不需要处理
if (node!=null) {
//如果当前节点不是叶子节点
if (node.value == null) {
//如果节点不为空就递归其左边节点。并设置向左为0
HFMTable(node.left, "0", gitindex);
//如果节点不为空就递归其右边节点。并设置向右为1
HFMTable(node.right, "1", gitindex);
} else {
//为叶子节点就将其存入map集合中
yezijied.put(node.value, gitindex.toString());
}
}
}
/*
第三步：
@param nodes:已经存入list集合中的Node节点
创建字符串的哈夫曼树结构
*/
public static Node HFMTree(List<Node> nodes){
//循环条件：节点数必须大于1.如果等于1就是一个节点(根节点),没有分支
while (nodes.size()>1){
//排序list集合，根据权值(节点个数)从小到大排序
Collections.sort(nodes);
/*
创建一个二叉树：
feiyezijied:根节点
nodeleft：左子节点
noderight：右子节点
*/
//得到权值最小的两个节点.这两个节点分别可看作左右两个子节点
Node nodeleft = nodes.get(0);
Node noderight = nodes.get(1);
//创建新的Node对象：这可以想象为两个叶子节点生成的根节点，
// 由于哈夫曼数的原理，需要编码的值是叶子节点，而叶子节点上的父节点只是通过叶子节点虚拟创建的节点，
// 是为了形成一整颗完整的树。所以它是没有字符串原始值，，其可用两个字节的权值之和标记
Node feiyezijied=new Node(null,nodeleft.quanzhi+noderight.quanzhi);
//Node对象的左字节点
feiyezijied.left=nodeleft;
//Node对象的右字节点
feiyezijied.right=noderight;
//删除原集合中的以使用的节点对象.即上面已经每次获得的集合中两个最小的节点
nodes.remove(nodeleft);
nodes.remove(noderight);
//将新创建的Node节点加入list集合中
nodes.add(feiyezijied);
//重新对list集合排序
Collections.sort(nodes);
}
//返回最终根节点
return nodes.get(0);
}
/*
第二步：
@param valus:传入需要编码的字符串，将其变成节点
将需要编码的字符串，每个原始值(ASCIIM码)以节点(Node)对象形式传入list集合中。
而节点对象Node初始化了value与quanzhi，所以节点对象是包括这两个值，所以将每个节点对象当作一个map.
设k=value、v=quanzhi
*/
public static List<Node> ListAndNode(String valus){
//将字符对象存入byte数组。
byte[] bytes = valus.getBytes();
//创建List集合
List<Node> nodes=new ArrayList<>();
//创建Map集合
Map<Byte,Integer> node=new HashMap<>();
//遍历bytes数组，得到每个字符串的原始值
for (byte by:bytes){
//先试着通过传入的第一个k获取v
Integer index = node.get(by);
//如果map集合中此原始值对应的个数还没有
if (index==null){
node.put(by,1);
}else {
node.put(by,index+1);
}
}
//遍历map集合，并将每次遍历的元素，以Node对象的形式存入list集合
for (Map.Entry<Byte,Integer> n:node.entrySet()){
nodes.add(new Node(n.getKey(),n.getValue()));
}
//最后返回此list集合
return nodes;
}
}
/*
第一步：
节点类:其本身可可看作一个概念性的二叉树
Node对象本身可看作是一个二叉树的根节点
实现Comparable接口：泛型规定此接口作用与此Node节点，说明此类是可排序的，通过' Collections.sort()'
*/
class Node implements Comparable<Node>{
Byte value; //原始值：字符本身的ASCIIM码。因为一段字符串中有许多相同的字符，但相同字符却对应这一个ASCIIM码
int quanzhi; //此字符value在一段字符串中出现的次数
Node left; //Node对象看作是二叉树的根节点，那么这就是此二叉树的左子节点
Node right; //Node对象看作是二叉树的根节点，那么这就是此二叉树的右边子节点
//构造器初始化 value 、quanzhi。
public Node(Byte value, int quanzhi) {
this.value = value;
this.quanzhi = quanzhi;
}
//重写toString：因为我们需要拿到这两个值
@Override
public String toString() {
return "Node{" +
"value=" + value +
", quanzhi=" + quanzhi +
'}';
}
//实现Comparable接口中的方法：手动设置排序规则
@Override
public int compareTo(Node o) {
//设置为通过权值从小到大排序
return this.quanzhi-o.quanzhi;
}
//前序遍历
public void qxbl(){
//先输出当前节点，也就是根节点
System.out.println(this);
//如果左子节点不是null节点，就递归遍历输出左子节点.null表示不是叶子节点
if (this.left!=null){
this.left.qxbl();
}
//同样递归右子节点
if (this.right!=null){
this.right.qxbl();
}
}
}

复制代码

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

		自动登录	找回密码
密码			立即注册

贪心算法-构造哈夫曼数及生成哈夫曼编码,编程实现

0 个回复

快速回复

楼主热帖

标签云