哈夫曼树
1.概念:
- 给定n个权值最为n个叶子的节点,构建成一颗二叉树。如果次树的带权路径长度最小,则称此二叉树为最优二叉树,也叫哈夫曼树。
- WLP:带权路径长度
- 公式:
[img=45%,45%/]https://img2022.cnblogs.com/blog/2291187/202211/2291187-20221120131450130-1355213385.png[/img]
- Wk:第k个叶子的节点权值
- Lk:根节点到第k个叶子的节点长度
例如下列二叉树:
- 给定4个叶子节点,权值分别为{2,3,5,8},可以构造出4中形状不同的二叉树,但它们的带权路径长度可能不同。
[img=45%,45%/]https://img2022.cnblogs.com/blog/2291187/202211/2291187-20221120131621096-707303050.png[/img]如上图可看出:1、最后两个树的带权路径长度相同且也是最小的,所以可看作哈夫曼树
2、权值最小的节点越靠下,越大越靠近根节点
2.构建哈夫曼树
(1)、在{2,3,5,8}这几个节点看作叶子节点(即后面没有子节点)
[img=45%,45%/]https://img2022.cnblogs.com/blog/2291187/202211/2291187-20221120131810637-1862349395.png[/img]
(2)、在这几个节点中选出权值最小和次小的两个节点。构成一个新二叉树(最小为左字节的、次小为右子节点),新二叉树的权值为这两个权值之和.
[img=35%,35%/]https://img2022.cnblogs.com/blog/2291187/202211/2291187-20221120131911264-1161635956.png[/img](3)、删除已经使用过的节点。将新创建的节点加入到还没被使用过的节点集合中,找出最小和次小的节点权值。又构成一颗新的二叉树。
[img=45%,45%/]https://img2022.cnblogs.com/blog/2291187/202211/2291187-20221120132008656-121294881.png[/img](4)、重复(2)的操作
[img=45%,45%/]https://img2022.cnblogs.com/blog/2291187/202211/2291187-20221120132100035-1281422288.png[/img]
(5)、重复上面操作:删除已使用的节点,将新的节点加入未使用节点的集合中,发现只有一个节点,其权值为18.则此哈夫曼树创建完成,根节点权值为18.
代码如下:- import java.util.ArrayList;
- import java.util.Collections;
- import java.util.List;
- /**
- * 构造哈夫曼树
- */
- public class test1 {
- public static void main(String[] args) {
- int[] arr={2,3,5,8};
- //调用自定义的哈夫曼树方法,生成哈夫曼树
- hafmantree(arr);
- }
- /**
- * ,构造哈夫曼数方法
- *
- * @param arry
- */
- public static void hafmantree(int[] arry) {
- //创建集合用于存放节点值
- List<Node> nlis = new ArrayList<Node>();
- //遍历集合
- for (int value : arry) {
- //将每个数组元素看作Node节点对象,并存入list集合内
- nlis.add(new Node(value));
- }
- /*
- 由于集合中存入的是一个个的Node对象,而Node对象已经被我们声明成了按照从小到大的可排序对象。
- 所以这里我们为可以通过Collections工具类中的sort方法进行排序
- */
- //循环条件:只有一个节点,即最终根节点
- while (nlis.size() > 1) {
- Collections.sort(nlis);
- //查看集合中还未被使用的节点
- System.out.println(nlis);
- //到了这里说明集合中的所有节点(权值)都是按照从小到大的顺序
- //获取最小的节点值(二叉树左节点):子节点
- Node lileft = nlis.get(0);
- //获取第2小的节点值(二叉树右节点):子节点
- Node lireght = nlis.get(1);
- /*创建新的Node节点对象(二叉树):
- 此节点对象是最小的两个节点之和所生成的最新的节点。三个节点可以看成一个二叉树,即:
- 根节点(insternode对象)、左子节点(lileft.value)、右子节点(lireght.value)
- */
- Node insternode = new Node(lileft.value + lireght.value);
- //此二叉树的左节点
- insternode.left = lileft;
- //此二叉树的右节点
- insternode.right = lireght;
- //删除已经被处理过的节点
- nlis.remove(lileft);
- nlis.remove(lireght);
- //将最新的节点加入到list集合中
- nlis.add(insternode);
- //重新对最新的list数组进行排序
- Collections.sort(nlis);
- }
- //查看最终根节点
- System.out.println(nlis);
- }
- }
- /**
- * ,构造哈夫曼数节点类,
- * 此类也可以看成一个二叉树:根节点(Node对象)、左节子点(left)、右字节点(right)
- * 实现Comparable接口:说明此类是可通过Collections工具类排序的,
- */
- class Node implements Comparable<Node> {
- int value; //每个节点的值(权值)
- Node left; //每个二叉树的左指向节点
- Node right; //每个二叉树的右指向节点
- //构造方法,这里只需要初始化value实例变量,用于对象的赋值,而 left 与 right 本身就是此对象,可直接用于value赋值
- public Node(int value) {
- this.value = value;
- }
- @Override
- public String toString() {
- return "Node{" +
- "value=" + value +
- '}';
- }
- //支持从小到大排序
- @Override
- public int compareTo(Node o) {
- return this.value - o.value;
- }
- }
复制代码 结果:
[img=45%,45%/]https://img2022.cnblogs.com/blog/2291187/202211/2291187-20221120132248314-1579160233.png[/img]3.构建哈夫曼编码
- 这里是对一段字符串进行哈夫曼编码,所以需要先处理字符串
- 在哈夫曼树的基础上,规定了路径编码。
- 遍历已经创建好了的哈夫曼树,从它的根节点遍历次树到叶子节点,左子路径编码:0 、右子路径编码:1
- import java.util.*;
- /**
- * 构造哈夫曼数+生成哈夫曼编码,编程实现。
- */
- public class test1 {
- public static void main(String[] args) {
- //需要转换为哈夫曼编码的字符串
- String valus="asdsgddbhj ,sjsh";
- //将字符串存以node对象存入list集合中
- List<Node> list = ListAndNode(valus);
- //生成哈夫曼树
- Node node = HFMTree(list);
- //得到哈夫曼编码
- HFMTable(node,"",andindex);
- System.out.println(yezijied); //{32=1010, 97=1011, 98=1100, 115=01, 100=111, 103=1101, 104=001, 106=100, 44=000}
- }
- /*
- 第四步:
- 创建哈夫曼编码表:将叶子节点以0、1表示。0===》向左子节点走。1===》向右子节点走
- yezijied:存放叶子节点对应的哈夫曼编码。此集合作业与全局
- andindex:拼接编码。(拼接对应的0或1,形参最终的哈夫曼编码)
- */
- static Map<Byte,String> yezijied=new HashMap<>();
- static StringBuilder andindex=new StringBuilder();
- /**
- *
- * @param node:节点
- * @param index:路径表示:左路径为0.右路劲为1
- * @param sub:拼接路径,使其成为对应叶子节点的哈夫曼码
- */
- public static void HFMTable(Node node,String index,StringBuilder sub){
- //
- StringBuilder gitindex=new StringBuilder(sub);
- //拼接路径
- gitindex.append(index);
- //如果节点为空就不需要处理
- if (node!=null) {
- //如果当前节点不是叶子节点
- if (node.value == null) {
- //如果节点不为空就递归其左边节点。并设置向左为0
- HFMTable(node.left, "0", gitindex);
- //如果节点不为空就递归其右边节点。并设置向右为1
- HFMTable(node.right, "1", gitindex);
- } else {
- //为叶子节点就将其存入map集合中
- yezijied.put(node.value, gitindex.toString());
- }
- }
- }
- /*
- 第三步:
- @param nodes:已经存入list集合中的Node节点
- 创建字符串的哈夫曼树结构
- */
- public static Node HFMTree(List<Node> nodes){
- //循环条件:节点数必须大于1.如果等于1就是一个节点(根节点),没有分支
- while (nodes.size()>1){
- //排序list集合,根据权值(节点个数)从小到大排序
- Collections.sort(nodes);
- /*
- 创建一个二叉树:
- feiyezijied:根节点
- nodeleft:左子节点
- noderight:右子节点
- */
- //得到权值最小的两个节点.这两个节点分别可看作左右两个子节点
- Node nodeleft = nodes.get(0);
- Node noderight = nodes.get(1);
- //创建新的Node对象:这可以想象为两个叶子节点生成的根节点,
- // 由于哈夫曼数的原理,需要编码的值是叶子节点,而叶子节点上的父节点只是通过叶子节点虚拟创建的节点,
- // 是为了形成一整颗完整的树。所以它是没有字符串原始值,,其可用两个字节的权值之和标记
- Node feiyezijied=new Node(null,nodeleft.quanzhi+noderight.quanzhi);
- //Node对象的左字节点
- feiyezijied.left=nodeleft;
- //Node对象的右字节点
- feiyezijied.right=noderight;
- //删除原集合中的以使用的节点对象.即上面已经每次获得的集合中两个最小的节点
- nodes.remove(nodeleft);
- nodes.remove(noderight);
- //将新创建的Node节点加入list集合中
- nodes.add(feiyezijied);
- //重新对list集合排序
- Collections.sort(nodes);
- }
- //返回最终根节点
- return nodes.get(0);
- }
- /*
- 第二步:
- @param valus:传入需要编码的字符串,将其变成节点
- 将需要编码的字符串,每个原始值(ASCIIM码)以节点(Node)对象形式传入list集合中。
- 而节点对象Node初始化了value与quanzhi,所以节点对象是包括这两个值,所以将每个节点对象当作一个map.
- 设k=value、v=quanzhi
- */
- public static List<Node> ListAndNode(String valus){
- //将字符对象存入byte数组。
- byte[] bytes = valus.getBytes();
- //创建List集合
- List<Node> nodes=new ArrayList<>();
- //创建Map集合
- Map<Byte,Integer> node=new HashMap<>();
- //遍历bytes数组,得到每个字符串的原始值
- for (byte by:bytes){
- //先试着通过传入的第一个k获取v
- Integer index = node.get(by);
- //如果map集合中此原始值对应的个数还没有
- if (index==null){
- node.put(by,1);
- }else {
- node.put(by,index+1);
- }
- }
- //遍历map集合,并将每次遍历的元素,以Node对象的形式存入list集合
- for (Map.Entry<Byte,Integer> n:node.entrySet()){
- nodes.add(new Node(n.getKey(),n.getValue()));
- }
- //最后返回此list集合
- return nodes;
- }
- }
- /*
- 第一步:
- 节点类:其本身可可看作一个概念性的二叉树
- Node对象本身可看作是一个二叉树的根节点
- 实现Comparable接口:泛型规定此接口作用与此Node节点,说明此类是可排序的,通过' Collections.sort()'
- */
- class Node implements Comparable<Node>{
- Byte value; //原始值:字符本身的ASCIIM码。因为一段字符串中有许多相同的字符,但相同字符却对应这一个ASCIIM码
- int quanzhi; //此字符value在一段字符串中出现的次数
- Node left; //Node对象看作是二叉树的根节点,那么这就是此二叉树的左子节点
- Node right; //Node对象看作是二叉树的根节点,那么这就是此二叉树的右边子节点
- //构造器初始化 value 、quanzhi。
- public Node(Byte value, int quanzhi) {
- this.value = value;
- this.quanzhi = quanzhi;
- }
- //重写toString:因为我们需要拿到这两个值
- @Override
- public String toString() {
- return "Node{" +
- "value=" + value +
- ", quanzhi=" + quanzhi +
- '}';
- }
- //实现Comparable接口中的方法:手动设置排序规则
- @Override
- public int compareTo(Node o) {
- //设置为通过权值从小到大排序
- return this.quanzhi-o.quanzhi;
- }
- //前序遍历
- public void qxbl(){
- //先输出当前节点,也就是根节点
- System.out.println(this);
- //如果左子节点不是null节点,就递归遍历输出左子节点.null表示不是叶子节点
- if (this.left!=null){
- this.left.qxbl();
- }
- //同样递归右子节点
- if (this.right!=null){
- this.right.qxbl();
- }
- }
- }
复制代码 免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |