Linux shell编程学习笔记80:gzip下令——让文件瘦身

打印 上一主题 下一主题

主题 790|帖子 790|积分 2372

0 引言

Linux shell编程学习笔记76:tar下令——快照 & 备份(上)-CSDN博客
Linux shell编程学习笔记77:tar下令——快照 & 备份(下)_linux 系统快照-CSDN博客 
Linux shell编程学习笔记78:cpio下令——文件和目录归档工具(上)-CSDN博客
Linux shell编程学习笔记79:cpio下令——文件和目录归档工具(下)-CSDN博客
1 gzip 的功能,资助信息,格式,选项和参数阐明

1.1 gzip 的功能

gzip 下令是 Linux 中盛行的压缩工具,用于减小文件巨细,同时保留其原始内容。它是 GNU Core Utilities 包的一部门,几乎在所有 Linux 发行版上都可用。 
1.2 gzip 的资助信息

我们可以使用 gzip -h 下令获取资助信息。
1.2.1 bash中的gzip资助信息

  1. [purpleendurer @ bash ~] gzip
  2. gzip: compressed data not written to a terminal. Use -f to force compression.
  3. For help, type: gzip -h
  4. [purpleendurer @ bash ~] gzip -h
  5. Usage: gzip [OPTION]... [FILE]...
  6. Compress or uncompress FILEs (by default, compress FILES in-place).
  7. Mandatory arguments to long options are mandatory for short options too.
  8.   -c, --stdout      write on standard output, keep original files unchanged
  9.   -d, --decompress  decompress
  10.   -f, --force       force overwrite of output file and compress links
  11.   -h, --help        give this help
  12.   -l, --list        list compressed file contents
  13.   -L, --license     display software license
  14.   -n, --no-name     do not save or restore the original name and time stamp
  15.   -N, --name        save or restore the original name and time stamp
  16.   -q, --quiet       suppress all warnings
  17.   -r, --recursive   operate recursively on directories
  18.   -S, --suffix=SUF  use suffix SUF on compressed files
  19.   -t, --test        test compressed file integrity
  20.   -v, --verbose     verbose mode
  21.   -V, --version     display version number
  22.   -1, --fast        compress faster
  23.   -9, --best        compress better
  24.     --rsyncable   Make rsync-friendly archive
  25. With no FILE, or when FILE is -, read standard input.
  26. Report bugs to <>.
  27. [purpleendurer @ bash ~]

 1.2.2 银河麒麟(kylin)系统中的gzip资助信息

  1. [purpleendurer @ kylin ~] gzip -h
  2. Usage: gzip [OPTION]... [FILE]...
  3. Compress or uncompress FILEs (by default, compress FILES in-place).
  4. Mandatory arguments to long options are mandatory for short options too.
  5.   -c, --stdout      write on standard output, keep original files unchanged
  6.   -d, --decompress  decompress
  7.   -f, --force       force overwrite of output file and compress links
  8.   -h, --help        give this help
  9.   -k, --keep        keep (don't delete) input files
  10.   -l, --list        list compressed file contents
  11.   -L, --license     display software license
  12.   -n, --no-name     do not save or restore the original name and time stamp
  13.   -N, --name        save or restore the original name and time stamp
  14.   -q, --quiet       suppress all warnings
  15.   -r, --recursive   operate recursively on directories
  16.   -S, --suffix=SUF  use suffix SUF on compressed files
  17.   -t, --test        test compressed file integrity
  18.   -v, --verbose     verbose mode
  19.   -V, --version     display version number
  20.   -1, --fast        compress faster
  21.   -9, --best        compress better
  22.   --rsyncable       Make rsync-friendly archive
  23. With no FILE, or when FILE is -, read standard input.
  24. Report bugs to <>.
  25. [purpleendurer @ kylin ~]

1.3 gzip 的下令格式

   gzip [选项]... [文件]...
  1.4 gzip 的选项和参数阐明

1.4.1 gzip的选项

选项阐明备注-c, --stdout写入标准输出,保持原始文件稳定-d, --decompress解压缩-f, --force强制覆盖输出文件并压缩链接-h, --help提供此资助信息-k, --keep保留(不删除)输入文件 不是所有版本的gzip都支持此参数
-l, --list列出压缩文件内容-L, --license体现软件许可证-n, --no-name不生存或恢复原始名称和时间戳-N, --name生存或恢复原始名称和时间戳-q, --quiet克制所有告诫-r、--recursive对目录递归操作-S, --suffix=SUF在压缩文件上使用后缀 SUF-t, --test测试压缩文件的完备性发起同时指定-v选项-v, --verbose详细模式,体现详细的压缩或解压缩过程-V、--version体现版本号-1, --fast压缩速度更快-9, --best压缩得更好--rsyncable制作 rsync 友爱的存档 1.4.2 gzip的参数

2 gzip使用实例

2.1 创建演示文件和目录

我们使用 echo 下令和输出重定向创建文件f1.txt 和 f2.txt,使用mkdir下令创建目录d1,再使用 echo 下令和输出重定向在目录d1下面创建文件fa.txt 和 fb.txt
  1. [purpleendurer @ bash ~ ] echo "f1" > f1.txt
  2. [purpleendurer @ bash ~ ] echo "f2" > f2.txt
  3. [purpleendurer @ bash ~ ] mkdir d1
  4. [purpleendurer @ bash ~ ] echo "d1fa" > d1/fa.txt
  5. [purpleendurer @ bash ~ ] echo "d1fb" > d1/fb.txt
  6. [purpleendurer @ bash ~ ] ls -R
  7. .:
  8. Code  d1  f1.txt  f2.txt
  9. ./Code:
  10. ./d1:
  11. fa.txt  fb.txt
  12. [purpleendurer @ bash ~ ]
2.2 压缩单个文件

2.2.1 压缩单个文件后删除源文件  

例如:使用gzip压缩当前目录下文件f1.txt的下令 :gzip f1.txt 
  1. [purpleendurer @ bash ~ ] ls
  2. Code  d1  f1.txt  f2.txt
  3. [purpleendurer @ bash ~ ] gzip f1.txt
  4. [purpleendurer @ bash ~ ] ls
  5. Code  d1  f1.txt.gz  f2.txt
  6. [purpleendurer @ bash ~ ]
执行压缩下令后,我们会发现在当前目录下,被压缩的源文件f1.txt不见了,多了一个压缩后的目标文件 f1.txt.gz。
注意:在默认情况下,gzip压缩指定的文件,并为它加上 .gz 扩展名。源文件会被删除。 
2.2.2 压缩单个文件后保留源文件  

如果我们使用的gzip支持-k 选项,那么可以使用 -k 选项,下令为 :
   gzip -k f2.txt 
  如果我们使用的gzip不支持-k 选项,那么可以使用-c选项结合输出重定向来操作,下令为:
   gzip -c f2.txt > f2.txt.gz
  1. [purpleendurer @ bash ~ ] ls
  2. Code  d1  f1.txt.gz  f2.txt
  3. [purpleendurer @ bash ~ ] gzip -k f2.txt
  4. gzip: invalid option -- 'k'
  5. Try `gzip --help' for more information.
  6. [purpleendurer @ bash ~ ] gzip -c f2.txt > f2.txt.gz
  7. gzip: f2.txt : No such file or directory
  8. [purpleendurer @ bash ~ ] ls
  9. Code  d1  f1.txt.gz  f2.txt  f2.txt.gz
  10. [purpleendurer @ bash ~ ]

在上面的操作中,我们先尝试了下令: gzip -k f2.txt ,但是很不幸的是,我们使用的gzip不支持-k选项。
接着我们尝试了下令:gzip -c f2.txt > f2.txt.gz,虽然我们收到了出错提示信息:
   gzip: f2.txt : No such file or directory
   gzip  < f1.txt > f2.txt.gz
  1. [purpleendurer @ bash ~ ] ls
  2. Code  d1  f1.txt  f2.txt
  3. [purpleendurer @ bash ~ ] gzip  < f1.txt > f2.txt.gz
  4. [purpleendurer @ bash ~ ] ls
  5. Code  d1  f1.txt  f2.txt  f2.txt.gz
  6. [purpleendurer @ bash ~ ] 

2.3 压缩多个文件

压缩当前目录下的文件f1.txt f2.txt,下令为:
   gzip f1.txt f2.txt
  1. [purpleendurer @ bash ~ ] ls
  2. Code  d1  f1.txt  f2.txt  f2.txt.gz
  3. [purpleendurer @ bash ~ ] gzip f1.txt f2.txt
  4. gzip: f2.txt.gz already exists; do you wish to overwrite (y or n)? y
  5. [purpleendurer @ bash ~ ] ls
  6. Code  d1  f1.txt.gz  f2.txt.gz
  7. [purpleendurer @ bash ~ ]

2.4 递归压缩目录树下的文件

为了实现递归压缩,我们要指定 -r 选项。
  1. [purpleendurer @ bash ~ ] mkdir d1/d2
  2. [purpleendurer @ bash ~ ] echo "d2fc" > d1/d2/fc.txt
  3. [purpleendurer @ bash ~ ] echo "d2fd" > d1/d2/fd.txt
  4. [purpleendurer @ bash ~ ] ls -R
  5. .:
  6. Code  d1  f1.txt  f2.txt
  7. ./Code:
  8. ./d1:
  9. d2  fa.txt  fb.txt
  10. ./d1/d2:
  11. fc.txt  fd.txt
  12. [purpleendurer @ bash ~ ]

  1. [purpleendurer @ bash ~ ] ls -R
  2. .:
  3. Code  d1  f1.txt  f2.txt
  4. ./Code:
  5. ./d1:
  6. d2  fa.txt  fb.txt
  7. ./d1/d2:
  8. fc.txt  fd.txt
  9. [purpleendurer @ bash ~ ] gzip -rv d1
  10. d1/d2/fd.txt:   -40.0% -- replaced with d1/d2/fd.txt.gz
  11. d1/d2/fc.txt:   -40.0% -- replaced with d1/d2/fc.txt.gz
  12. d1/fb.txt:      -40.0% -- replaced with d1/fb.txt.gz
  13. d1/fa.txt:      -40.0% -- replaced with d1/fa.txt.gz
  14. [purpleendurer @ bash ~ ] ls -R
  15. .:
  16. Code  d1  f1.txt  f2.txt
  17. ./Code:
  18. ./d1:
  19. d2  fa.txt.gz  fb.txt.gz
  20. ./d1/d2:
  21. fc.txt.gz  fd.txt.gz
  22. [purpleendurer @ bash ~ ]

2.4 指定压缩速度

1 是最快的压缩,压缩率最低
9 是最慢的压缩,压缩率最高
默认是 6
2.4.1 汉字

  1. [purpleendurer @ bash ~ ] echo "LZ77 的基本原理:LZ77 以经常出现的字母组合(或较长的字符串)构建字典中的数据项,并且使用较短的数字(或符号)编码来代替比较复杂的数据 项。数据压缩时,将从待压缩数据中读入的源数据与字典中的数据项进行匹配,从中检索出相应的代码并输出。从而实现数据的压缩。" > f3.txt
  2. [purpleendurer @ bash ~ ] gzip -1 -cv < f3.txt > f3-1.gz
  3. 29.6%
  4. [purpleendurer @ bash ~ ] gzip -4 -cv < f3.txt > f3-4.gz
  5. 29.6%
  6. [purpleendurer @ bash ~ ] gzip -9 -cv < f3.txt > f3-9.gz
  7. 29.6%
  8. [purpleendurer @ bash ~ ] gzip -cv < f3.txt > f3-9.gz
  9. 29.6%
  10. [purpleendurer @ bash ~ ]

我们先把一段汉字存放在文件 f3.txt中,然后分别指定压缩速度 1、4、9和默认(6)来举行压缩。
2.4.2 英文

  1. [purpleendurer @ bash ~ ] echo "I, you, he, she, it, we, they,be, have, do, go, make, see, take, get, give,person, time, day, year, way, man, woman, child, government, company,good, bad, big, little, new, old, happy, sad, beautiful, ugly,very, really, so, too, then, now, well, just, also, still,a, an, the,in, on, at, with, for, about, from, over, under, between,and, but, or, so, because, if, when, while, although, before, after,one, two, three, four, five, ten, hundred, thousand, million,hello, goodbye, please, thank you, sorry, excuse me, yes, no,I, you, he, she, it, we, they,be, have, do, go, make, see, take, get, give,person, time, day, year, way, man, woman, child, government, company,good, bad, big, little, new, old, happy, sad, beautiful, ugly,very, really, so, too, then, now, well, just, also, still,a, an, the,in, on, at, with, for, about, from, over, under, between,and, but, or, so, because, if, when, while, although, before, after,one, two, three, four, five, ten, hundred, thousand, million,hello, goodbye, please, thank you, sorry, excuse me, yes, no" > f4.txt
  2. [purpleendurer @ bash ~ ] gzip -1 -cv < f4.txt > f4-1.gz
  3. 70.7%
  4. [purpleendurer @ bash ~ ] gzip -4 -cv < f4.txt > f4-4.gz
  5. 71.0%
  6. [purpleendurer @ bash ~ ] gzip -9 -cv < f4.txt > f4-9.gz
  7. 71.0%
  8. [purpleendurer @ bash ~ ] gzip -cv < f4.txt > f4-9.gz
  9. 71.0%
  10. [purpleendurer @ bash ~ ]

我们先把常用英文单词存放在文件 f4.txt中,然后分别指定压缩速度 1、4、9和默认(6)来举行压缩。
 2.5 测试压缩文件的完备性

我们可以使用选项-t或 --test来测试压缩文件的完备性。
  1. [purpleendurer @ bash ~ ] gzip -cv < f3.txt > f3.txt.gz
  2. 29.6%
  3. [purpleendurer @ bash ~ ] gzip -t f3.txt.gz
  4. [purpleendurer @ bash ~ ] gzip -tv f3.txt.gz
  5. f3.txt.gz:       OK
  6. [purpleendurer @ bash ~ ]

可以看到, 执行下令:gzip -t f3.txt.gz 没反馈信息。
执行下令 gzip -tv f3.txt.gz 才看到反馈信息:
   f3.txt.gz:       OK
2.6 查察压缩文件的详细信息

我们可以指定 -l 选项可以查察 .gz 文件的详细信息。
  1. [purpleendurer @ bash ~ ] gzip -l f3.txt.gz
  2.          compressed        uncompressed  ratio uncompressed_name
  3.                 279                 371  29.6% f3.txt
  4. [purpleendurer @ bash ~ ]
2.7 解压文件

我们可以使用选项 -d 或--decompress 来对压缩文件举行 解压缩。
例如,对压缩文件 f3.txt.gz 举行 解压缩
  1. [purpleendurer @ bash ~ ] ls
  2. Code  f3-1.gz  f3-4.gz  f3-9.gz  f3.txt
  3. [purpleendurer @ bash ~ ] gzip -c < f3.txt >  f3.txt.gz
  4. [purpleendurer @ bash ~ ] ls
  5. Code  f3-1.gz  f3-4.gz  f3-9.gz  f3.txt  f3.txt.gz
  6. [purpleendurer @ bash ~ ] gzip -dv f3.txt.gz
  7. gzip: f3.txt already exists; do you wish to overwrite (y or n)? n
  8.         not overwritten
  9. [purpleendurer @ bash ~ ] gzip -dfv f3.txt.gz
  10. f3.txt.gz:       29.6% -- replaced with f3.txt
  11. [purpleendurer @ bash ~ ] ls
  12. Code  f3-1.gz  f3-4.gz  f3-9.gz  f3.txt
  13. [purpleendurer @ bash ~ ]

我们执行下令gzip -dv f3.txt.gz时,由于当前目录中存在文件f3.txt,会要求我们确定是否覆盖原有文件:
   gzip: f3.txt already exists; do you wish to overwrite (y or n)? 
           not overwritten
如果我们不想吸收和处理是否覆盖原有文件的信息,我们可以使用 -f选项强制覆盖原有文件。
所以我们执行下令 gzip -dfv f3.txt.gz 时 会直接覆盖原有文件f3.txt:
   f3.txt.gz:       29.6% -- replaced with f3.txt 
  2.8 查察版本信息

2.8.1 测试用的bash中的gzip版本信息

  1. [purpleendurer @ bash ~ ] gzip -V
  2. gzip 1.5
  3. Copyright (C) 2007, 2010, 2011 Free Software Foundation, Inc.
  4. Copyright (C) 1993 Jean-loup Gailly.
  5. This is free software.  You may redistribute copies of it under the terms of
  6. the GNU General Public License <>.
  7. There is NO WARRANTY, to the extent permitted by law.
  8. Written by Jean-loup Gailly.
  9. [purpleendurer @ bash ~ ]

2.8.2 银河麒麟(kylin)系统中的gzip版本信息

  1. [purpleendurer @ kylin ~] gzip -v
  2. gzip: compressed data not written to a terminal. Use -f to force compression.
  3. For help, type: gzip -h
  4. [purpleendurer @ kylin ~] gzip -V
  5. gzip 1.6
  6. Copyright (C) 2007, 2010, 2011 Free Software Foundation, Inc.
  7. Copyright (C) 1993 Jean-loup Gailly.
  8. This is free software.  You may redistribute copies of it under the terms of
  9. the GNU General Public License <>.
  10. There is NO WARRANTY, to the extent permitted by law.
  11. Written by Jean-loup Gailly.
  12. [purpleendurer @ kylin ~]

2.9 查察软件许可证信息

我们可以使用-L 或 --license 选项 查察软件许可证信息。
2.9.1 测试用的bash中的gzip软件许可证信息

  1. [purpleendurer @ bash ~ ] gzip -L
  2. gzip 1.5
  3. Copyright (C) 2007, 2010, 2011 Free Software Foundation, Inc.
  4. Copyright (C) 1993 Jean-loup Gailly.
  5. This is free software.  You may redistribute copies of it under the terms of
  6. the GNU General Public License <>.
  7. There is NO WARRANTY, to the extent permitted by law.
  8. [purpleendurer @ bash ~ ]

  1. [purpleendurer @ bash ~ ] gzip -VL
  2. gzip 1.5
  3. Copyright (C) 2007, 2010, 2011 Free Software Foundation, Inc.
  4. Copyright (C) 1993 Jean-loup Gailly.
  5. This is free software.  You may redistribute copies of it under the terms of
  6. the GNU General Public License <>.
  7. There is NO WARRANTY, to the extent permitted by law.
  8. Written by Jean-loup Gailly.
  9. [purpleendurer @ bash ~ ]
2.9.2 银河麒麟(kylin)系统中的gzipgzip软件许可证信息

  1. [purpleendurer @ kylin ~] gzip -L
  2. gzip 1.6
  3. Copyright (C) 2007, 2010, 2011 Free Software Foundation, Inc.
  4. Copyright (C) 1993 Jean-loup Gailly.
  5. This is free software.  You may redistribute copies of it under the terms of
  6. the GNU General Public License <>.
  7. There is NO WARRANTY, to the extent permitted by law.
  8. [purpleendurer @ kylin ~]

3  LZ77编码

gzip 使用 LZ77  编码来压缩息争压文件。
LZ 编码由以色列研究者 Jacob Ziv 和 Abraham Lempel 提出,是无损压缩的焦点头脑。LZ 是一个系列的算法,而其中最基本的就是两人在 1977年所发表的论文《A Universal Algorithm for Sequential Compression》 中提出的 LZ77 算法。
LZ77 的基本原理:LZ77 以常常出现的字母组合(或较长的字符串)构建字典中的数据项,并且使用较短的数字(或符号)编码来取代比较复杂的数据项。数据压缩时,将从待压缩数据中读入的源数据与字典中的数据项举行匹配,从中检索出相应的代码并输出。从而实现数据的压缩。
LZ77 编码是一种基于字典及滑动窗口的无损压缩技术,广泛应用于通信传输。


使用道具 举报

0 个回复



您需要登录后才可以回帖 登录 or 立即注册





快速回复 返回顶部 返回列表