麻花痒 发表于 2024-6-28 20:56:50

linux常用命令diff

Linux diff (diff 即 different 简写)命令用于比力文件的差异。
diff 以逐行的方式,比力文本文件的异同处。如果指定要比力目录,则diff会比力目录中相同文件名的文件,但不会比力其中子目录
diff file_1 file_2  diff 就会告诉你,这两个文件有何差异。它的体现结果不太好懂,下面我就来说明,如何读懂diff。
参数:
-<行数>:指定要体现多少行的文本。此参数必须与-c或-u参数一并使用;
-a或--text:diff预设只会逐行比力文本文件;
-b或--ignore-space-change:不查抄空格字符的不同;
-B或--ignore-blank-lines:不查抄空缺行;
-c:体现全部内容,并标出不同之处;
-C<行数>或--context<行数>:与执行“-c-<行数>”指令相同;
-d或--minimal:使用不同的演算法,以小的单位来做比力;
-D<巨集名称>或ifdef<巨集名称>:此参数的输特别式可用于前置处置惩罚器巨集;
-e或--ed:此参数的输特别式可用于ed的script文件;
-f或-forward-ed:输出的格式类似ed的script文件,但按照原来文件的顺序来体现不同处;
-H或--speed-large-files:比力大文件时,可加速速率;
-l<字符或字符串>或--ignore-matching-lines<字符或字符串>:若两个文件在某几行有所不同,而之际航同时都包罗了选项中指定的字符或字符串,则不体现这两个文件的差异;
-i或--ignore-case:不查抄大小写的不同;
-l或--paginate:将结果交由pr步伐来分页;
-n或--rcs:将比力结果以RCS的格式来体现;
-N或--new-file:在比力目录时,若文件A仅出现在某个目录中,预设会体现:Only in目录,文件A 若使用-N参数,则diff会将文件A 与一个空缺的文件比力;
-p:若比力的文件为C语言的步伐码文件时,体现差异所在的函数名称;
-P或--unidirectional-new-file:与-N类似,但只有当第二个目录包罗了第一个目录所没有的文件时,才会将这个文件与空缺的文件做比力;
-q或--brief:仅体现有无差异,不体现详细的信息;
-r或--recursive:比力子目录中的文件;
-s或--report-identical-files:若没有发现任何差异,仍然体现信息;
-S<文件>或--starting-file<文件>:在比力目录时,从指定的文件开始比力;
-t或--expand-tabs:在输出时,将tab字符展开;
-T或--initial-tab:在每行前面加上tab字符以便对齐;
-u,-U<列数>或--unified=<列数>:以归并的方式来体现文件内容的不同;
-v或--version:体现版本信息;
-w或--ignore-all-space:忽略全部的空格字符;
-W<宽度>或--width<宽度>:在使用-y参数时,指定栏宽;
-x<文件名或目录>或--exclude<文件名或目录>:不比力选项中所指定的文件或目录;
-X<文件>或--exclude-from<文件>;您可以将文件或目录类型存成文本文件,然后在=<文件>中指定此文本文件;
-y或--side-by-side:以并列的方式体现文件的异同之处;
--help:体现资助;
--left-column:在使用-y参数时,若两个文件某一行内容相同,则仅在左侧的栏位体现该行内容;
--suppress-common-lines:在使用-y参数时,仅体现不同之处。
diff 的 三种格式

由于历史缘故原由,diff 有三种格式:
正常格式(normal diff)
上下文格式(context diff)
归并格式(unified diff)
我们依次来看。
示例文件

为了便于讲解,先新建两个示例文件。
第一个文件叫做 f1,内容是每行一个 a,一共 7 行。
a
a
a
a
a
a
a
第二个文件叫做 f2,修改 f1 而成,第 4 行变成 hello,其他不变
a
a
a
hello
a
a
a
正常格式的 diff

diff命令的Normal模式,这也是diff命令的默认模式,也就是说diff两个文件的时间如果不加模式参数则是默认模式进行比力,其效果与(--normal)一样,我们举一些例子来说明Normal模式下的输出结果(前面已经说明了一种比力结果),为了直观查看两个文件的不同我在windows下面通过BeyondCompare工具列出两个文件的不同,而截图下面的黑色部分则是diff的比力输出截图。
第一个文件比第二个文件少了行的环境:
https://img-blog.csdnimg.cn/img_convert/93871d03b3234abd92932be391f26754.png
 第一个文件比第二个文件多出行的环境:
https://img-blog.csdnimg.cn/img_convert/bde95b696cc0e23bc5c22c24975637e1.png
第一个文件与第二个文件不相同的环境:
https://img-blog.csdnimg.cn/img_convert/17500c04d6c8e47cd405fd2d476793cf.png 
以上 diff 命令执行的时间没有指定额外的模式参数,以是其使用的是默认的 Normal 模式,效果与添加命令行参数 --normal 是一样的。
使用示例分析


现在对 f1 和 f2 进行比力:$ diff f1 f2
这时,diff 就会体现正常格式的结果:
4c4
  < a
  ---
  > hello
第一行:4c4  是一个提示,用来说明变更位置。4c4 分成 三个部分:前面的"4",表示 f1 的第 4 行有变化;中间的 "c" 表示变更的模式是内容改变(change),其他模式还有"增加"(a,代表addition)和"删除"(d,代表deletion);反面的"4",表示变更后变成 f2 的第 4 行。
第二行:< a  分成两个部分。< a:前面的 小于号,表示要从 f1 当中去除该行(也就是第 4 行),反面的 "a" 表示该行的内容。
第三行:--- 用来分割 f1 和 f2。
第四行:> b  类似于第二行。> b :前面的 大于号 表示 f2 增加了该行,反面的 "hello" 表示该行的内容。最早的Unix(即AT&T版本的Unix),使用的就是这种格式的diff。
上下文格式的 diff :Context 模式

上个世纪80年代初,加州大学伯克利分校推出 BSD版本的 Unix 时,以为 diff 的体现结果太简单,最好加入上下文,便于了解发生的变更。因此,推出了上下文格式的 diff。
默认环境下的模式输出结果实际上是符合盘算机的头脑方式,不太直观,以是其输出结果并不能够很好的被人明白,diff命令除了默认模式之外还提供了另外两种模式,Context 和 Unified 模式。
diff 命令应用 Context 模式只必要添加命令行参数 diff -c  即可,我们先看看两个案例文件:
https://img-blog.csdnimg.cn/img_convert/5e49a6dfef1b2d2ae4bc066f84b53a3e.png 
接下来说明这两个文件以diff  -c 方式比力的结果:
https://img-blog.csdnimg.cn/img_convert/b9c48d1883a9354d27d3872540c0ffa7.png 
使用示例分析
上下文模式 使用方法加入 c 参数(代表context):$ diff -c f1 f2
体现结果如下:
$ diff -c f1 f2
*** f1    2019-05-20 14:22:15.111801433 +0800
--- f2    2019-05-20 14:22:27.401207382 +0800
***************
*** 1,7 ****
  a
  a
  a
! a
  a
  a
  a
--- 1,7 ----
  a
  a
  a
! hello
  a
  a
  a
这个结果分成四个部分。
第一部分的两行,体现两个文件的基本环境:文件名和时间信息。
        *** f1    2019-05-20 14:22:15.111801433 +0800
        --- f2    2019-05-20 14:22:27.401207382 +0800
提示:"***" 表示变更前的文件,"---" 表示变更后的文件。
第二部分是15个星号,将文件的基本环境与变更内容分割开。
***************
第三部分体现变更前的文件,即 f1。
  *** 1,7 ****
   a
   a
   a
  !a
   a
   a
   a
这时不仅体现发生变化的第 4 行,还体现第 4 行的前面三行和反面三行,因此一共体现7行。以是,前面的"*** 1,7 ****"就表示,从第 1 行开始连续 7 行。
另外,文件内容的每一行最前面,还有一个标志位。如果为空,表示该行无变化;
如果是感叹号(!),表示该行有改动;
如果是减号(-),表示该行被删除;
如果是加号(+),表示该行为新增。
第四部分体现变更后的文件,即f2。
  --- 1,7 ----
   a
   a
   a
  !hello
   a
   a
   a
除了变更行(第4行)以外,也是上下文各体现三行,统共体现7行。
归并格式的 diff:也即 Unified 模式
如果两个文件相似度很高,那么上下文格式的 diff,将体现大量重复的内容,很浪费空间。1990年,GNU diff 率先推出了"归并格式"的 diff,将 f1 和 f2 的上下文归并在一起体现。
diff 还有一种比力方式,也即 Unified 模式,使用命令行 –u 来执行该模式的比力。其比力结果与Context模式很像,但是简化了一些输出,我们看看我们的案例文件,与上面的一样:
https://img-blog.csdnimg.cn/img_convert/ce2d95007c66abbbf4c50a66a8d4514f.png
使用diff –u 比力的结果:
 https://img-blog.csdnimg.cn/img_convert/9be64d21df71dce644b854d2a9fde9a1.png
 可以看到其比力结果与Context模式实际上差不多,只不过将比力结果归并到一起了
使用示例分析
加入u参数(代表unified):$ diff -u f1 f2
体现结果如下:
$ diff -u f1 f2
--- f1    2019-05-20 14:22:15.111801433 +0800
+++ f2    2019-05-20 14:22:27.401207382 +0800
@@ -1,7 +1,7 @@
 a
 a
 a
-a
+hello
 a
 a
 a
第一部分,也是文件的基本信息。
            --- f1    2019-05-20 14:22:15.111801433 +0800
            +++ f2    2019-05-20 14:22:27.401207382 +0800
            "---"表示变更前的文件,"+++"表示变更后的文件。
第二部分,变更的位置用两个@作为起首和结束。
            @@ -1,7 +1,7 @@
            前面的"-1,7"分成三个部分:减号表示第一个文件(即f1),"1"表示第1行,"7"表示连续7行。合在一起,就表示下面是第一个文件从第1行开始的连续7行。
            同样的,"+1,7"表示变更后,成为第二个文件从第1行开始的连续7行。
第三部分,是变更的详细内容。
   a
   a
   a
  -a
  +hello
   a
   a
   a
除了有变更的那些行以外,也是上下文各体现3行。它将两个文件的上下文,归并体现在一起,以是叫做"归并格式"。
每一行最前面的标志位,空表示无变更,减号表示第一个文件删除的行,加号表示第二个文件新增的行。
git 格式的 diff


版本管理系统git,使用的是归并格式 diff 的变体:$ git diff
体现结果如下:
diff --git a/f1 b/f1
        index 6f8a38c..3235643 100644
        --- a/f1
        +++ b/f1
        @@ -1,7 +1,7 @@
         a
         a
         a
        -a
        +hello
         a
         a
         a
第一行 表示结果为 git 格式的diff。
    diff --git a/f1 b/f1
    进行比力的是,a版本的f1(即变更前)和b版本的f1(即变更后)。
第二行 表示两个版本的 git 哈希值(index区域的6f8a38c对象,与工作目录区域的449b072对象进行比力),末了的六位数字是对象的模式(平凡文件,644权限)。
    index 6f8a38c..449b072 100644
第三行 表示进行比力的两个文件。
  --- a/f1
  +++ b/f1
"---"表示变更前的版本,"+++"表示变更后的版本。
反面的行都与官方的归并格式diff相同。
  @@ -1,7 +1,7 @@
   a
   a
   a
  -a
  +hello
   a
   a
   a
比力目录

https://img-blog.csdnimg.cn/img_convert/bf7c1823a13816f177f0939e2b3f74d7.png
使用diff可以比力两个目录,其比力格式是  diff  directory1  directory2 查看如下目录比力结果:
 
比力两个目录的时间无非是有的文件仅仅存在于某个目录中而在另一个目录中没有,如果存在同名的文件,则比力这两个文件的不同。diff比力目录的结果我们可以结合grep命令筛选出我们想要的输出,例如仅仅输出两个目录下不同的文件而忽略掉某一个目录独有另一个目录不存在的输出记录
实例1:比力两个文件


# diff log2014.log log2013.log 
3c3
< 2014-03
---
> 2013-03
8c8
< 2013-07
---
> 2013-08
11,12d10
< 2013-11
< 2013-12
上面的"3c3"和"8c8"表示log2014.log和log20143log文件在3行和第8行内容有所不同;"11,12d10"表示第一个文件比第二个文件多了第11和12行。
实例2:并排格式输出

# diff log2014.log log2013.log  -y -W 50
2013-01                 2013-01
2013-02                 2013-02
2014-03               | 2013-03
2013-04                 2013-04
2013-05                 2013-05
2013-06                 2013-06
2013-07                 2013-07
2013-07               | 2013-08
2013-09                 2013-09
2013-10                 2013-10
2013-11               <
2013-12               <
# diff log2013.log log2014.log  -y -W 50
2013-01                 2013-01
2013-02                 2013-02
2013-03               | 2014-03
2013-04                 2013-04
2013-05                 2013-05
2013-06                 2013-06
2013-07                 2013-07
2013-08               | 2013-07
2013-09                 2013-09
2013-10                 2013-10
                      > 2013-11
                      > 2013-12
说明:
"|"表示前后2个文件内容有不同
"<"表示反面文件比前面文件少了1行内容
">"表示反面文件比前面文件多了1行内容
 

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: linux常用命令diff