一文搞清UNIX/Linux与Windows文件换行符格式差异

打印 上一主题 下一主题

主题 801|帖子 801|积分 2403


  • 当一个文件在Windows和Linux上交替操作后,经常遇到一些莫名其妙的问题,如shell脚本无法执行,找不到shell脚本等问题,本文j谨就这一问题做一总结,供各位参考;
  • 本博客地址,https://blog.csdn.net/qxhgd,欢迎各位关注,转发请注明出处。
  格式差异



  • 换行符是行尾 (EOL),是一个特殊的字符或字符序列,表示一行文本的结尾和新行的开头;
  • 表示换行符的实际代码因操作系统而异:
    – Microsoft Windows,DOS(MS-DOS,PC DOS等)使用CR + LF;
    – Unix和类Unix系统使用,包括Linux,OS X,FreeBSD等使用LF;
    – MAC系统里,使用CR;
  • CR即ASCII码的0x0D(\r),LF为ASCII码的0x0A(\n),DOS下使用(\r\n),类Unix系统下使用(\n),DOS系统下的’\r’在类Unix系统下会被显示为 ^M。
后文仅以test-dos.sh文件为例来说明,具体内容如下:
  1. #!/bin/bash
  2. echo "Hello World !"
复制代码
格式影响

直观影响



  • Unix/Mac系统下的文件在Windows里打开的话,所有文字会变成一行(由于Windows下编辑器的处理,这种情况一般不会发生);
  • 而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号;
功能影响



  • 在windows上编写的shell、python等脚本在Linux上⽆法正常的执⾏,会有 ^M 相关提⽰:
  1. [qxhgd@localhost crlf]$ ./test-dos.sh
  2. -bash: ./test.sh: /bin/bash^M: bad interpreter: No such file or directory
复制代码


  • 如果在make编译的时候,执行mksh(一个shell文件)可能会有类似下面的提示:
  1. make[3]: ./mksh: Command not found
复制代码
格式查看

Windows下查看



  • 利用编辑器,如Visual Studio Code、UltraEdit、Notepad2等软件,如在状态栏显示为CR+LF则为Windows格式,如果显示为LF则为Linux格式:

  • 利用支持扩展搜索的编辑器,如Notepad++,查找\r\n:

Linux下查看



  • cat命令
    显示^M:
  1. [qxhgd@localhost crlf]$ cat -v test-dos.sh
  2. #!/bin/bash^M
  3. echo "Hello World !"^M
复制代码
显示Tab:
  1. [qxhgd@localhost crlf]$ cat -T test-dos.sh
  2. #!/bin/bash
  3. ^Iecho "Hello World !"
复制代码


  • od命令
    od可以单独使用:
  1. [qxhgd@localhost crlf]$ od -c test-dos.sh
  2. 0000000   #   !   /   b   i   n   /   b   a   s   h  \r  \n   e   c   h
  3. 0000020   o       "   H   e   l   l   o       W   o   r   l   d       !
  4. 0000040   "
  5. 0000041
复制代码
也可以和cat配合使用:
  1. cat test-dos.sh| od -c
复制代码


  • hexdump命令
  1. [qxhgd@localhost crlf]$ hexdump -c test-dos.sh
  2. 0000000   #   !   /   b   i   n   /   b   a   s   h  \r  \n   e   c   h
  3. 0000010   o       "   H   e   l   l   o       W   o   r   l   d       !
  4. 0000020   "
  5. 0000021
复制代码


  • vim
状态栏下会显示:
   “test-dos.sh” [noeol][dos] 2L, 33B
  命令模式下执行set ff:
  1.   fileformat=dos
复制代码


  • gedit
– 首先使用gedit打开文件:
  1. [qxhgd@localhost crlf]$ gedit test-dos.sh
复制代码
– 搜索\r\n,如果搜索到了就表示是DOS格式:

格式修改

Windows下



  • 可以利用编辑器修改,如Visual Studio Code,点击状态栏右下方的CRLF,选择“行尾序列”可修改为LF的格式;
  • 有的编辑器,如Notepad2,有Line Endings可供选择:

  • 利用支持扩展搜索的编辑器,如Notepad++,可将\r\n替换掉:

Linux下

利用特殊工具转换



  • vim
    vim命令模式下,执行set ff=unix或set fileformat=unix即可将DOS格式转换为unix格式;
  • dos2unix
    需要额外用命令安装,一般的Linux系统不带的;unix2dos与dos2unix作用正相反。
  1. [qxhgd@localhost crlf]$ dos2unix test-dos.sh
  2. dos2unix: converting file test-dos.sh to Unix format ...
  3. [qxhgd@localhost crlf]$ dos2unix -n test-dos.sh test-unix.sh
  4. dos2unix: converting file test-dos.sh to file test-unix.sh in Unix format ...
复制代码


  • tofrodos
    这一组一共两个命令,todos和fromdos,fromdos用来将dos转换成unix格式,todos是用于将unix转换成dos格式的,使用例子如下:
  1. [qxhgd@localhost crlf]$ fromdos test-dos.sh
复制代码
利用文本处理工具



  • sed
– 转换一个文件:
  1. sed ‘s/^M//’ test-dos.sh> test-unix.sh
复制代码
– 转换多个文件:
  1. find ./ -type f print0 | xargs -0 sed -i 's/^M$//'
复制代码


  • vi
   – 1、vi test-dos.sh
– 2、:%s/^M//g或:%s/\r//g
– 3、esc退出 :wq保存退出
  其中^M 必须是同时按 Ctrl+V+M(按住Ctrl键,然后依次V、M键)或依次按Ctrl + V然后Ctrl + M,表示回车。


  • tr
  1. tr -d "\015" test-dos.sh                  
  2. cat test-dos.sh|tr -d ‘/r' > test-unix.sh
  3. tr -d '\r' < test-dos.sh > test-unix.sh
复制代码


  • perl
  1. cat test-dos.sh | perl -pe ‘~s/\r//g’ > test-unix.sh
  2. perl -p -e 's/\r//g' test-dos.sh> test-unix.sh
  3. perl -pi -e 's/\r\n/\n/g' test-dos.sh
复制代码
如本文对你有些许帮助,欢迎大佬加关注、评论、点赞,有关必回关

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

千千梦丶琪

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表