换行符引起的脚本执行错误

问题

当我们使用 Windows 桌面下的编辑器编写一个 Shell 文件时,很容易将文件使用的换行符保存为 dos 格式。如果将文件上传到 Linux 服务器执行时,可能会遇到下面的错误。这是因为

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
# 显示一个简单的shell文件
$ cat dosnewline.sh
#!/bin/sh

echo "This is a file with dos newline"


# 该文件使用了 dos 格式的换行符
$ od -bc dosnewline.sh
0000000 043 041 057 142 151 156 057 163 150 015 012 015 012 145 143 150
# ! / b i n / s h \r \n \r \n e c h
0000020 157 040 042 124 150 151 163 040 151 163 040 141 040 146 151 154
o " T h i s i s a f i l
0000040 145 040 167 151 164 150 040 144 157 163 040 156 145 167 154 151
e w i t h d o s n e w l i
0000060 156 145 042 015 012 015 012 015 012
n e " \r \n \r \n \r \n
0000071
# 使用 sh 执行的时候就会有一个报错
$ sh dosnewline.sh
: command not found 2:
This is a file with dos newline
: command not found 4:
: command not found 5:
# 获取脚本的返回码也不是0,在一些自动化调用的场景中就会认为脚本执行失败,从而引发后续的问题
$ echo $?
127
# 退出码 127 的意思是 command not foud,对应具体的 dos 换行符所在的行

文中演示的代码,可以在我的 Github 下载。

换行符

我们通常所说的换行符在 ASCII 码表中对应下面两个字符。

十进制 十六进制 字符 编程时
10 A LF(Line feed,New Line) \n
13 D CR(Carriage return) \r

这两个字符被用作换行的标志,但是在不同操作系统中使用的不一样,具体如下:

操作系统 换行符
Unix(包括 Linux) \n
Windows \r\n
MacOS X 之前的版本 \r
MacOS X 及之后的版本 \n

为什么 Windows 中会用两个字符而其他系统使用一个字符呢?

据说很久以前,人们在使用老式电传打字机作为输入设备的年代,这种设备内部使用两个字符来另起新行。一个字符把滑动架移回首位 (称为回车),另一个字符把纸上移一行 (称为换行)。

当电子计算机问世后,由于存储器曾经非常昂贵。有些人认定没必要用两个字符来表示行尾。于是 UNIX 开发者决定他们可以用一个字符(LF)来表示行尾,Apple 开发者规定了用 (CR)来表示行尾,而 MS-DOS(以及后来的 Windows)开发人员则沿用了老式的两个字符 。

正是因为不同操作系统默认的换行符不同,导致在 Windows 下编写的文件采用了 Windows 下的换行符。而不幸的是 sh 做为 Linux 下的应用,只认识 Unix(包括 Linux)下的换行符,引发的文章开头的问题。

解决方法

解决的方法有很多,从脚本来源上说,最好我们在编辑过程中就指定使用的换行符,大多数编码常用编辑器例如 Notepadd++ 等都支持这个选项,如下图在 Notepadd++ 的右下角会显示换行符的类型。千万不要使用 Windows 自带的记事本来编写 shell 脚本,记事本是不支持调整换行符的。

除了在编写阶段注意,脚本编写完成后,还可以通过 $ sh -x hello.sh 的方式来检查脚本是否有语法错误,对于本文提供的示例来说输出结果如下,可以看到输出结果给出提示多了 \r 的字符。

1
2
3
4
5
6
7
8
9
$ sh -x dosnewline.sh 
+ $'\r'
: command not found 2:
' echo 'This is a file with dos newline
This is a file with dos newline
+ $'\r'
: command not found 4:
+ $'\r'
: command not found 5:

最后如果不小心,这样的脚本已经进入了生产环境,也还有很多的方法来进行修改。很多文章推荐使用 dos2unix 这个命令来快速修改,这个命令使用起来比较方便,但是对于一些生产环境管理严格的单位来说,这个命令未必允许在生产环境安装。

那就还可以用一般都有的 trawksed 命令来实现,下面给出具体示例。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
$ tr -d '\r' < dosnewline.sh > dosnewline.sh-tr
# 使用 od 比较两个文件,后续的脚本可类似方式比较
$ od -bc dosnewline.sh-tr
0000000 043 041 057 142 151 156 057 163 150 012 012 145 143 150 157 040
# ! / b i n / s h \n \n e c h o
0000020 042 124 150 151 163 040 151 163 040 141 040 146 151 154 145 040
" T h i s i s a f i l e
0000040 167 151 164 150 040 144 157 163 040 156 145 167 154 151 156 145
w i t h d o s n e w l i n e
0000060 042 012 012 012
" \n \n \n
0000064
$ od -bc dosnewline.sh
0000000 043 041 057 142 151 156 057 163 150 015 012 015 012 145 143 150
# ! / b i n / s h \r \n \r \n e c h
0000020 157 040 042 124 150 151 163 040 151 163 040 141 040 146 151 154
o " T h i s i s a f i l
0000040 145 040 167 151 164 150 040 144 157 163 040 156 145 167 154 151
e w i t h d o s n e w l i
0000060 156 145 042 015 012 015 012 015 012
n e " \r \n \r \n \r \n
0000071
$ awk '{ sub("\r$", ""); print }' dosnewline.sh > dosnewline.sh-awk
$ sed 's/\r//' dosnewline.sh > dosnewline.sh-sed

参考资料

  1. DOS和UNIX文本文件之间相互转换的方法
  2. SED 用于 UNIXDOS 文本格式转换
  3. How to Convert DOS line endings to Linux line endings using Vim
  4. 如何在 Unix 和 DOS 格式之间转换文本文件
  5. Shell获取退出码(返回码)
  6. Unix/Linux/Mac 与 Windows 的换行符不统一的原因/目的是什么?

cocowool

A FULL STACK DREAMER!