图 8.2. 字符串
注意每个字符末尾都有一个字符'\0'
做结束符,这里的\0
是ASCII码的八进制表示,也就是ASCII码为0的Null字符,在C语言中这种字符串也称为以零结尾的字符串(Null-terminated String)。数组元素可以通过数组名加下标的方式访问,而字符串字面值也可以像数组名一样使用,可以加下标访问其中的字符:
但是通过下标修改其中的字符却是不允许的:
- "Hello, world.\n"[0] = 'A';
这行代码会产生编译错误,说字符串字面值是只读的,不允许修改。字符串字面值还有一点和数组名类似,做右值使用时自动转换成指向首元素的指针,在我们看到printf
原型的第一个参数是指针类型,而printf("hello world")
其实就是传一个指针参数给printf
。
相当于:
str
的后四个元素没有指定,自动初始化为0,即Null字符。注意,虽然字符串字面值"Hello"
是只读的,但用它初始化的数组却是可读可写的。数组str
中保存了一串字符,以'\0'
结尾,也可以叫字符串。在本书中只要是以Null字符结尾的一串字符都叫字符串,不管是像str
这样的数组,还是像"Hello"
这样的字符串字面值。
如果用于初始化的字符串字面值比数组还长,比如:
- char str[10] = "Hello, world.\n";
则数组str
只包含字符串的前10个字符,不包含Null字符,这种情况编译器会给出警告。如果要用一个字符串字面值准确地初始化一个字符数组,最好的办法是不指定数组的长度,让编译器自己计算:
字符串字面值的长度包括Null字符在内一共15个字符,编译器会确定数组str
的长度为15。
则数组str
不包含Null字符,并且编译器不会给出警告,[C99 Rationale]说这样规定是为程序员方便,以前的很多编译器都是这样实现的,不管它有理没理,C标准既然这么规定了我们也没办法,只能自己小心了。
补充一点,函数的格式化字符串中可以用%s
表示字符串的占位符。在学字符数组以前,我们用%s
没什么意义,因为
- printf("string: %s\n", "Hello");
还不如写成
但现在字符串可以保存在一个数组里面,用%s
来打印就很有必要了:
printf
会从数组str
的开头一直打印到Null字符为止,Null字符本身是Non-printable字符,不打印。这其实是一个危险的信号:如果数组str
中没有Null字符,那么printf
函数就会访问数组越界,后果可能会很诡异:有时候打印出乱码,有时候看起来没错误,有时候引起程序崩溃。