字符数组及字符串函数
一 、课前知识提前学习
字符数组
用来存放char型数据的数组称为字符数组。字符数组的每一个存储单元存放一个字符(1个字节)。字符数组的定义、初始化和引用的规则和数值型数组规则完全相同。例如:
char s1[10]; /*定义一个名为sl的一维字符数组,包含10个元素,占据内存10个字节*/
char s2[3][4]; /*定义一个名为s2的二维字符数组,包含12个元素,也可以将其看作包含了3个一维字符数组*/
初始化方式有按初值顺序赋值和分行赋值两种。例如:
char s1[10]={‘h’, ’e’, ‘l’, ‘l’, ‘o’},s2[2][3]={{‘a’, ‘b’, ‘c’}, {‘d’, ‘e’, ‘f’}};
表示将字符逐个赋值给数组中每个元素,未赋初值的元素将初始化为空字符NULL。
当有全部初值时定义字符数组可以省略一维长度。例如:
char d[][3]={{‘ ’, ‘ ’, ‘*’}, {‘ ’, ‘*’, ‘*’}, {‘*’, ‘*’, ‘*’}};
字符数组的每一个元素都可以单独当作字符变量来引用,例如一个简单图像的输出处理过程。
int i, j;
char d[3][3]={{‘ ’, ‘ ’, ‘*’}, {‘ ’, ‘*’, ‘*’}, {‘*’, ‘*’, ‘*’}};
for(i=0; i<3; i++)
{
for(j=0; j<3; j++)
printf(“%c”, d[i][j]);
printf(“\n”);
}
字符串
字符串为双引号括起来的字符序列,例如:“Hello!”、“C Program”等。
C语言中没有提供字符串数据类型,而是使用字符数组表示并保存字符串。字符串实际上是字符数组的一个特例。由于每个字符串都以空字符('\0')结束,在声明一个存储字符串的字符数组时,必须保证字符数组的长度比字符串的长度至少多一个,用以存储字符串的结束符'\0'。
常用的以字符串作初值进行字符数组初始化的方式为:
char c[] = {“Hello”} ; 或 char c[] = “Hello”;
编译器将字符串“Hello”中的字符赋值到字符数组c中,然后追加一个'\0',从而使数组c可以作为字符串使用。初始化后,字符数组都包含6个元素,其中最后一个元素为'\0',称为字符串结束标志,其ASCII码值为0。与下面字符数组的初始化方式等价:
char c[] = {‘H’,‘e’,‘l’,‘l’,‘o’,‘\0’ } ; 或 char c[6] = {‘H’,‘e’,‘l’,‘l’,‘o’,‘\0’ } ;
但下面两种定义形式并不等价的:
char c[]={‘H’,‘e’,‘l’,‘l’,‘o’}; /*字符数组,其数组长度为5*/
char c[]={“Hello”}; /*字符数组表示的字符串,数组长度为6*/
字符数组初始化的字符串的长度应小于字符数组声明的长度时, 例如:
char c[10]={“Hello”};
系统将剩余元素都初始化为空字符(‘\0’)。
考虑一下:如果初始化字符串的长度大于所定义的字符数组长度会怎样?
只能在初始化时将字符数组初始化为字符串,不能在程序执行语句中将字符串赋值给字符数组。例如:
char str[10];
str="hello"; /*错误的赋值语句*/
如果在执行语句中需要将字符串常量赋给字符数组,应使用字符处理函数或用循环语句进行处理。
字符串的输入/输出
字符串的输入/输出可以调用scanf/printf以及gets/puts等函数实现。
(1)单字符的输入/输出
利用scanf或printf可以输入或输出字符数组中的任一字符,也可以利用循环语句完成字符的输入/输出处理(利用结束符'\0'作为循环中止的条件)。例如:
charstr[]="string output";
int i;
printf(“%c, %c”, str[0], str[6]); /*输出某指定字符*/
for(i=0; str[i]!='\0'; i++)
printf("%c",str[i]); /*循环控制输出字符串*/
(2)字符串格式化输入/输出
使用printf函数的格式控制符%s可以输出字符串。与%s对应的是字符数组的名称或字符串常量。例如:
charstr[]="string output";
printf("%s", str);
printf函数逐个读取字符串中的字符直到遇到空字符('\0')作为输出结束符为止。如果一个字符串中有多个'\0',则遇到第一个'\0'即认为字符串结束。'\0'本身作为结束符并不会被输出显示。
使用scanf以格式说明符%s输入字符串时,字符数组名不需要附加地址运算符&。scanf函数在字符串读入结束时自动在字符串末尾存储一个'\0'字符。例如:
char str[20];
scanf(“%s” ,str );
若用户输入hello后回车,hello被保存到str[0]至str[4]等数组元素,'\0'被写到str[5]中,其余元素也被填充为'\0'。
由于scanf的输入操作遇到空格中止,无法使用scanf输入一个包含空格的字符串。如上例中,用户输入字符串hello world,保存到str数组里的将只有hello。
(3)gets/puts函数输入/输出
使用puts函数一次可以输出一个字符串。 puts函数的使用方式为:puts(字符数组名); puts函数只有一个参数,即需要显示的字符串,可以是字符数组名或字符串常量。例如:
charstr[]="string output";
puts(str); /*或puts("string output");*/
若输入有空格的字符串时应使用函数gets。gets函数以回车符作为输入的结束,并存储'\0'。例如:
char str [10];
gets(str); /*可以从键盘输入string input*/
字符串输入/输出过程中需要注意:
(1)不要试图输出一个没有字符串结束符的字符数组。由于字符数组没有结束符'\0',printf和puts会在输出正确结果之后,继续遍历后续的内存单元,直到遇到'\0'为止。导致输出不确定的字符。
(2)使用scanf或gets输入字符串时,若输入字符的数目大于字符数组的长度,多出的字符则会存放在数组的合法存储空间之外,造成数组越界操作。
常用字符串处理函数
C语言中,常用字符串处理函数原型声明在<string.h>头文件中。#include<string.h>
(1)字符串复制函数
程序执行语句中不能将字符串常量或其它字符数组直接赋值给字符数组。字符串的赋值可以使用strcpy字符串复制函数。
函数调用形式:strcpy(字符数组1, 字符串2)
strcpy()将字符串2的内容复制到字符数组1中,包括结尾的字符串结束符'\0'。字符串2可以是字符串常量或是字符数组变量。例如:
char s1[10],s2[10], s3[]="Hello!";
strcpy(s1, s3); /*s1中的字符串是Hello! */
strcpy(s2, “World”); /*s2中的字符串是World*/
strcpy函数要求字符数组l的长度要大于字符串2的长度,否则将造成数组越界操作。
(2)字符串连接函数
strcat函数可以将两个字符串连接起来,形成一个新的字符串。
函数调用形式:strcat(字符数组1, 字符串2)
strcat()函数的字符串2的内容(可以是字符串常量或是字符数组变量)连接到字符数组1的后面,字符数组1中的结束符被自动删除,形成一个新的字符串。例如:
chars1[30]="The classname is ";
strcat(s1, “C programming.”); /*s1的字符串是The classname is C programming. */
strcat函数要求字符数组1的长度必须足够大,以便能容纳两个字符数组中的所有值。
(3)字符串比较函数
不能直接比较两个字符数组的名称来决定二者是否相等,使用strcmp函数比较两个字符串的大小,结果为整数值。
函数调用形式:strcmp(字符串1,字符串2);
如果字符串1和字符串2完全相等,函数返回0;如果字符串1大于字符串2,函数返回一个正整数;如果字符串1小于字符串2,函数返回一个负整数。
字符串比较的规则是:将两个字符串从左至右逐个字符按其ASCII码值进行比较,如果所有字符都相等(遇到'\0'),则这两个字符串相等。如果出现了不相等的字符,以第一个不相等字符的ASCII码值大小结果作为字符串比较的返回值。 例如:
char s1[]="CLanguage"; int num;
num=strcmp(“abc”,s1); /*因为‘a’<>‘C’,且‘a’的ASCII值比较大,因此函数返回值>0*/
(4)字符串长度函数
使用strlen函数获取字符串的实际长度,函数返回值不包括结束符。
函数调用形式:strlen(字符串);
例如:
charstr[]="hello";
printf(“%d”, strlen(str)); /*输出字符串长度为5*/
字符串数组
一个字符串本身是一个一维字符数组,多个字符串则可以定义一个二维字符型数组来保存,数组的每一行都保存一个字符串。例如:
charstr_array[10][20];
str_array数组的左下标(行)决定字符串的个数(10个);数组的右下标(列)说明每个串的最大长度(20个字符,包括'/0'),表示定义一个存放10个字符串的字符串数组的,每个串的最大长度为20个字符。
定义字符串数组时,数组的第二个下标应比实际字符串长度大1,以存放字符串结束标志'\0'。同样,可以对字符串数组进行初始化。 例如:
char string[][8]={“This”, “is”, “a”, “C”,“Program”};
字符串数组的每个字符串所占内存的空间是一致的,应取最大的字符串长度作为二维数组列的大小。当所处理的多个字符串长度差异比较大时,就会浪费内存空间,如表1所示。
表1 二维字符数组的存储举例
字符数组的存储
字符类型的变量在存储时只占用一个字节,字符数组长度就是内存中所占的字节数。 例如:
char c[6];
系统为数组c分配6个字节的内存单元。
当数组保存字符串时,如果省略了数组长度,则系统所分配的字节数为字符串中字符个数加1,最后一个字节用于存储字符串的结束符‘\0’。 例如:
char str[]=“Hello”;
str数组在内存中的存储形式如图4所示(假设数组的首地址为2C80)。
图4 字符串的存储