C语言之指针

Posted 天国的雪

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C语言之指针相关的知识,希望对你有一定的参考价值。

前言:先看下面类型的含义

  1) int p;

    这是一个普通的整型变量。

  2) int *p;

    从p处开始,先与*结合,说明p是一个指针,然后再与int结合,说明指针所指向的内容的类型为int型。所以p是一个指向整型数据的指针。

  3) int p[3];

    从p处开始,先与[]结合,说明p是一个数组,然后与int结合,说明数组里的元素是整型的,所以p是一个由整型数据组成的数组。

  4) int *p[3];

    从p处开始,先与[]结合,因为[]优先级比*高,所以p是一个数组。然后再与*结合,说明数组里的元素是指针类型。 然后再与int结合,说明指针所指向的内容的类型是整型的,所以p是一个由指向整型数据的指针所组成的数组。

  5) int (*p)[3];

    从p处开始,先与*结合,因为()的优先级最高,说明p是一个指针(与""这步可以忽略,只是为了改变优先级)。然后再与[]结合,说明指针所指向的内容是一个数组,然后再与int结合,说明数组里的元素是整型的。所以p是一个指向由整型数据组成的数组的指针。

  6) int **p;

    从p开始,先与*结合,说是p是一个指针,然后再与*结合,说明指针所指向的元素仍是指针,然后再与int结合,说明该二重指针所指向的元素是整型数据。所以p是以个指向整形数据的二级指针。由于二级指针以及更高级的指针极少用在复杂类型中,所以后面更复杂的类型我们就不考虑多级指针了,最多只考虑一级指针。 

  7) int p(int);

    从p处起,先与()结合,说明p是一个函数,然后进入()里分析,说明该函数有一个整型变量的参数,然后再与外面的int结合,说明函数的返回值是一个整型数据。

  8) int *p(int);

    从p处开始,先与()结合,说明p是一个函数,然后进入()里分析,说明该函数有一个整型变量的参数,然后再与外面的*结合,说明函数的返回值是一个指针,然后再与int结合,说明返回值的指针指向的类型为int型。

  9) int (*p)(int);

    从p处开始,先与*结合,说明p是一个指针,然后与()结合,说明指针指向的是一个函数,然后进入()里分析,说明函数有一个int型的参数,再与最外层的int结合,说明函数的返回类型是整型,所以p是一个指向有一个整型参数且返回类型为整型的函数的指针。

  10) int *(*p(int))[3]; 

    可以先跳过,不看这个类型,过于复杂。从p开始,先与()结合,说明p是一个函数,然后进入()里面分析,说明函数有一个int型的参数。然后再与外面的*结合说明函数返回的是一个指针然后到最外面一层先与[]结合说明返回的指针指向的是一个数组然后再与*结说明数组里的元素是指针然后再与int结合,说明指针指向的内容是整型数据。所以p是一个参数为一个整数据且返回一个指向由整型指针变量组成的数组的指针变量的函数。

   理解了这几个类型其它的类型对我们来说也是小菜了,不过我们一般不会用太复杂的类型,那样会大大减小程序的可读性,请慎用,这上面的几种类型已经足够我们用了。 

 

1、理解指针 

  指针是一个特殊的变量,它里面存储的数值被解释成为内存里的一个地址。 要搞清一个指针需要搞清指针的四方面的内容:

    1)指针的类型

    2)指针所指向的类型

    3)指针的值或者叫指针所指向的内存区

    4)指针本身所占据的内存区

  1.1指针的类型 

    从语法的角度看,你只要把指针声明语句里的指针名字去掉,剩下的部分就是这个指针的类型。这是指针本身所具有的类型。

(1)int*ptr;      //指针的类型是int*    
(2)char*ptr;      //指针的类型是char*    
(3)int**ptr;      //指针的类型是int**  
(4)int(*ptr)[3];   //指针的类型是int(*)[3]    
(5)int*(*ptr)[4];   //指针的类型是int*(*)[4]

  1.2指针所指向的类型 

    当你通过指针来访问指针所指向的内存区时,指针所指向的类型决定了编译器将把那片内存区里的内容当做什么来看待。从语法上看,你只须把指针声明语句中的指针名字和名字左边的指针声明符*去掉,剩下的就是指针所指向的类型。

(1)int*ptr;        //指针所指向的类型是int  
(2)char*ptr;        //指针所指向的的类型是char  
(3)int**ptr;         //指针所指向的的类型是int*  
(4)int(*ptr)[3];     //指针所指向的的类型是int()[3]    
(5)int*(*ptr)[4];    //指针所指向的的类型是int*()[4] 

  指针的类型(即指针本身的类型)和指针所指向的类型是两个概念。当你对C越来越熟悉时,你会发现,把与指针搅和在一起的"类型"这个概念分成"指针的类型"和"指针所指向的类型"两个概念,是精通指针的关键点之一

  1.3指针的值或者叫指针所指向的内存区或地址 

    指针的值是指针本身存储的数值,这个值将被编译器当作一个地址,而不是一个一般的数值。在32位程序里,所有类型的指针的值都是一个32位整数,因为32位程序里内存地址全都是32位长。 指针所指向的内存区就是从指针的值所代表的那个内存地址开始,长度为sizeof(指针所指向的类型)的一片内存区。以后,我们说一个指针的值是XX,就相当于说该指针指向了以XX为首地址的一片内存区域;我们说一个指针指向了某块内存区域,就相当于说该指针的值是这块内存区域的首地址。 

    指针所指向的内存区和指针所指向的类型是两个完全不同的概念。如"int *ptr;",指针所指向的类型已经有了,但由于指针还未初始化,所以它所指向的内存区是不存在的,或者说是无意义的。

  1.4指针本身所占据的内存区

  指针本身占了多大的内存?你只要用函数sizeof(指针的类型)测一下就知道了。在32位平台里,指针本身占据了4个字节的长度。指针本身占据的内存这个概念在判断一个指针表达式是否是左值时很有用。

  左值简单点说就是可以放在赋值运算符左边的表达式。下面让我们来看看他的定义:如果一个表达式可以引用到某一个对象,并且这个对象是一块内存空间且可以被检查和存储,那么这个表达式就可以做为一个左值。当然,有左值当然就会有右值这个概念:右值指的是引用了一个存储在某个内存地址里的数据。一个变量可以同时是左值,同时也是右值,两者不是对立的。 

 

2、指针运算

  指针可以加上或减去一个整数。指针的这种运算的意义和通常的数值的加减运算的意义是不一样的,以单元为单位:

char a[20];  
int *ptr=(int *)a; //强制类型转换并不会改变a的类型 
ptr++;  

  在上例中,指针ptr的类型是int*,它指向的类型是int,它被初始化为指向整型变量a。接下来的第3句中,指针ptr被加了1,编译器是这样处理的:它把指针ptr的值加上了sizeof(int),在32位程序中,是被加上了4,因为在32位程序中,int占4个字节。由于地址是用字节做单位的,故ptr所指向的地址由原来的变量a的地址向高地址方向增加了4个字节。由于char类型的长度是一个字节,所以,原来ptr是指向数组a的第0号单元开始的四个字节,此时指向了数组a中从第4号单元开始的四个字节。  

  我们可以用一个指针和一个循环来遍历一个数组:

int array[20]={0};  
int *ptr=array;  
for(i=0;i<20;i++)  
{  
    (*ptr)++;   
    ptr++;  
}

  这个例子将整型数组中各个单元的值加1。由于每次循环都将指针ptr加1个单元,所以每次循环都能访问数组的下一个单元。 

  再看例子:

char a[20]="You_are_a_girl";
int *ptr=(int *)a;
ptr+=5; 

  在这个例子中,ptr被加上了5,编译器是这样处理的:将指针ptr的值加上5乘sizeof(int),在32位程序中就是加上了5乘4=20。由于地址的单位是字节,故现在的ptr所指向的地址比起加5后的ptr所指向的地址来说,向高地址方向移动了20个字节。在这个例子中,没加5前的ptr指向数组a的第0号单元开始的四个字节,加5后,ptr已经指向了数组a的合法范围之外了。虽然这种情况在应用上会出问题,但在语法上却是可以的。这也体现出了指针的灵活性。如果上例中,ptr是被减去5,那么处理过程大同小异,只不过ptr的值是被减去5乘sizeof(int),新的ptr指向的地址将比原来的ptr所指向的地址向低地址方向移动了20个字节。  

  下面再举一个例子:

#include<stdio.h>
int main()
{
    char a[20]="You_are_a_girl";
    char *p=a;
    char **ptr=&p;
    //printf("p=%d\n",p);
    //printf("ptr=%d\n",ptr);
    //printf("*ptr=%d\n",*ptr);
    printf("**ptr=%c\n",**ptr);
    ptr++;
    //printf("ptr=%d\n",ptr);
    //printf("*ptr=%d\n",*ptr);
    printf("**ptr=%c\n",**ptr);
}

  误区一、输出答案为Y和o,误解:ptr是一个char的二级指针,当执行"ptr++;"时,会使指针加一个sizeof(char),所以输出如上结果,这个可能只是少部分人的结果。

  误区二、输出答案为Y和a,误解:ptr指向一个char*类型,当执行"ptr++;"时,会使指针加一个sizeof(char*)(有可能会有人认为这个值为1,那就会得到误区一的答案。这个值应该是4,参考前面内容), 即&p+4。那进行一次取值运算不就指向数组中的第五个元素了吗?那输出的结果不就是数组中第五个元素了吗?答案是否定的。

  正解: ptr的类型是char**,指向的类型是一个char*类型,该指向的地址就是p的地址(&p),当执行"ptr++;"时,会使指针加一个sizeof(char*),即&p+4,那*(&p+4)指向哪呢,这个你去问上帝吧,或者他会告诉你在哪?所以最后的输出会是一个随机的值,或许是一个非法操作.。

  总结:一个指针ptrold加(减)一个整数n后,结果是一个新的指针ptrnew,ptrnew的类型和ptrold的类型相同,ptrnew所指向的类型和ptrold所指向的类型也相同。ptrnew的值将比ptrold的值增加(减少)了n乘sizeof(ptrold所指向的类型)个字节。就是说,ptrnew所指向的内存区将比ptrold所指向的内存区向高(低)地址方向移动了n乘sizeof(ptrold所指向的类型)个字节。  
  指针和指针进行加减:两个指针不能进行加法运算,这是非法操作,因为进行加法后,得到的结果指向一个不知所向的地方,而且毫无意义。两个指针可以进行减法操作,但必须类型相同,一般用在数组方面。

 

3、指针表达式

  一个表达式的结果如果是一个指针,那么这个表达式就叫指针表达式。  下面是一些指针表达式的例子:

int a,b;
int array[10];
int *pa;
int *pb;
int **ptr;
pa=&a;          //&a是一个指针表达式
ptr=&pa;       //&pa也是一个指针表达式
*ptr=&b;        //*ptr和&b都是指针表达式
pa=array;  
pa++;           //这也是指针表达式
pb=*ptr;      //*parr是指针表达式  
pb=*(ptr+1);  //*(ptr+1)是指针表达式

  由于指针表达式的结果是一个指针,所以指针表达式也具有指针所具有的四个要素:指针的类型,指针所指向的类型,指针指向的内存区,指针自身占据的内存。 当一个指针表达式的结果指针已经明确地具有了指针自身占据的内存的话,这个指针表达式就是一个左值,否则就不是一个左值。 

  在上面例子中,&a不是一个左值,因为它还没有占据明确的内存。*ptr是一个左值,因为*ptr这个指针已经占据了内存,其实*ptr就是指针pa,既然pa已经在内存中有了自己的位置,那么*ptr当然也有了自己的位置。

  
4、指针数组

  数组的数组名其实可以看作一个指针。看下例:

int array[10] = {0,1,2,3,4,5,6,7,8,9};
int value;
value = array[0];  //也可写成:value=*array;
value = array[3];  //也可写成:value=*(array+3);
value = array[4];  //也可写成:value=*(array+4);

  上例中,一般而言数组名array代表数组本身,类型是int[10],但如果把array看做指针的话,它指向数组的第0个单元,类型是int* ,所指向的类型是数组单元的类型即int。因此*array等于0就一点也不奇怪了。同理,array+3是一个指向数组第3个单元的指针,所以*(array+3)等于3,其它依此类推。

 

char *str[3]={"Hello,thisisasample!", "Hi,goodmorning.", "Helloworld"};
char s[80];
strcpy(s, str[0]); //也可写成strcpy(s,*str);
strcpy(s, str[1]); //也可写成strcpy(s,*(str+1));
strcpy(s, str[2]); //也可写成strcpy(s,*(str+2));

  上例中,str是一个三单元的数组,该数组的每个单元都是一个指针,这些指针各指向一个字符串。把指针数组名str当作一个指针的话,它指向数组的第0号单元,它的类型是char **,它指向的类型是char *。*str也是一个指针,它的类型是char *,它所指向的类型是char,它指向的地址是字符串"Hello,thisisasample!"的第一个字符的地址,即‘H‘的地址。

  注意:字符串相当于是一个数组,在内存中以数组的形式储存,只不过字符串是一个数组常量,内容不可改变,且只能是右值。如果看成指针的话,他即是常量指针,也是指针常量。 

  常量指针:该指针是一个常量,不可改变,指向某个地址之后就不能改变了,但他所指向的内容是可以改变的,很容易与指针常量弄混。所以一般读的时候读成常量指向,从字面上看就是一个常量指向某个地址。
  指针常量:说明该指针所指向的是内容不可改变,但其指针自身是一个变量,可以改变指向的内容,读的时候读成指向常量,从字面上看就是指向某个常量。

  str+1也是一个指针,它指向数组的第1号单元,它的类型是char**,它指向的类型是char*。*(str+1)也是一个指针,它的类型是char*,它所指向的类型是char,它指向 "Hi,goodmorning."的第一个字符‘H‘。

  下面总结一下数组的数组名(数组中储存的也是数组)的问题:

  声明了一个数组TYPE array[n],则数组名称array就有了两重含义:第一,它代表整个数组,它的类型是TYPE[n];第二,它是一个常量指针,该指针的类型是TYPE*,该指针指向的类型是TYPE,也就是数组单元的类型,该指针指向的内存区就是数组第0号单元,该指针自己占有单独的内存区,注意它和数组第0号单元占据的内存区是不同的。该指针的值是不能修改的,即类似array++的表达式是错误的。 

  在不同的表达式中数组名array可以扮演不同的角色。在表达式sizeof(array)中,数组名array代表数组本身,故这时sizeof函数测出的是整个数组的大小。在表达式*array中,array扮演的是指针,因此这个表达式的结果就是数组第0号单元的值。sizeof(*array)测出的是数组单元的大小。表达式array+n(其中n=0,1,2,.....)中,array扮演的是指针,故array+n的结果是一个指针,它的类型是TYPE *,它指向的类型是TYPE,它指向数组第n号单元。故sizeof(array+n)测出的是指针类型的大小。在32位程序中结果是4。

int array[10];
int (*ptr)[10];
ptr=&array;

  上例中ptr是一个指针,它的类型是int(*)[10],他指向的类型是int[10] ,我们用整个数组的首地址来初始化它。在语句"ptr=&array"中,array代表数组本身。

 

5、指针和结构体

  可以声明一个指向结构类型对象的指针。  

struct MyStruct  
{  
    int a;  
    int b;  
    int c;  
};  
struct MyStruct ss={20,30,40}; //声明了结构对象ss,并把ss的成员初始化为20,30和40。  
struct MyStruct *ptr=&ss;   //声明一个指向结构对象ss的指针。它的类型是MyStruct*,它指向的类型是MyStruct。
int *pstr=(int*)&ss;     //声明一个指向结构对象ss的指针。但是pstr和它被指向的类型ptr是不同的。

  1)请问怎样通过指针ptr来访问ss的三个成员变量?  

    答案:  

    ptr->a;  //指向运算符,或者可以这样写(*ptr).a,建议使用前者 

    ptr->b;  

    ptr->c;  

  2)请问怎样通过指针pstr来访问ss的三个成员变量?  

    答案:  

    *pstr;     //访问了ss的成员a。  

    *(pstr+1);  //访问了ss的成员b。  

    *(pstr+2);  //访问了ss的成员c。  

    要知道,这样使用pstr来访问结构成员是不正规的。即不能将结构体强转成指针访问。在存放结构对象的各个成员时,在某种编译环境下,可能会需要字对齐或双字对齐或者是别的什么对齐,需要在相邻两个成员之间加若干个"填充字节",这就导致各个成员之间可能会有若干个字节的空隙。"*(pstr+1);"可能刚好访问了这个空隙。  


6、指针和函数

  1)可以把一个指针声明成为一个指向函数的指针。 

int fun1(char *,int);
int (*pfun1)(char *,int);
pfun1=fun1;
int a=(*pfun1)("abcdefg",7); //通过函数指针调用函数。 

  2)可以把指针作为函数的形参。在函数调用语句中,可以用指针表达式来作为实参。  

int fun(char *);
int a;
char str[]="abcdefghijklmn";
a=fun(str);
int fun(char *s)
{
    int num=0;
    for(int i=0;;)
    {
        num+=*s;
     s++; } return num; }

  这个例子中的函数fun统计一个字符串中各个字符的ASCII码值之和。前面说了,数组的名字也是一个指针。在函数调用中,当把str作为实参传递给形参s后,实际是把str的值传递给了s,s所指向的地址就和str所指向的地址一致,但是str和s各自占用各自的存储空间。在函数体内对s进行自加1运算,并不意味着同时对str进行了自加1运算。 

 

7、指针类型转换

  当我们初始化一个指针或给一个指针赋值时,赋值号的左边是一个指针,赋值号的右边是一个指针表达式。在我们前面所举的例子中,绝大多数情况下,指针的类型和指针表达式的类型是一样的,指针所指向的类型和指针表达式所指向的类型是一样的。  

float f=12.3;
float *fptr=&f;
int *p;

  在上面的例子中,假如我们想让指针p指向实数f,应该怎么办? "p=&f;"?不对。因为指针p的类型是int *,它指向的类型是int。表达式&f的结果是一个指针,指针的类型是float *,它指向的类型是float。两者不一致,直接赋值的方法是不行的。为了实现我们的目的,需要进行强制类型转换:"p=(int*)&f;"。

  如果有一个指针p,我们需要把它的类型和所指向的类型改为TYEP *和TYPE, 那么语法格式是:"(TYPE *)p;"。这样强制类型转换的结果是一个新指针,该新指针的类型是TYPE*,它指向的类型是TYPE,指向的地址是原指针指向的地址。而原指针p的一切属性都没有被修改(切记)。 

  一个函数如果使用了指针作为形参,那么在函数调用语句的实参和形参的结合过程中,必须保证类型一致 ,否则需要强制转换。

void fun(char*);
int a=125,b;
fun((char*)&a);
void fun(char* s)
{
  char c;
  c=*(s+3);
  *(s+3)=*(s+0);
  *(s+0)=c;
  c=*(s+2);
  *(s+2)=*(s+1);
  *(s+1)=c;
}

  注意这是一个32位程序,故int类型占了四个字节,char类型占一个字节。函数fun的作用是把一个整数的四个字节的顺序来个颠倒。注意到了吗?在函数调用语句中,实参&a的结果是一个指针,它的类型是int*,它指向的类型是int。形参这个指针的类型是char*,它指向的类型是char。这样,在实参和形参的结合过程中,我们必须进行一次从int*类型到char*类型的转换。

  结合这个例子,我们可以这样来想象编译器进行转换的过程:编译器先构造一个临时指针char *temp, 然后执行temp=(char *)&a,最后再把temp的值传递给s。所以最后的结果是:s的类型是char*,它指向的类型是char,它指向的地址就是a的首地址。 

  我们已经知道,指针的值就是指针指向的地址,在32位程序中,指针的值其实是一个32位整数。那可不可以把一个整数当作指针的值直接赋给指针呢?就象下面的语句:

unsigned int a; 
TYPE *ptr;       //TYPE是int,char或结构类型等等类型
a=N;             //N必须代表一个合法的地址
ptr=(TYPE*)a;    

  严格说来这里的(TYPE*)和指针类型转换中的(TYPE*)还不一样。这里的(TYPE*)的意思是把无符号整数a的值当作一个地址来看待。上面强调了a的值必须代表一个合法的地址,否则的话,在你使用ptr的时候,就会出现非法操作错误。 

  想想能不能反过来,把指针指向的地址即指针的值当作一个整数取出来。下面的例子演示了把一个指针的值当作一个整数取出来,然后再把这个整数当作一个地址赋给一个指针:

int a=123,b;
int *ptr=&a;
char *str;
b=(int)ptr;  //把指针ptr的值当作一个整数取出来
str=(char*)b; //把这个整数的值当作一个地址赋给指针str

 

8、指针的安全问题

char s=a;
int *ptr; 
ptr=(int *)&s;
*ptr=1298;

  上例中指针ptr是一个int *类型的指针,它指向的类型是int。它指向的地址就是s的首地址。在32位程序中,s占一个字节,int类型占四个字节。最后一条语句不但改变了s所占的一个字节,还把和s相临的高地址方向的三个字节也改变了。这三个字节是干什么的?只有编译程序知道,而写程序的人是不太可能知道的。也许这三个字节里存储了非常重要的数据,也许这三个字节里正好是程序的一条代码,而由于你对指针的马虎应用,这三个字节的值被改变了!这会造成崩溃性的错误。  

char a;
int *ptr=&a;
ptr++;
*ptr=115;

  上例完全可以通过编译,并能执行。但是看到没有?第3句对指针ptr进行自加1运算后,ptr指向了和整形变量a相邻的高地址方向的一块存储区。这块存储区里是什么?我们不知道。有可能它是一个非常重要的数据,甚至可能是一条代码。而第4句竟然往这片存储区里写入一个数据!这是严重的错误。所以在使用指针时,程序员心里必须非常清楚:我的指针究竟指向了哪里。在用指针访问数组的时候,也要注意不要超出数组的低端和高端界限,否则也会造成类似的错误。  

  在指针的强制类型转换中:ptr1=(TYPE *)ptr2,如果sizeof(ptr2的类型)大于sizeof(ptr1的类型),那么在使用指针ptr1来访问ptr2所指向的存储区时是安全的。如果sizeof(ptr2的类型)小于sizeof(ptr1的类型),那么在使用指针ptr1来访问ptr2所指向的存储区时是不安全的。

 

以上是关于C语言之指针的主要内容,如果未能解决你的问题,请参考以下文章

C语言中 * 的三种含义

C之指针

C语言基础之指针入门

C语言指针变量怎么转化为普通类型变量?

C语言---面试之数据类型篇

C语言指针基本概念及其指针变量的定义是啥