从一个新手容易混淆的例子简单分析C语言中函数调用过程

怎甘沉沦 提交于 2020-03-08 03:12:34

        某天,王尼玛写了段C程序:

 1 #include <stdio.h>
 2 
 3 void input()
 4 {
 5     int i;
 6     int array[20];
 7     for(i = 0; i < 20; i++)
 8     {
 9         array[i] = i;
10     }
11 }
12 
13 void output()
14 {
15     int i;
16     int array[20];
17     for(i = 0; i < 20; i++)
18     {
19         printf("%d\n", array[i]);
20     }
21 }
22 
23 int main()
24 {
25     input();
26     output();
27     while(1){}
28     return 0;
29 }

  这段代码的目的很简单,在input函数中定义了array[20]并赋值,在output函数中输出,运行结果如下:

  Nice Work!

  But……在input()后来一发printf()呢?????

1  int main()
2  {
3      input();
4      printf("any string");
5      output();
6      while(1){}
7      return 0;
8  }

  其实,只要学过一段时间的C语言的童鞋就会发现,刚刚开始那俩函数里定义的array[20]就出问题了,这俩array压根儿没关系,如果遇到这样的代码,第一反应就是通过参数或者全局变量的方法,让这俩array有关系。

  But,问题来了……王尼玛是个新手,他将两个array定义成一样的名字认为他们就是同一个数组,并且,他振振有词的说,我之前的代码是没问题的,只加了个printf就出问题了,应该就是这里有问题了,怎么可能是定义array的问题?

  尼玛,这只是巧合而已,你的第一段程序就是错的!

  可我的输出是正确的啊……

  这……

==============================================分割线================================================

  其实大家都知道,问题的根源是output和input函数中的数组array虽然同名,但却不是同一个数组,只是碰巧将原先赋值的内存给输出了而已,要解释这个问题,就需要了解C语言在函数调用过程中,堆栈是如何变化的。首先必须明确一点也是非常重要的一点,栈是向下生长的,所谓向下生长是指从内存高地址->低地址的路径延伸,那么就很明显了,栈有栈底和栈顶,那么栈顶的地址要比栈底低。对x86体系的CPU而言,其中

  ---> 寄存器ebp(base pointer )可称为“帧指针”或“基址指针”,其实语意是相同的。
  ---> 寄存器esp(stack pointer)可称为“ 栈指针”。

要知道的是:

  ---> ebp 在未受改变之前始终指向栈帧的开始,也就是栈底,所以ebp的用途是在堆栈中寻址用的。
  ---> esp是会随着数据的入栈和出栈移动的,也就是说,esp始终指向栈顶。

见下图,假设函数A调用函数B,我们称A函数为"调用者",B函数为“被调用者”则函数调用过程可以这么描述:

(1)先将调用者(A)的堆栈的基址(ebp)入栈,以保存之前任务的信息。

(2)然后将调用者(A)的栈顶指针(esp)的值赋给ebp,作为新的基址(即被调用者B的栈底)。

(3)然后在这个基址(被调用者B的栈底)上开辟(一般用sub指令)相应的空间用作被调用者B的栈空间。

(4)函数B返回后,从当前栈帧的ebp即恢复为调用者A的栈顶(esp),使栈顶恢复函数B被调用前的位置;然后调用者A再从恢复后的栈顶可弹出之前的ebp值(可以这么做是因为这个值在函数调用前一步被压入堆栈)。这样,ebp和esp就都恢复了调用函数B前的位置,也就是栈恢复函数B调用前的状态。

  回到之前的问题,由于input函数和output函数为各自的array数组分配的空间在内存中的地址恰好相同,所以可以顺利输出其内容;但是在调用printf函数以后,由于堆栈中一部分内容被修改了,所以输出结果前半部分是正确的,后半部分是错误的。看到这里,相信有童鞋会试着运行这段代码,如果使用Turbo C,恭喜你可以获得相同的结果(上述结果在Turbo C测试截图);如果使用Visual Studio XXXX,将得到如下结果:

  这是怎么回事呢?查看了反汇编,发现在Debug版本中,为了方便调试,VS会将数组初始化为0xCCCCCCCC,而output函数中的array数组是刚刚定义的,所以被VS初始化位0xCCCCCCCC,转换成unsigned int就是-858993460。

  当然,在Release版本中,为了提高效率,是不会对数组进行这种默认初始化的操作,那么结果是什么样的呢?

  纳尼?!如果VS不给数组初始化,得到的结果为毛和Turbo C不一样啊……

  既然这样,只能再次借助反汇编了,见下图。可以发现input函数没有对应的汇编语句,也就是说,由于这货啥都不干,被编译器优化掉了。既然没有对数组array赋值,那么输出的自然是内存里原先乱七八糟的数据了。

  至于GCC会得出什么结果,作为Windows党,就不测试了,感兴趣的童鞋可以调整编译选项自己试试看

  

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!