练习22:栈、作用域和全局

    许多人在开始编程时,对“作用域”这个概念都不是很清楚。起初它来源于系统栈的使用方式(在之前提到过一些),以及它用于临时变量储存的方式。这个练习中,我们会通过学习栈数据结构如何工作来了解作用域,然后再来看看现代C语言处理作用域的方式。

    这个练习的真正目的是了解一些比较麻烦的东西在C中如何存储。当一个人没有掌握作用域的概念时,它几乎也不能理解变量在哪里被创建,存在以及销毁。一旦你知道了这些,作用域的概念会变得易于理解。

    这个练习需要如下三个文件:

    用于创建一些外部变量和一些函数的头文件。

    ex22.c

    它并不像通常一样,是包含main的源文件,而是含有一些ex22.h中声明的函数和变量,并且会变成ex22.o

    ex22_main.c

    main函数实际所在的文件,它会包含另外两个文件,并演示了它们包含的东西以及其它作用域概念。

    你的第一步是创建你自己的ex22.h头文件,其中定义了所需的函数和“导出”变量。

    最重要的事情是extern int THE_SIZE的用法,我将会在你创建完ex22.c之后解释它:

    这两个文件引入了一些新的变量储存方式:

    extern

    这个关键词告诉编译器“这个变量已存在,但是他在别的‘外部区域’里”。通常它的意思是一个.c文件要用到另一个.c文件中定义的变量。这种情况下,我们可以说ex22.c中的THE_SIZE变量能被ex22_main.c访问到。

    static(文件)

    这个关键词某种意义上是extern的反义词,意思是这个变量只能在当前的.c文件中使用,程序的其它部分不可访问。要记住文件级别的static(比如这里的THE_AGE)和其它位置不同。

    static(函数)

    如果你使用static在函数中声明变量,它和文件中的static定义类似,但是只能够在该函数中访问。它是一种创建某个函数的持续状态的方法,但事实上它很少用于现代的C语言,因为它们很难和线程一起使用。

    在上面的两个文件中,你需要理解如下几个变量和函数:

    THE_SIZE

    get_ageset_age

    它们用于操作静态变量THE_AGE,并通过函数将其暴露给程序的其它部分。你不能够直接访问到THE_AGE,但是这些函数可以。

    它生成新的ratio值并返回旧的值。它使用了函数级的静态变量ratio来跟踪ratio当前的值。

    print_size

    打印出ex22.c所认为的THE_SIZE的当前值。

    ex22_main.c

    一旦你写完了上面那些文件,你可以接着编程main函数,它会使用所有上面的文件并且演示了一些更多的作用域转换:

    我会把这个文件逐行拆分,你应该能够找到我提到的每个变量在哪里定义。

    ex22_main.c:4

    使用了const来创建常量,它可用于替代define来创建常量。

    ex22_main.c:6

    一个简单的函数,演示了函数中更多的作用域问题。

    ex22_main.c:8

    在函数顶端打印出count的值。

    ex22_main.c:10

    if语句会开启一个新的作用域区块,并且在其中创建了另一个count变量。这个版本的count变量是一个全新的变量。if语句就好像开启了一个新的“迷你函数”。

    ex22_main.c:11

    count对于当前区块是局部变量,实际上不同于函数参数列表中的参数。

    ex22_main.c:13

    将它打印出来,所以你可以在这里看到100,并不是传给scope_demo的参数。

    ex22_main.c:16

    ex22_main.c:18-20

    之后我将count参数设为3000并且打印出来,这里演示了你也可以修改函数参数的值,但并不会影响变量的调用者版本。

    确保你浏览了整个函数,但是不要认为你已经十分了解作用娱乐。如果你在一个代码块中(比如ifwhile语句)创建了一些变量,这些变量是全新的变量,并且只在这个代码块中存在。这是至关重要的东西,也是许多bug的来源。我要强调你应该在这里花一些时间。

    ex22_main.c的剩余部分通过操作和打印变量演示了它们的全部。

    ex22_main.c:26

    打印出MY_NAME的当前值,并且使用get_age读写器从ex22.c获取THE_AGE

    ex22_main.c:27-30

    使用了ex22.c中的set_age来修改并打印。

    ex22_main.c:33-39

    接下来我对ex22.c中的THE_SIZE做了相同的事情,但这一次我直接访问了它,并且同时演示了它实际上在那个文件中已经修改了,还使用print_size打印了它。

    ex22_main.c:42-44

    展示了update_ratio中的ratio在两次函数调用中如何保持了它的值。

    ex22_main.c:46-51

    最后运行scope_demo,你可以在实例中观察到作用域。要注意到的关键点是,count局部变量在调用后保持不变。你将它像一个变量一样传入函数,它一定不会发生改变。要想达到目的你需要我们的老朋友指针。如果你将指向count的指针传入函数,那么函数就会持有它的地址并且能够改变它。

    上面解释了这些文件中所发生的事情,但是你应该跟踪它们,并且确保在你学习的过程中明白了每个变量都在什么位置。

    这次我想让你手动构建这两个文件,而不是使用你的Makefile。于是你可以看到它们实际上如何被编译器放到一起。这是你应该做的事情,并且你应该看到如下输出:

    确保你跟踪了每个变量是如何改变的,并且将其匹配到所输出的那一行。我使用了dbg.hlog_info来让你获得每个变量打印的具体行号,并且在文件中找到它用于跟踪。

    作用域、栈和Bug

    如果你正确完成了这个练习,你会看到有很多不同方式在C代码中放置变量。你可以使用extern或者访问类似get_age的函数来创建全局。你也可以在任何代码块中创建新的变量,它们在退出代码块之前会拥有自己的值,并且屏蔽掉外部的变量。你也可以响函数传递一个值并且修改它,但是调用者的变量版本不会发生改变。

    需要理解的最重要的事情是,这些都可以造成bug。C中在你机器中许多位置放置和访问变量的能力会让你对它们所在的位置感到困扰。如果你不知道它们的位置,你就可能不能适当地管理它们。

    下面是一些编程C代码时需要遵循的规则,可以让你避免与栈相关的bug:

    • 不要隐藏某个变量,就像上面scope_demo中对count所做的一样。这可能会产生一些隐蔽的bug,你认为你改变了某个变量但实际上没有。
    • 避免过多的全局变量,尤其是跨越多个文件。如果必须的话,要使用读写器函数,就像get_age。这并不适用于常量,因为它们是只读的。我是说对于THE_SIZE这种变量,如果你希望别人能够修改它,就应该使用读写器函数。
    • 在你不清楚的情况下,应该把它放在堆上。不要依赖于栈的语义,或者指定区域,而是要直接使用malloc创建它。
    • 不要使用函数级的静态变量,就像update_ratio。它们并不有用,而且当你想要使你的代码运行在多线程环境时,会有很大的隐患。对于良好的全局变量,它们也非常难于寻找。
    • 避免复用函数参数,因为你搞不清楚仅仅想要复用它还是希望修改它的调用者版本。

    对于这个练习,崩溃这个程序涉及到尝试访问或修改你不能访问的东西。

    • 移除ex22.hextern声明,来观察会得到什么错误或警告。
    • 对不同变量添加static或者const限定符,之后尝试修改它们。

    附加题

    • 研究“值传递”和“引用传递”的差异,并且为二者编写示例。(译者注:C中没有引用传递,你可以搜索“指针传递”。)
    • 使用指针来访问原本不能访问的变量。
    • 使用Valgrind来观察错误的访问是什么样子。
    • 重新编写使之能够构建这些文件。