我为什么学C(3)---预处理器

本章更新于 2015-05-16

0x06-C语言预处理器

预处理最大的标志便是大写,虽然这不是标准,但请你在使用的时候大写,为了自己,也为了后人。

预处理器在一般看来,用得最多的还是宏,这里总结一下预处理器的用法。

#include <stdio.h>
#define MACRO_OF_MINE
#ifdef MACRO_OF_MINE
#else
#endif

上述五个预处理是最常看见的,第一个代表着包含一个头文件,可以理解为没有它很多功能都无法使用,例如C语言并没有把输入输入纳入标准当中,而是使用库函数来提供,所以只有包含了stdio.h这个头文件,我们才能使用那些输入输出函数。
#define则是使用频率第二高的预处理机制,广泛用在常量的定义,只不过它和const声明的常量有所所区别:

#define MAR_VA 100
const int Con_va = 100;
...
/*定义两个数组*/
...
for(int i = 0;i < 10;++i)
{
    mar_arr[i] = MAR_VA;
    con_arr[i] = Con_va;
}
  • 区别1,定义上MAR_VA可以用于数组维数,而Con_va则不行
  • 区别2,在使用时,MAR_VA的原理是在文中找到所有使用本身的地方,用值替代,也就是说Con_va将只有一分真迹,而MAR_VA则会有n份真迹(n为使用的次数)
    剩下三个则是在保护头文件中使用颇多。

几个比较实用的用于调试的宏,由C语言自带

  • __LINE__和__FILE__
    用于显示当前行号和当前文件名
  • __DATA__和__TIME__
    用于显示当前的日期和时间
  • __func__(C99)
    用于显示当前所在外层函数的名字

上述所说的五种宏直接当成值来使用即可。

  • __STDC__

    • 如果你想检验你现在使用的编译器是否遵循ISO标准,用它,如果是他的值为1。

      printf("%d\n", __STDC__);
      

      输出: 1

    • 如果你想进一步确定编译器使用的标准版本是C99还是C89可以使用__STDC__VERSION__,C99(199901)

      printf("%d\n", __STDC_VERSION__);
      

      输出: 199901

对于#define
  1. 预处理器一般只对同一行定义有效,但如果加上反斜杠,也能一直读取下去

    #define err(flag) \
        if(flag) \
          printf("Correctly")
    

    可以看出来,并没有在末尾添加;,并不是因为宏不需要,而是因为,我们总是将宏近似当成函数在使用,而函数调用之后总是需要以;结尾,为了不造成混乱,于是在宏定义中我们默认不添加;,而在代码源文件中使用,防止定义混乱。

  2. 预处理同样能够带来一些便利

    #define SWAP1(a, b) (a += b, b = a - b, a -= b)
    #define SWAP2(x, y) {x ^= y; y ^= x; x ^= y}
    

    引用之前的例子,交换两数的宏写法可以有效避免函数开销,由于其是直接在调用处展开代码块,故其比拟直接嵌入的代码。但,偶尔还是会出现一些不和谐的错误,对于初学者来说:

    int v1 = 10;
    int v2 = 20;
    SWAP1(v1, v2);
    SWAP2(v1, v2);//报错
    

    对于上述代码块的情况,为什么SWAP2报错?对于一般的初学者来说,经常忽略诸如 goto do...while等少见关键字用法,故很少见SWAP1的写法,大多集中于SWAP2的类似错误,错就错在{}代表的是一个代码块,不需要使用;来进行结尾,这便是宏最容易出错的地方
    宏只是简单的将代码展开,而不会做任何处理
    对于此,即便是老手也常有失足,有一种应用于单片机等地方的C语言写法可以在此借鉴用于保护代码:

    #define SWAP3(x ,y) do{ \
            x ^= y; y ^= x; x ^= y; \
            }while(0)
    

    如此便能在代码中安全使用花括号内的代码了,并且如之前所约定的那样,让宏的使用看起来像函数。

  3. 但正所谓,假的总是假的,即使宏多么像函数,它依旧不是函数,如果真的把它当成函数,你会在某些时候错的摸不着头脑,还是一个经典的例子,比较大小:

    #define CMP(x, y) (x > y ? x : y)
    ...
    int x = 100, y = 200;
    int result = CMP(x, y++);
    printf("x = %d, y = %d, result = %d\n", x, y, result);
    

    执行这部分代码,会输出什么呢?
    答案是,不知道!至少result的值我们无法确定,我们将代码展开得到

    int result = (x > y++ ? x : y++);
    

    看起来似乎就是y递增两次,最后result肯定是200。真是如此?C语言标准对于一个确定的程序语句中,一个对象只能被修改一次,超过一次那么结果是未定的,由编译器决定,除了三目操作符?:外,还有&&, ||或是,之中,或者函数参数调用,switch控制表达式,for里的控制语句
    由此可看出,宏的使用也是有风险的,所以虽然宏强大,但是依旧不能滥用。

  4. 对于宏而言,前面说过,它只是进行简单的展开,这有时候也会带来一些问题:

    #define MULTI(x, y) (x * y)
    ...
    int x = 100, y = 200;
    int result = MULTI(x+y, y);
    

    看出来问题了吧?展开之后会变成:
    int result = x+y * y;
    完全违背了当初我们设计时的想法,一个比较好的修改方法是对每个参数加上括号:
    #define MULTI(x, y) ((x) * (y))如此,展开以后:

    int result = ((x+y) * (y));
    

    这样能在很大程度上解决一部分问题。

  5. 如果对自己的宏十分自信,可以嵌套宏,即一个表达式中使用宏作为宏的参数,但是宏只展开这一级的宏,对于多级宏另有办法展开

    int result = MULTI(MULTI(x, y), y);
    

    展开成:int result = ((((x) * (y))) * (y));

对宏的应用
  1. 由于我们并不明白,在某些情况下宏是否被定义了,(NULL宏是一个例外,它可以被重复定义),所以我们可以使用一些预处理保护机制来防止错误发生

    #ifndef MY_MACRO
    #define MY_MACRO 10000
    #endif
    

    如果定义了MY_MACRO那就不执行下面的语句,如果没定义那就执行。

  2. 在宏的使用中有两个有用的操作符,姑且叫它操作符#, ##

    • 对于#
      我们可以认为#操作符的作用是将宏参数转化为字符串。

      #define HCMP(x, y) printf(#x" is equal to" #y" ? %d\n", (x) == (y))
      ...
      int x = 100, y = 200;
      HCMP(x, y);
      

      展开以后

      printf("x is equal to y ? %d\n", (100) == (200));
      

      总结起来,即将宏参数放于#操作符之后便由预处理器自动转换为字符串常量,转义也由预处理器自动完成,而不需要我们自行添加转义符号。

    • 对于##
      它实现的是将本操作符两边的参数合并成为一个完整的标记,但需要注意的是,由于预处理器只负责展开,所以程序员必须自己保证这种标记的合法性,这里涉及到一些写法问题,都列出来

      #define MERGE(x, y) have_define_ ## (x + y)
      #define MERGE(x, y) have_define_##(x + y)
      ...
      result = MERGE(1, 3);
      

      这里首先说明,上述写法由于习惯原因,我使用第二种,但是无论哪种都无伤大雅,效果一样。上述代码展开以后是什么呢?

      result = have_define_1 + 3;
      

      在我看来,这就有点C++中模版的思想了,虽然十分原始,但是总是有了一个方向,凭借这种方法我们能够使用宏来进行相似却不同函数的调用,虽然我们可以使用函数指针数组来存储,但需要提前知晓有几个函数,并且如果要实现动态增长还需要消耗内存分配,但宏则不同。

      inline int func_0(int arg_1, int arg_2) { return arg_1 + arg_2; }
      inline int func_1(int arg_1, int arg_2) { return arg_1 - arg_2; }
      inline int func_2(int arg_1, int arg_2) { return arg_1 * arg_2; }
      inline int func_3(int arg_1, int arg_2) { return arg_1 / arg_2; }
      #define CALL(x, arg1, arg2) func_##x(arg1, arg2)
      ...
          printf("func_%d return %d\n",0 ,CALL(0, 2, 10));
          printf("func_%d return %d\n",1 ,CALL(1, 2, 10));
          printf("func_%d return %d\n",2 ,CALL(2, 2, 10));
          printf("func_%d return %d\n",3 ,CALL(3, 2, 10));
      

      十分简便的一种用法,在我们增加减少函数时我们不必考虑如何找到这些函数只需要记下每个函数对应的编号即可,但还是那句话,不可滥用。

      #define CAT(temp, i) (cat##i)
      //...
      for(int i = 0;i < 5;++i)
      {
          int CAT(x,i) = i*i;
          printf("x%d = %d \n",i,CAT(x,i));
      }
      
  3. 对于宏,在使用时一定要注意,宏只能展开当前层的宏,如果你嵌套使用宏,即将宏当作宏的参数,那么将导致宏无法完全展开,即作为参数的宏只能传递名字给外部宏

    #define WHERE(value_name, line) #value_name #line
    ...
    puts(WHERE(x, __LINE__)); //x = 11
    

    输出: 11__LINE__

  4. 对于其他的预编译器指令,如:#program, #line, #error和各类条件编译并不在此涉及,因为使用上并未有陷阱及难点。

Create By WuShengxin @ 2015