C技巧:語(yǔ)言中可變參數(shù)的用法

字號(hào):

我們?cè)贑語(yǔ)言編程中會(huì)遇到一些參數(shù)個(gè)數(shù)可變的函數(shù),例如printf() 這個(gè)函數(shù),它的定義是這樣的:
    int printf( const char* format, ...);
    它除了有一個(gè)參數(shù)format固定以外,后面跟的參數(shù)的個(gè)數(shù)和類型是
    可變的,例如我們可以有以下不同的調(diào)用方法:
    printf(\"%d\",i);
    printf(\"%s\",s);
    printf(\"the number is %d ,string is:%s\", i, s);
    究竟如何寫可變參數(shù)的C函數(shù)以及這些可變參數(shù)的函數(shù)編譯器是如何實(shí)現(xiàn)的呢?本文就這個(gè)問(wèn)題進(jìn)行一些探討,希望能對(duì)大家有些幫助.會(huì)C++的網(wǎng)友知道這些問(wèn)題在C++里不存在,因?yàn)镃++具有多態(tài)性.但C++是C的一個(gè)超集,以下的技術(shù)也可以用于C++的程序中.限于本人的水平,文中如果有不當(dāng)之處,請(qǐng)大家指正.
    (一)寫一個(gè)簡(jiǎn)單的可變參數(shù)的C函數(shù)
    下面我們來(lái)探討如何寫一個(gè)簡(jiǎn)單的可變參數(shù)的C函數(shù).寫可變參數(shù)的C函數(shù)要在程序中用到以下這些宏:
    void va_start( va_list arg_ptr, prev_param );
    type va_arg( va_list arg_ptr, type );
    void va_end( va_list arg_ptr );
    va在這里是variable-argument(可變參數(shù))的意思. 這些宏定義在stdarg.h中,所以用到可變參數(shù)的程序應(yīng)該包含這個(gè) 頭文件.下面我們寫一個(gè)簡(jiǎn)單的可變參數(shù)的函數(shù),改函數(shù)至少有一個(gè)整數(shù)參數(shù),第二個(gè)參數(shù)也是整數(shù),是可選的.函數(shù)只是打印這兩個(gè)參數(shù)的值.
    void simple_va_fun(int i, ...)
    {
    va_list arg_ptr;
    int j=0;
    va_start(arg_ptr, i);
    j=va_arg(arg_ptr, int);
    va_end(arg_ptr);
    printf(\"%d %d\\n\", i, j);
    return;
    }
    我們可以在我們的頭文件中這樣聲明我們的函數(shù):
    extern void simple_va_fun(int i, ...);
    我們?cè)诔绦蛑锌梢赃@樣調(diào)用:
    simple_va_fun(100);
    simple_va_fun(100,200);
    從這個(gè)函數(shù)的實(shí)現(xiàn)可以看到,我們使用可變參數(shù)應(yīng)該有以下步驟:
    1)首先在函數(shù)里定義一個(gè)va_list型的變量,這里是arg_ptr,這個(gè)變量是指向參數(shù)的指針.
    2)然后用va_start宏初始化變量arg_ptr,這個(gè)宏的第二個(gè)參數(shù)是第一個(gè)可變參數(shù)的前一個(gè)參數(shù),是一個(gè)固定的參數(shù).
    3)然后用va_arg返回可變的參數(shù),并賦值給整數(shù)j. va_arg的第二個(gè)參數(shù)是你要返回的參數(shù)的類型,這里是int型.
    4)最后用va_end宏結(jié)束可變參數(shù)的獲取.然后你就可以在函數(shù)里使用第二個(gè)參數(shù)了.如果函數(shù)有多個(gè)可變參數(shù)的,依次調(diào)用va_arg獲取各個(gè)參數(shù).
    如果我們用下面三種方法調(diào)用的話,都是合法的,但結(jié)果卻不一樣:
    1)simple_va_fun(100);
    結(jié)果是:100 -123456789(會(huì)變的值)
    2)simple_va_fun(100,200);
    結(jié)果是:100 200
    3)simple_va_fun(100,200,300);
    結(jié)果是:100 200
    我們看到第一種調(diào)用有錯(cuò)誤,第二種調(diào)用正確,第三種調(diào)用盡管結(jié)果正確,但和我們函數(shù)最初的設(shè)計(jì)有沖突.下面一節(jié)我們探討出現(xiàn)這些結(jié)果的原因和可變參數(shù)在編譯器中是如何處理的.
    (二)可變參數(shù)在編譯器中的處理
    我們知道va_start,va_arg,va_end是在stdarg.h中被定義成宏的,由于1)硬件平臺(tái)的不同 2)編譯器的不同,所以定義的宏也有所不同,下面以VC++中stdarg.h里x86平臺(tái)的宏定義摘錄如下(’\\’號(hào)表示折行):
    typedef char * va_list;
    #define _INTSIZEOF(n) \\
    ((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) )
    #define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) )
    #define va_arg(ap,t) \\
    ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
    #define va_end(ap) ( ap = (va_list)0 )
    定義_INTSIZEOF(n)主要是為了某些需要內(nèi)存的對(duì)齊的系統(tǒng).C語(yǔ)言的函數(shù)是從右向左壓入堆棧的,函數(shù)的參數(shù)在堆棧中的分布位置.我
    們看到va_list被定義成char*,有一些平臺(tái)或操作系統(tǒng)定義為void*.再看va_start的定義,定義為&v+_INTSIZEOF(v),而&v是固定參數(shù)在堆棧的
    地址,所以我們運(yùn)行va_start(ap, v)以后,ap指向第一個(gè)可變參數(shù)在堆棧的地址:
    高地址|-----------------------------|
    |函數(shù)返回地址 |
    |-----------------------------|
    |....... |
    |-----------------------------|
    |第n個(gè)參數(shù)(第一個(gè)可變參數(shù)) |
    |-----------------------------|<--va_start后ap指向
    |第n-1個(gè)參數(shù)(最后一個(gè)固定參數(shù))|
    低地址|-----------------------------|<-- &v
    然后,我們用va_arg()取得類型t的可變參數(shù)值,以上例為int型為例,我們看一下va_arg取int型的返回值:
    j= ( *(int*)((ap += _INTSIZEOF(int))-_INTSIZEOF(int)) ); 首先ap+=sizeof(int),已經(jīng)指向下一個(gè)參數(shù)的地址了.然后返回
    ap-sizeof(int)的int*指針,這正是第一個(gè)可變參數(shù)在堆棧里的地址
    然后用*取得這個(gè)地址的內(nèi)容(參數(shù)值)賦給j.
    高地址|-----------------------------|
    |函數(shù)返回地址 |
    |-----------------------------|
    |....... |
    |-----------------------------|<--va_arg后ap指向
    |第n個(gè)參數(shù)(第一個(gè)可變參數(shù)) |
    |-----------------------------|<--va_start后ap指向
    |第n-1個(gè)參數(shù)(最后一個(gè)固定參數(shù))|
    低地址|-----------------------------|<-- &v
    最后要說(shuō)的是va_end宏的意思,x86平臺(tái)定義為ap=(char*)0;使ap不再指向堆棧,而是跟NULL一樣.有些直接定義為((void*)0),這樣編譯器不
    會(huì)為va_end產(chǎn)生代碼,例如gcc在linux的x86平臺(tái)就是這樣定義的.在這里大家要注意一個(gè)問(wèn)題:由于參數(shù)的地址用于va_start宏,所以參數(shù)不能聲明為寄存器變量或作為函數(shù)或數(shù)組類型.關(guān)于va_start, va_arg, va_end的描述就是這些了,我們要注意的是不同的操作系統(tǒng)和硬件平臺(tái)的定義有些不同,但原理卻是相似的.
    (三)可變參數(shù)在編程中要注意的問(wèn)題
    因?yàn)関a_start, va_arg, va_end等定義成宏,所以它顯得很愚蠢,可變參數(shù)的類型和個(gè)數(shù)完全在該函數(shù)中由程序代碼控制,它并不能智能
    地識(shí)別不同參數(shù)的個(gè)數(shù)和類型. 有人會(huì)問(wèn):那么printf中不是實(shí)現(xiàn)了智能識(shí)別參數(shù)嗎?那是因?yàn)楹瘮?shù)printf是從固定參數(shù)format字符串來(lái)分析出參數(shù)的類型,再調(diào)用va_arg 的來(lái)獲取可變參數(shù)的.也就是說(shuō),你想實(shí)現(xiàn)智能識(shí)別可變參數(shù)的話是要通過(guò)在自己的程序里作判斷來(lái)實(shí)現(xiàn)的. 另外有一個(gè)問(wèn)題,因?yàn)榫幾g器對(duì)可變參數(shù)的函數(shù)的原型檢查不夠嚴(yán)格,對(duì)編程查錯(cuò)不利.如果simple_va_fun()改為:
    void simple_va_fun(int i, ...)
    {
    va_list arg_ptr;
    char *s=NULL;
    va_start(arg_ptr, i);
    s=va_arg(arg_ptr, char*);
    va_end(arg_ptr);
    printf(\"%d %s\\n\", i, s);
    return;
    }
    可變參數(shù)為char*型,當(dāng)我們忘記用兩個(gè)參數(shù)來(lái)調(diào)用該函數(shù)時(shí),就會(huì)出現(xiàn)core dump(Unix) 或者頁(yè)面非法的錯(cuò)誤(window平臺(tái)).但也有可能不出
    錯(cuò),但錯(cuò)誤卻是難以發(fā)現(xiàn),不利于我們寫出高質(zhì)量的程序. 以下提一下va系列宏的兼容性.System V Unix把va_start定義為只有一個(gè)參數(shù)的宏:
    va_start(va_list arg_ptr);
    而ANSI C則定義為:
    va_start(va_list arg_ptr, prev_param);
    如果我們要用system V的定義,應(yīng)該用vararg.h頭文件中所定義的
    宏,ANSI C的宏跟system V的宏是不兼容的,我們一般都用ANSI C,所以
    用ANSI C的定義就夠了,也便于程序的移植.
    可變參數(shù)的函數(shù)原理其實(shí)很簡(jiǎn)單,而va系列是以宏定義來(lái)定義的,實(shí)現(xiàn)跟堆棧相關(guān).我們寫一個(gè)可變函數(shù)的C函數(shù)時(shí),有利也有弊,所以在不必要的場(chǎng)合,我們無(wú)需用到可變參數(shù).如果在C++里,我們應(yīng)該利用C++的多態(tài)性來(lái)實(shí)現(xiàn)可變參數(shù)的功能,盡量避免用C語(yǔ)言的方式來(lái)實(shí)現(xiàn).