我們?cè)贑語(yǔ)言編程中會(huì)遇到一些參數(shù)個(gè)數(shù)可變的函數(shù),例如printf() 這個(gè)函數(shù),它的定義是這樣的:
int printf( const char* format, ...);
它除了有一個(gè)參數(shù)format固定以外,后面跟的參數(shù)的個(gè)數(shù)和類型是
可變的,例如我們可以有以下不同的調(diào)用方法:
printf(\"%d\",i);
printf(\"%s\",s);
printf(\"the number is %d ,string is:%s\", i, s);
究竟如何寫可變參數(shù)的C函數(shù)以及這些可變參數(shù)的函數(shù)編譯器是如何實(shí)現(xiàn)的呢?本文就這個(gè)問(wèn)題進(jìn)行一些探討,希望能對(duì)大家有些幫助.會(huì)C++的網(wǎng)友知道這些問(wèn)題在C++里不存在,因?yàn)镃++具有多態(tài)性.但C++是C的一個(gè)超集,以下的技術(shù)也可以用于C++的程序中.限于本人的水平,文中如果有不當(dāng)之處,請(qǐng)大家指正.
(一)寫一個(gè)簡(jiǎn)單的可變參數(shù)的C函數(shù)
下面我們來(lái)探討如何寫一個(gè)簡(jiǎn)單的可變參數(shù)的C函數(shù).寫可變參數(shù)的C函數(shù)要在程序中用到以下這些宏:
void va_start( va_list arg_ptr, prev_param );
type va_arg( va_list arg_ptr, type );
void va_end( va_list arg_ptr );
va在這里是variable-argument(可變參數(shù))的意思. 這些宏定義在stdarg.h中,所以用到可變參數(shù)的程序應(yīng)該包含這個(gè) 頭文件.下面我們寫一個(gè)簡(jiǎn)單的可變參數(shù)的函數(shù),改函數(shù)至少有一個(gè)整數(shù)參數(shù),第二個(gè)參數(shù)也是整數(shù),是可選的.函數(shù)只是打印這兩個(gè)參數(shù)的值.
void simple_va_fun(int i, ...)
{
va_list arg_ptr;
int j=0;
va_start(arg_ptr, i);
j=va_arg(arg_ptr, int);
va_end(arg_ptr);
printf(\"%d %d\\n\", i, j);
return;
}
我們可以在我們的頭文件中這樣聲明我們的函數(shù):
extern void simple_va_fun(int i, ...);
我們?cè)诔绦蛑锌梢赃@樣調(diào)用:
simple_va_fun(100);
simple_va_fun(100,200);
從這個(gè)函數(shù)的實(shí)現(xiàn)可以看到,我們使用可變參數(shù)應(yīng)該有以下步驟:
1)首先在函數(shù)里定義一個(gè)va_list型的變量,這里是arg_ptr,這個(gè)變量是指向參數(shù)的指針.
2)然后用va_start宏初始化變量arg_ptr,這個(gè)宏的第二個(gè)參數(shù)是第一個(gè)可變參數(shù)的前一個(gè)參數(shù),是一個(gè)固定的參數(shù).
3)然后用va_arg返回可變的參數(shù),并賦值給整數(shù)j. va_arg的第二個(gè)參數(shù)是你要返回的參數(shù)的類型,這里是int型.
4)最后用va_end宏結(jié)束可變參數(shù)的獲取.然后你就可以在函數(shù)里使用第二個(gè)參數(shù)了.如果函數(shù)有多個(gè)可變參數(shù)的,依次調(diào)用va_arg獲取各個(gè)參數(shù).
如果我們用下面三種方法調(diào)用的話,都是合法的,但結(jié)果卻不一樣:
1)simple_va_fun(100);
結(jié)果是:100 -123456789(會(huì)變的值)
2)simple_va_fun(100,200);
結(jié)果是:100 200
3)simple_va_fun(100,200,300);
結(jié)果是:100 200
我們看到第一種調(diào)用有錯(cuò)誤,第二種調(diào)用正確,第三種調(diào)用盡管結(jié)果正確,但和我們函數(shù)最初的設(shè)計(jì)有沖突.下面一節(jié)我們探討出現(xiàn)這些結(jié)果的原因和可變參數(shù)在編譯器中是如何處理的.
(二)可變參數(shù)在編譯器中的處理
我們知道va_start,va_arg,va_end是在stdarg.h中被定義成宏的,由于1)硬件平臺(tái)的不同 2)編譯器的不同,所以定義的宏也有所不同,下面以VC++中stdarg.h里x86平臺(tái)的宏定義摘錄如下(’\\’號(hào)表示折行):
typedef char * va_list;
#define _INTSIZEOF(n) \\
((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) )
#define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) )
#define va_arg(ap,t) \\
( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
#define va_end(ap) ( ap = (va_list)0 )
定義_INTSIZEOF(n)主要是為了某些需要內(nèi)存的對(duì)齊的系統(tǒng).C語(yǔ)言的函數(shù)是從右向左壓入堆棧的,函數(shù)的參數(shù)在堆棧中的分布位置.我
們看到va_list被定義成char*,有一些平臺(tái)或操作系統(tǒng)定義為void*.再看va_start的定義,定義為&v+_INTSIZEOF(v),而&v是固定參數(shù)在堆棧的
地址,所以我們運(yùn)行va_start(ap, v)以后,ap指向第一個(gè)可變參數(shù)在堆棧的地址:
高地址|-----------------------------|
|函數(shù)返回地址 |
|-----------------------------|
|....... |
|-----------------------------|
|第n個(gè)參數(shù)(第一個(gè)可變參數(shù)) |
|-----------------------------|<--va_start后ap指向
|第n-1個(gè)參數(shù)(最后一個(gè)固定參數(shù))|
低地址|-----------------------------|<-- &v
然后,我們用va_arg()取得類型t的可變參數(shù)值,以上例為int型為例,我們看一下va_arg取int型的返回值:
j= ( *(int*)((ap += _INTSIZEOF(int))-_INTSIZEOF(int)) ); 首先ap+=sizeof(int),已經(jīng)指向下一個(gè)參數(shù)的地址了.然后返回
ap-sizeof(int)的int*指針,這正是第一個(gè)可變參數(shù)在堆棧里的地址
然后用*取得這個(gè)地址的內(nèi)容(參數(shù)值)賦給j.
高地址|-----------------------------|
|函數(shù)返回地址 |
|-----------------------------|
|....... |
|-----------------------------|<--va_arg后ap指向
|第n個(gè)參數(shù)(第一個(gè)可變參數(shù)) |
|-----------------------------|<--va_start后ap指向
|第n-1個(gè)參數(shù)(最后一個(gè)固定參數(shù))|
低地址|-----------------------------|<-- &v
最后要說(shuō)的是va_end宏的意思,x86平臺(tái)定義為ap=(char*)0;使ap不再指向堆棧,而是跟NULL一樣.有些直接定義為((void*)0),這樣編譯器不
會(huì)為va_end產(chǎn)生代碼,例如gcc在linux的x86平臺(tái)就是這樣定義的.在這里大家要注意一個(gè)問(wèn)題:由于參數(shù)的地址用于va_start宏,所以參數(shù)不能聲明為寄存器變量或作為函數(shù)或數(shù)組類型.關(guān)于va_start, va_arg, va_end的描述就是這些了,我們要注意的是不同的操作系統(tǒng)和硬件平臺(tái)的定義有些不同,但原理卻是相似的.
(三)可變參數(shù)在編程中要注意的問(wèn)題
因?yàn)関a_start, va_arg, va_end等定義成宏,所以它顯得很愚蠢,可變參數(shù)的類型和個(gè)數(shù)完全在該函數(shù)中由程序代碼控制,它并不能智能
地識(shí)別不同參數(shù)的個(gè)數(shù)和類型. 有人會(huì)問(wèn):那么printf中不是實(shí)現(xiàn)了智能識(shí)別參數(shù)嗎?那是因?yàn)楹瘮?shù)printf是從固定參數(shù)format字符串來(lái)分析出參數(shù)的類型,再調(diào)用va_arg 的來(lái)獲取可變參數(shù)的.也就是說(shuō),你想實(shí)現(xiàn)智能識(shí)別可變參數(shù)的話是要通過(guò)在自己的程序里作判斷來(lái)實(shí)現(xiàn)的. 另外有一個(gè)問(wèn)題,因?yàn)榫幾g器對(duì)可變參數(shù)的函數(shù)的原型檢查不夠嚴(yán)格,對(duì)編程查錯(cuò)不利.如果simple_va_fun()改為:
void simple_va_fun(int i, ...)
{
va_list arg_ptr;
char *s=NULL;
va_start(arg_ptr, i);
s=va_arg(arg_ptr, char*);
va_end(arg_ptr);
printf(\"%d %s\\n\", i, s);
return;
}
可變參數(shù)為char*型,當(dāng)我們忘記用兩個(gè)參數(shù)來(lái)調(diào)用該函數(shù)時(shí),就會(huì)出現(xiàn)core dump(Unix) 或者頁(yè)面非法的錯(cuò)誤(window平臺(tái)).但也有可能不出
錯(cuò),但錯(cuò)誤卻是難以發(fā)現(xiàn),不利于我們寫出高質(zhì)量的程序. 以下提一下va系列宏的兼容性.System V Unix把va_start定義為只有一個(gè)參數(shù)的宏:
va_start(va_list arg_ptr);
而ANSI C則定義為:
va_start(va_list arg_ptr, prev_param);
如果我們要用system V的定義,應(yīng)該用vararg.h頭文件中所定義的
宏,ANSI C的宏跟system V的宏是不兼容的,我們一般都用ANSI C,所以
用ANSI C的定義就夠了,也便于程序的移植.
可變參數(shù)的函數(shù)原理其實(shí)很簡(jiǎn)單,而va系列是以宏定義來(lái)定義的,實(shí)現(xiàn)跟堆棧相關(guān).我們寫一個(gè)可變函數(shù)的C函數(shù)時(shí),有利也有弊,所以在不必要的場(chǎng)合,我們無(wú)需用到可變參數(shù).如果在C++里,我們應(yīng)該利用C++的多態(tài)性來(lái)實(shí)現(xiàn)可變參數(shù)的功能,盡量避免用C語(yǔ)言的方式來(lái)實(shí)現(xiàn).
int printf( const char* format, ...);
它除了有一個(gè)參數(shù)format固定以外,后面跟的參數(shù)的個(gè)數(shù)和類型是
可變的,例如我們可以有以下不同的調(diào)用方法:
printf(\"%d\",i);
printf(\"%s\",s);
printf(\"the number is %d ,string is:%s\", i, s);
究竟如何寫可變參數(shù)的C函數(shù)以及這些可變參數(shù)的函數(shù)編譯器是如何實(shí)現(xiàn)的呢?本文就這個(gè)問(wèn)題進(jìn)行一些探討,希望能對(duì)大家有些幫助.會(huì)C++的網(wǎng)友知道這些問(wèn)題在C++里不存在,因?yàn)镃++具有多態(tài)性.但C++是C的一個(gè)超集,以下的技術(shù)也可以用于C++的程序中.限于本人的水平,文中如果有不當(dāng)之處,請(qǐng)大家指正.
(一)寫一個(gè)簡(jiǎn)單的可變參數(shù)的C函數(shù)
下面我們來(lái)探討如何寫一個(gè)簡(jiǎn)單的可變參數(shù)的C函數(shù).寫可變參數(shù)的C函數(shù)要在程序中用到以下這些宏:
void va_start( va_list arg_ptr, prev_param );
type va_arg( va_list arg_ptr, type );
void va_end( va_list arg_ptr );
va在這里是variable-argument(可變參數(shù))的意思. 這些宏定義在stdarg.h中,所以用到可變參數(shù)的程序應(yīng)該包含這個(gè) 頭文件.下面我們寫一個(gè)簡(jiǎn)單的可變參數(shù)的函數(shù),改函數(shù)至少有一個(gè)整數(shù)參數(shù),第二個(gè)參數(shù)也是整數(shù),是可選的.函數(shù)只是打印這兩個(gè)參數(shù)的值.
void simple_va_fun(int i, ...)
{
va_list arg_ptr;
int j=0;
va_start(arg_ptr, i);
j=va_arg(arg_ptr, int);
va_end(arg_ptr);
printf(\"%d %d\\n\", i, j);
return;
}
我們可以在我們的頭文件中這樣聲明我們的函數(shù):
extern void simple_va_fun(int i, ...);
我們?cè)诔绦蛑锌梢赃@樣調(diào)用:
simple_va_fun(100);
simple_va_fun(100,200);
從這個(gè)函數(shù)的實(shí)現(xiàn)可以看到,我們使用可變參數(shù)應(yīng)該有以下步驟:
1)首先在函數(shù)里定義一個(gè)va_list型的變量,這里是arg_ptr,這個(gè)變量是指向參數(shù)的指針.
2)然后用va_start宏初始化變量arg_ptr,這個(gè)宏的第二個(gè)參數(shù)是第一個(gè)可變參數(shù)的前一個(gè)參數(shù),是一個(gè)固定的參數(shù).
3)然后用va_arg返回可變的參數(shù),并賦值給整數(shù)j. va_arg的第二個(gè)參數(shù)是你要返回的參數(shù)的類型,這里是int型.
4)最后用va_end宏結(jié)束可變參數(shù)的獲取.然后你就可以在函數(shù)里使用第二個(gè)參數(shù)了.如果函數(shù)有多個(gè)可變參數(shù)的,依次調(diào)用va_arg獲取各個(gè)參數(shù).
如果我們用下面三種方法調(diào)用的話,都是合法的,但結(jié)果卻不一樣:
1)simple_va_fun(100);
結(jié)果是:100 -123456789(會(huì)變的值)
2)simple_va_fun(100,200);
結(jié)果是:100 200
3)simple_va_fun(100,200,300);
結(jié)果是:100 200
我們看到第一種調(diào)用有錯(cuò)誤,第二種調(diào)用正確,第三種調(diào)用盡管結(jié)果正確,但和我們函數(shù)最初的設(shè)計(jì)有沖突.下面一節(jié)我們探討出現(xiàn)這些結(jié)果的原因和可變參數(shù)在編譯器中是如何處理的.
(二)可變參數(shù)在編譯器中的處理
我們知道va_start,va_arg,va_end是在stdarg.h中被定義成宏的,由于1)硬件平臺(tái)的不同 2)編譯器的不同,所以定義的宏也有所不同,下面以VC++中stdarg.h里x86平臺(tái)的宏定義摘錄如下(’\\’號(hào)表示折行):
typedef char * va_list;
#define _INTSIZEOF(n) \\
((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) )
#define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) )
#define va_arg(ap,t) \\
( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
#define va_end(ap) ( ap = (va_list)0 )
定義_INTSIZEOF(n)主要是為了某些需要內(nèi)存的對(duì)齊的系統(tǒng).C語(yǔ)言的函數(shù)是從右向左壓入堆棧的,函數(shù)的參數(shù)在堆棧中的分布位置.我
們看到va_list被定義成char*,有一些平臺(tái)或操作系統(tǒng)定義為void*.再看va_start的定義,定義為&v+_INTSIZEOF(v),而&v是固定參數(shù)在堆棧的
地址,所以我們運(yùn)行va_start(ap, v)以后,ap指向第一個(gè)可變參數(shù)在堆棧的地址:
高地址|-----------------------------|
|函數(shù)返回地址 |
|-----------------------------|
|....... |
|-----------------------------|
|第n個(gè)參數(shù)(第一個(gè)可變參數(shù)) |
|-----------------------------|<--va_start后ap指向
|第n-1個(gè)參數(shù)(最后一個(gè)固定參數(shù))|
低地址|-----------------------------|<-- &v
然后,我們用va_arg()取得類型t的可變參數(shù)值,以上例為int型為例,我們看一下va_arg取int型的返回值:
j= ( *(int*)((ap += _INTSIZEOF(int))-_INTSIZEOF(int)) ); 首先ap+=sizeof(int),已經(jīng)指向下一個(gè)參數(shù)的地址了.然后返回
ap-sizeof(int)的int*指針,這正是第一個(gè)可變參數(shù)在堆棧里的地址
然后用*取得這個(gè)地址的內(nèi)容(參數(shù)值)賦給j.
高地址|-----------------------------|
|函數(shù)返回地址 |
|-----------------------------|
|....... |
|-----------------------------|<--va_arg后ap指向
|第n個(gè)參數(shù)(第一個(gè)可變參數(shù)) |
|-----------------------------|<--va_start后ap指向
|第n-1個(gè)參數(shù)(最后一個(gè)固定參數(shù))|
低地址|-----------------------------|<-- &v
最后要說(shuō)的是va_end宏的意思,x86平臺(tái)定義為ap=(char*)0;使ap不再指向堆棧,而是跟NULL一樣.有些直接定義為((void*)0),這樣編譯器不
會(huì)為va_end產(chǎn)生代碼,例如gcc在linux的x86平臺(tái)就是這樣定義的.在這里大家要注意一個(gè)問(wèn)題:由于參數(shù)的地址用于va_start宏,所以參數(shù)不能聲明為寄存器變量或作為函數(shù)或數(shù)組類型.關(guān)于va_start, va_arg, va_end的描述就是這些了,我們要注意的是不同的操作系統(tǒng)和硬件平臺(tái)的定義有些不同,但原理卻是相似的.
(三)可變參數(shù)在編程中要注意的問(wèn)題
因?yàn)関a_start, va_arg, va_end等定義成宏,所以它顯得很愚蠢,可變參數(shù)的類型和個(gè)數(shù)完全在該函數(shù)中由程序代碼控制,它并不能智能
地識(shí)別不同參數(shù)的個(gè)數(shù)和類型. 有人會(huì)問(wèn):那么printf中不是實(shí)現(xiàn)了智能識(shí)別參數(shù)嗎?那是因?yàn)楹瘮?shù)printf是從固定參數(shù)format字符串來(lái)分析出參數(shù)的類型,再調(diào)用va_arg 的來(lái)獲取可變參數(shù)的.也就是說(shuō),你想實(shí)現(xiàn)智能識(shí)別可變參數(shù)的話是要通過(guò)在自己的程序里作判斷來(lái)實(shí)現(xiàn)的. 另外有一個(gè)問(wèn)題,因?yàn)榫幾g器對(duì)可變參數(shù)的函數(shù)的原型檢查不夠嚴(yán)格,對(duì)編程查錯(cuò)不利.如果simple_va_fun()改為:
void simple_va_fun(int i, ...)
{
va_list arg_ptr;
char *s=NULL;
va_start(arg_ptr, i);
s=va_arg(arg_ptr, char*);
va_end(arg_ptr);
printf(\"%d %s\\n\", i, s);
return;
}
可變參數(shù)為char*型,當(dāng)我們忘記用兩個(gè)參數(shù)來(lái)調(diào)用該函數(shù)時(shí),就會(huì)出現(xiàn)core dump(Unix) 或者頁(yè)面非法的錯(cuò)誤(window平臺(tái)).但也有可能不出
錯(cuò),但錯(cuò)誤卻是難以發(fā)現(xiàn),不利于我們寫出高質(zhì)量的程序. 以下提一下va系列宏的兼容性.System V Unix把va_start定義為只有一個(gè)參數(shù)的宏:
va_start(va_list arg_ptr);
而ANSI C則定義為:
va_start(va_list arg_ptr, prev_param);
如果我們要用system V的定義,應(yīng)該用vararg.h頭文件中所定義的
宏,ANSI C的宏跟system V的宏是不兼容的,我們一般都用ANSI C,所以
用ANSI C的定義就夠了,也便于程序的移植.
可變參數(shù)的函數(shù)原理其實(shí)很簡(jiǎn)單,而va系列是以宏定義來(lái)定義的,實(shí)現(xiàn)跟堆棧相關(guān).我們寫一個(gè)可變函數(shù)的C函數(shù)時(shí),有利也有弊,所以在不必要的場(chǎng)合,我們無(wú)需用到可變參數(shù).如果在C++里,我們應(yīng)該利用C++的多態(tài)性來(lái)實(shí)現(xiàn)可變參數(shù)的功能,盡量避免用C語(yǔ)言的方式來(lái)實(shí)現(xiàn).