淺談C/C++中可變參數的原理

作者：Richard Wei 2012-09-18 13:26:39

以前只是知道C/C++可變參數怎么用，但是一直對它的原理是似懂非懂，現在對計算機有了比較深刻的認識之后，回頭再看，豁然開朗。

要理解可變參數，首先要理解函數調用約定，為什么只有__cdecl的調用約定支持可變參數，而__stdcall就不支持?

實際上__cdecl和__stdcall函數參數都是從右到左入棧，它們的區別在于由誰來清棧，__cdecl由外部調用函數清棧，而__stdcall由被調用函數本身清棧，顯然對于可變參數的函數，函數本身沒法知道外部函數調用它時傳了多少參數，所以沒法支持被調用函數本身清棧(__stdcall), 所以可變參數只能用__cdecll.

另外還要理解函數參數傳遞過程中堆棧是如何生長和變化的，從堆棧低地址到高地址，依次存儲被調用函數局部變量，上一函數堆棧楨基址，函數返回地址，參數1，參數2，參數3...，相關知識可以參考我的這篇堆棧楨的生成原理

有了上面的知識，我可以知道函數調用時，參數2的地址就是參數1的地址加上參數1的長度，而參數3的地址是參數2的地址加上參數2的長度，以此類推。

于是我們可以自己寫可變參數的函數了，代碼如下:

int Sum(int nCount, ) 
{ 
    int nSum = 0; 
    int* p = &nCount; 
    for(int i=0; i<nCount; ++i) 
    { 
        cout << *(++p) << endl; 
        nSum += *p; 
    } 
 
    cout << "Sum:" << nSum << endl << endl; 
    return nSum; 
} 
 
string  SumStr(int nCount, ) 
{ 
    string str; 
    int* p = &nCount; 
 
    for(int i=0; i<nCount; ++i) 
    { 
        char* pTemp = (char*)*(++p); 
        cout <<  pTemp << endl; 
        str += pTemp; 
    } 
 
    cout << "SumStr:" << str << endl; 
    return str; 
}

在我們的測試函數中nCount表示后面可變參數的個數，int Sum(int nCount, [[94242]])會打印后面的可變參數Int值，并且進行累加；string SumStr(int nCount, [[94242]]) 會打印后面可變參數字符串內容，并連接所有字符串。

然后用下面代碼進行測試:int main()

{ 
    Sum(3, 10, 20, 30); 
    SumStr(5, "aa", "bb", "cc", "dd", "ff"); 
     
    system("pause"); 
 
    return 0; 
}

測試結果如下:

可以看到，我們上面的實現有硬編碼的味道，也有沒有做字節對齊，為此系統專門給我們封裝了一些支持可變參數的宏:

//typedef char *  va_list; 
//#define _ADDRESSOF(v)   ( &reinterpret_cast<const char &>(v) ) 
//#define _INTSIZEOF(n)   ( (sizeof(n) + sizeof(int) - 1) & ~(sizeof(int) - 1) ) 
//#define _crt_va_start(ap,v)  ( ap = (va_list)_ADDRESSOF(v) + _INTSIZEOF(v) ) 
//#define _crt_va_arg(ap,t)    ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) ) 
//#define _crt_va_end(ap)      ( ap = (va_list)0 ) 
//#define va_start _crt_va_start 
//#define va_arg _crt_va_arg 
//#define va_end _crt_va_end 
//#define _ADDRESSOF(v)   ( &reinterpret_cast<const char &>(v) ) 
//#define _INTSIZEOF(n)   ( (sizeof(n) + sizeof(int) - 1) & ~(sizeof(int) - 1) ) 
//#define _crt_va_start(ap,v)  ( ap = (va_list)_ADDRESSOF(v) + _INTSIZEOF(v) ) 
//#define _crt_va_arg(ap,t)    ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) ) 
//#define _crt_va_end(ap)      ( ap = (va_list)0 ) 
//#define va_start _crt_va_start 
//#define va_arg _crt_va_arg 
//#define va_end _crt_va_end

用系統的這些宏，我們的代碼可以這樣寫了:

//use va_arg, praram is int 
int SumNew(int nCount, ) 
{ 
    int nSum = 0; 
    va_list vl = 0; 
    va_start(vl, nCount); 
 
    for(int i=0; i<nCount; ++i) 
    { 
        int n = va_arg(vl, int); 
        cout << n << endl; 
        nSum += n; 
    } 
 
    va_end(vl); 
    cout << "SumNew:" << nSum << endl << endl; 
    return nSum; 
} 
 
//use va_arg,  praram is char* 
string SumStrNew(int nCount, ) 
{ 
    string str; 
    va_list vl = 0; 
    va_start(vl, nCount); 
 
    for(int i=0; i<nCount; ++i) 
    { 
        char* p = va_arg(vl, char*); 
        cout <<  p << endl; 
        str += p; 
    } 
 
    cout << "SumStrNew:" << str << endl << endl; 
    return str; 
}

可以看到，其中 va_list實際上只是一個參數指針，va_start根據你提供的最后一個固定參數來獲取第一個可變參數的地址，va_arg將指針指向下一個可變參數然后返回當前值, va_end只是簡單的將指針清0.

用下面的代碼進行測試:

int main()  
{ 
    Sum(3, 10, 20, 30); 
    SumStr(5, "aa", "bb", "cc", "dd", "ff"); 
     
    SumNew(3, 1, 2, 3); 
    SumStrNew(3, "12", "34", "56"); 
 
    system("pause"); 
 
    return 0; 
}

結果如下:

我們上面的例子傳的可變參數都是4字節的，如果我們的可變參數傳的是一個結構體，結果會怎么樣呢?

下面的例子我們傳的可變參數是std::string

//use va_arg,  praram is std::string 
void SumStdString(int nCount, ) 
{ 
    string str; 
    va_list vl = 0; 
    va_start(vl, nCount); 
 
    for(int i=0; i<nCount; ++i) 
    { 
        string p = va_arg(vl, string); 
        cout <<  p << endl; 
        str += p; 
    } 
 
    cout << "SumStdString:" << str << endl << endl; 
} 
int main()  
{ 
Sum(3, 10, 20, 30); 
SumStr(5, "aa", "bb", "cc", "dd", "ff"); 
SumNew(3, 1, 2, 3); 
SumStrNew(3, "12", "34", "56"); 
string s1("hello "); 
string s2("world "); 
string s3("!"); 
SumStdString(3, s1, s2, s3); 
system("pause"); 
return 0; 
}

運行結果如下:

可以看到即使傳入的可變參數是std::string, 依然可以正常工作。

我們可以反匯編下看看這種情況下的參數傳遞過程:

很多時候編譯器在傳遞類對象時，即使是傳值，也會在堆棧上通過push對象地址的方式來傳遞，但是上面顯然沒有這么做，因為它要滿足可變參數的調用約定,

另外，可以看到最后在調用sumStdString后，由add esp, 58h來外部清棧。

一個std::string大小是28, 58h = 88 = 28 + 28 + 28 + 4.

從上面的例子我們可以看到，對于可變參數的函數，有2種東西需要確定，一是可變參數的數量，二是可變參數的類型，上面的例子中，參數數量我們是在第一個參數指定的，參數類型我們是自己約定的。這種方式在實際使用中顯然是不方便，于是我們就有了_vsprintf, 我們根據一個格式化字符串的來表示可變參數的類型和數量，比如C教程中入門就要學習printf, sprintf等。

總的來說可變參數給我們提供了很高的靈活性和方便性，但是也給會造成不確定性，降低我們程序的安全性，很多時候可變參數數量或類型不匹配，就會造成一些不容察覺的問題，只有更好的理解它背后的原理，我們才能更好的駕馭它。

原文鏈接：http://www.cnblogs.com/weiym/archive/2012/09/18/2689917.html

【編輯推薦】

JavaScript寶座：七大框架論劍
為什么程序員總是不能準確估測項目時間
停電后，JavaScript定時器居然變慢了
Java的多進程運行模式分析
黃錦誠：前端工程師新手必讀

責任編輯：彭凡來源：博客園

C C++

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

淺談C/C++中可變參數的原理