Go 結(jié)構(gòu)體函數(shù)調(diào)用底層實(shí)現(xiàn)

作者：歷小冰 2021-11-02 12:19:18

我們來(lái)了解一下結(jié)構(gòu)體變量聲明和相關(guān)函數(shù)調(diào)用在機(jī)器碼或匯編層面的體現(xiàn)。我們以下面代碼為案例進(jìn)行分析。

《Go 語(yǔ)言嵌入和多態(tài)機(jī)制對(duì)比》一文中我們了解了 Go 語(yǔ)言的類型系統(tǒng)。下面，我們就來(lái)了解一下 Go 語(yǔ)言是如何實(shí)現(xiàn)類型系統(tǒng)特性，我們將會(huì)深入到 Go 語(yǔ)言運(yùn)行時(shí)和最終機(jī)器碼層面對(duì) Go 語(yǔ)言的結(jié)構(gòu)體、函數(shù)調(diào)用進(jìn)行了解。

上文已經(jīng)提及，Go 語(yǔ)言結(jié)構(gòu)體并非 Java 和 C++ 語(yǔ)言中 class 的概念，下面我們來(lái)了解一下結(jié)構(gòu)體變量聲明和相關(guān)函數(shù)調(diào)用在機(jī)器碼或匯編層面的體現(xiàn)。我們以下面代碼為案例進(jìn)行分析。

func (u User) addAgeVal(a int32) int32 { 
    n := u.Age + a 
    return n 
} 
 
func (u *User) addAgePtr(a int32) int32 { 
    n := u.Age + a 
    return n 
} 
func main() { 
    u := User{ID: 1, Name: "Tom", Age: 23} 
    s1 := u.addAgeVal(1) 
    s2 := u.addAgePtr(2) 
    println(s1 == s2) 
}

將上述代碼使用如下命令編譯成機(jī)器碼，其中 GOOS 指定目標(biāo)操作系統(tǒng)，GOARCH 指定 CPU 架構(gòu)，-S 表示打印機(jī)器碼，-N 是禁止編譯器優(yōu)化，-l 是禁止內(nèi)聯(lián)，本機(jī) Go 版本為 go1.16.4。

GOOS=linux GOARCH=amd64 go tool compile -S -N -l main.go

變量聲明和初始化

我們首先來(lái)看 main 函數(shù)中 u 變量的聲明和初始化過程。匯編代碼較大，下面只截取部分內(nèi)容展示，具體如下所示。

由上可見，結(jié)構(gòu)體真的就是基礎(chǔ)類型變量的集合，并沒有額外其他信息的加載，對(duì)于類型為 User 的 u 變量的聲明并初始化語(yǔ)句，首先將對(duì)應(yīng)的棧內(nèi)空間清零，然后依次處理三個(gè)初始化參數(shù)值，并加載到對(duì)應(yīng)的棧空間位置，完成初始化過程。

其中 ID 和 Age 由于是基礎(chǔ)類型，所以較為簡(jiǎn)單，而 Name 字段涉及到 string 類型，稍有區(qū)別，String類型的運(yùn)行時(shí)表達(dá)，具體如下所示。

type** StringHeader struct { 
    Data uintptr 
    Len int 
}

由此可見上述匯編中首先將 Tom 字面量地址加載到棧內(nèi)空間，Tom 字面量則存儲(chǔ)在內(nèi)存數(shù)據(jù)段中，給 Data 變量賦值，然后將字面量的長(zhǎng)度 3 加載到對(duì)應(yīng)位置，給 Len 變量賦值，具體如下圖所示。

SP 代表?xiàng)ｍ斨羔槪?"".u +64(SP) 代表相對(duì)于棧頂偏移 64 字節(jié)的位置，u 則是引用地址的別名，也正是變量 u 的名稱。如圖所示，在棧空間中，并不存在結(jié)構(gòu)體 User，而是由基礎(chǔ)類型數(shù)值和指針等組成的一段空間，這段空間就代表著結(jié)構(gòu)體 User。

從棧頂向棧底方向依次為占 8 字節(jié)的代表 User.ID 的常量值1，占據(jù) 16 字節(jié)的代表 User.Name 的字符串 Tom 值地址和占據(jù) 8 字節(jié)的代表 User.Age 的常量 23，其中字符串 Tom 又由 8 字節(jié)的 Data 指針和 8 字節(jié)的 Len 組成。

上述代碼中變量 u 未發(fā)生逃逸，所以分配在棧中，如果將變量聲明成指針類型并且符合逃逸規(guī)則，該結(jié)構(gòu)體就會(huì)分配在堆上。

func makeUser() *User { 
    u := &User{ID: 1, Name: "Tom", Age: 23} 
   return u 
}

上述指針變量聲明和初始化過程的匯編如下所示。

可以看出匯編代碼會(huì)首先將 Cat 結(jié)構(gòu)體的類型指針加載到棧頂，作為參數(shù);然后調(diào)用 newObject 函數(shù)來(lái)在堆上按照 Cat 結(jié)構(gòu)體類型分配對(duì)應(yīng)的空間，并返回空間的起始地址;最后使用該起始地址設(shè)置結(jié)構(gòu)體的變量。

分配在堆上的結(jié)構(gòu)體示意圖在上一個(gè)圖的右側(cè)顯示。我們可以看到，當(dāng)結(jié)構(gòu)體分配在棧上時(shí)，其內(nèi)部成員變量會(huì)依次排列，占據(jù)各自固定的空間;而結(jié)構(gòu)體分配在堆上時(shí)，其在棧上只會(huì)存在一個(gè)指向堆地址的指針，該指針指向結(jié)構(gòu)體在堆上的起始位置。

值接收器函數(shù)

下面我們來(lái)看一下結(jié)構(gòu)體作為函數(shù)接收器如何進(jìn)行函數(shù)調(diào)用，包括如何如何傳遞參數(shù)和返回值，如何進(jìn)行值接收器和指針接收器轉(zhuǎn)換等。上述例子中涉及函數(shù)調(diào)用的片段如下所示：

Go 的調(diào)用規(guī)約要求函數(shù)參數(shù)和返回值都通過棧來(lái)傳遞，這部分空間由調(diào)用方在其棧幀(stack frame)上提供。

函數(shù)接收器是隱式的第一個(gè)函數(shù)參數(shù)，所以上述代碼片段的第一步就是講變量 u 拷貝到對(duì)應(yīng)的棧空間上，這也正對(duì)應(yīng)了值接收器的拷貝機(jī)制;
然后第二步則是聲明 int32 類型的值為 1 的參數(shù) a 并分配到指定位置;
接著是使用 CALL 指令調(diào)用 User 的 addAgeVal 函數(shù)，CALL 指令會(huì)將函數(shù)的返回值地址推到棧頂，也就是會(huì)存儲(chǔ)棧的 +40(SP) 位置上;
而最后會(huì)將其值加載到 +60(SP) 上，也就是將函數(shù)返回值賦值給變量 s1。

下面，我們來(lái)看一下被調(diào)用函數(shù) addAgeVal 函數(shù)的相關(guān)機(jī)器碼表達(dá)。

addAgeVal 函數(shù)大致分為四個(gè)步驟：

使用 SUBQ 指令將 SP 減少 16，代表?xiàng)Ｔ鲩L(zhǎng) 16 字節(jié)，因?yàn)闂窍虻臀辉鲩L(zhǎng)，其中 8 個(gè)字節(jié)用于存儲(chǔ)當(dāng)前的棧幀指針，并使用 LEAQ 計(jì)算出新的棧幀指針存到BP中;
初始化函數(shù)返回值，因?yàn)槭瞧漕愋褪?int32，所以將其設(shè)置為對(duì)應(yīng)的零值，棧空間地址是 +64(SP);
從 +48(SP) 位置加載函數(shù)接收器 User 的變量 Age 到 AX 寄存器，然后將其和函數(shù)參數(shù) a 累加，其位置為 +56(SP)
將二者的和賦值給變量 n，并且將二者的和保存到返回值所在棧空間，也就是 +64(SP);
從 8(SP) 中取出舊棧幀指針，并且將棧幀縮小 16 字節(jié)，并調(diào)用 RET 指令返回。

綜上，main 函數(shù)調(diào)用 User 的 addAgeVal 函數(shù)的過程如下圖所示。

如上圖所示，我們看到在 main 函數(shù)執(zhí)行 call 指令前，為調(diào)用函數(shù) addAgeVal 的參數(shù)和返回值準(zhǔn)備好了空間，然后將函數(shù)接收器 u 和對(duì)應(yīng)的參數(shù) a 按照順序拷貝到該空間上，然后預(yù)留 +40(SP) 的位置給函數(shù)調(diào)用的返回值。

也正是因?yàn)橹到邮掌骱秃瘮?shù)參數(shù)發(fā)生拷貝，所以函數(shù)內(nèi)對(duì)其修改不會(huì)影響原值。

調(diào)用 call 指令時(shí)，會(huì)將指令返回地址壓入棧首，然后再執(zhí)行 addAgeVal 函數(shù)的指令，將棧頂增長(zhǎng) 16 字節(jié)，從而導(dǎo)致函數(shù)接收器、參數(shù)和返回值的相對(duì)于SP的地址發(fā)生變化，增加了 16 字節(jié)，所以大家會(huì)發(fā)現(xiàn) addAgeVal 函數(shù)中指令操作的相對(duì)地址發(fā)生了變化。

指針接收器函數(shù)

下面，我們來(lái)看調(diào)用指針接收器函數(shù) addAgePtr 相關(guān)的具體指令，體會(huì)它與值接收器函數(shù)的區(qū)別。

可以看到調(diào)用 addAgePtr 時(shí)不會(huì)對(duì)接收器 u 進(jìn)行拷貝，而只是將 u 的起始棧地址加載到棧頂，這其實(shí)就相當(dāng)于傳遞了指向 u 的指針。然后是設(shè)置參數(shù) a 的值，最后使用 CALL 指令調(diào)用 addAgePtr 函數(shù)。

而 addAgePtr 函數(shù)的指令和 addAgeVal 類似，唯一不同的是要使用指針來(lái)獲取接收器 u 的 Age 變量的值，具體如下所示。

從對(duì)應(yīng)的棧空間取到接收器 u 的指針，也就是其起始地址，從起始地址偏移 24 字節(jié)就是接收器 u 的 Age 變量位置。整個(gè)流程如下圖所示。

如上圖所示，可以看到指針接收器的函數(shù)調(diào)用時(shí)，只需要將其地址作為默認(rèn)參數(shù)進(jìn)行傳遞，所以在函數(shù)內(nèi)的對(duì)接收器的修改，都是直接修改在原值上。

此外，調(diào)用 addAgePtr 的場(chǎng)景是在值變量上調(diào)用指針接收器函數(shù)，我們看到編譯器將值的地址取出作為接收器參數(shù)進(jìn)行傳遞，而如果是指針變量調(diào)用值接收器函數(shù)的話，則會(huì)先對(duì)指針進(jìn)行取地址，然后再將指針指向的值數(shù)據(jù)進(jìn)行拷貝。

綜上，我們了解了 Go 語(yǔ)言中結(jié)構(gòu)器和結(jié)構(gòu)體函數(shù)在機(jī)器層級(jí)方面的底層實(shí)現(xiàn)，后續(xù)文章我們?cè)倮^續(xù)了解 Go 語(yǔ)言相關(guān)特性的底層實(shí)現(xiàn)。

責(zé)任編輯：武曉燕來(lái)源：程序員歷小冰