你真的理解內(nèi)存分配嗎？

作者： songsong001 2021-04-23 07:27:31

內(nèi)存是計算機中必不可少的資源，因為 CPU 只能直接讀取內(nèi)存中的數(shù)據(jù)，所以當(dāng) CPU 需要讀取外部設(shè)備(如硬盤)的數(shù)據(jù)時，必須先把數(shù)據(jù)加載到內(nèi)存中。

[[395180]]

我們來看看可愛的內(nèi)存長什么樣子的吧，如圖1所示：

一、內(nèi)存申請

通常使用高級語言(如Go、Java 或 Python 等)都不需要自己管理內(nèi)存(因為有垃圾回收機制)，但 C/C++ 程序員就經(jīng)常要與內(nèi)存打交道。

當(dāng)我們使用 C/C++ 編寫程序時，如果需要使用內(nèi)存，就必須先調(diào)用 malloc 函數(shù)來申請一塊內(nèi)存。但是，malloc 真的是申請了內(nèi)存嗎?

我們通過下面例子來觀察 malloc 到底是不是真的申請了內(nèi)存：

 1#include <stdlib.h> 
 2 
 3int main(int argc, char const *argv[]) 
 4{ 
 5   void *ptr; 
 6 
 7   ptr = malloc(1024 * 1024 * 1024); // 申請 1GB 內(nèi)存 
 8 
 9   sleep(3600); // 睡眠3600秒, 方便調(diào)試 
10 
11   return 0; 
12}

上面的程序主要通過調(diào)用 malloc 函數(shù)來申請了 1GB 的內(nèi)存，然后睡眠 3600 秒，方便我們查看其內(nèi)存使用情況。

現(xiàn)在，我們編譯上面的程序并且運行，如下：

$ gcc malloc.c -o malloc 
$ ./malloc

并且我們打開一個新的終端，然后查看其內(nèi)存使用情況，如圖 2 所示：

圖2 中的 VmRSS 表示進程使用的物理內(nèi)存大小，但我們明明申請了 1GB 的內(nèi)存，為什么只顯示使用 404KB 的內(nèi)存呢?這里就涉及到虛擬內(nèi)存和物理內(nèi)存的概念了。

二、物理內(nèi)存與虛擬內(nèi)存

下面先來介紹一下物理內(nèi)存與虛擬內(nèi)存的概念：

物理內(nèi)存：也就是安裝在計算機中的內(nèi)存條，比如安裝了 2GB 大小的內(nèi)存條，那么物理內(nèi)存地址的范圍就是 0 ~ 2GB。
虛擬內(nèi)存：虛擬的內(nèi)存地址。由于 CPU 只能使用物理內(nèi)存地址，所以需要將虛擬內(nèi)存地址轉(zhuǎn)換為物理內(nèi)存地址才能被 CPU 使用，這個轉(zhuǎn)換過程由 MMU(Memory Management Unit，內(nèi)存管理單元) 來完成。虛擬內(nèi)存大小不受物理內(nèi)存大小的限制，在 32 位的操作系統(tǒng)中，每個進程的虛擬內(nèi)存空間大小為 0 ~ 4GB。

程序中使用的內(nèi)存地址都是虛擬內(nèi)存地址，也就是說，我們通過 malloc 函數(shù)申請的內(nèi)存都是虛擬內(nèi)存。實際上，內(nèi)核會為每個進程管理其虛擬內(nèi)存空間，并且會把虛擬內(nèi)存空間劃分為多個區(qū)域，如圖3 所示：

我們來分析一下這些區(qū)域的作用：

代碼段：用于存放程序的可執(zhí)行代碼。
數(shù)據(jù)段：用于存放程序的全局變量和靜態(tài)變量。
堆空間：用于存放由 malloc 申請的內(nèi)存。
棧空間：用于存放函數(shù)的參數(shù)和局部變量。
內(nèi)核空間：存放 Linux 內(nèi)核代碼和數(shù)據(jù)。

三、brk指針

由此可知，通過 malloc 函數(shù)申請的內(nèi)存地址是由堆空間分配的(其實還有可能從 mmap 區(qū)分配，這種情況暫時忽略)。在內(nèi)核中，使用一個名為 brk 的指針來表示進程的堆空間的頂部，如圖4 所示：

所以，通過移動 brk 指針就可以達到申請(向上移動)和釋放(向下移動)堆空間的內(nèi)存。例如申請 1024 字節(jié)時，只需要把 brk 向上移動 1024 字節(jié)即可，如圖5 所示：

事實上，malloc 函數(shù)就是通過移動 brk 指針來實現(xiàn)申請和釋放內(nèi)存的，Linux 提供了一個名為 brk() 的系統(tǒng)調(diào)用來移動 brk 指針。

四、內(nèi)存映射

現(xiàn)在我們知道，malloc 函數(shù)只是移動 brk 指針，但并沒有申請物理內(nèi)存。前面我們介紹虛擬內(nèi)存和物理內(nèi)存的時候介紹過，虛擬內(nèi)存地址必須映射到物理內(nèi)存地址才能被使用。如圖6 所示：

如果對沒有進行映射的虛擬內(nèi)存地址進行讀寫操作，那么將會發(fā)生缺頁異常。Linux 內(nèi)核會對缺頁異常進行修復(fù)，修復(fù)過程如下：

獲取觸發(fā) 缺頁異常的虛擬內(nèi)存地址(讀寫哪個虛擬內(nèi)存地址導(dǎo)致的)。
查看此虛擬內(nèi)存地址是否被申請(是否在 brk 指針內(nèi))，如果不在 brk 指針內(nèi)，將會導(dǎo)致 Segmention Fault 錯誤(也就是常見的coredump)，進程將會異常退出。
如果虛擬內(nèi)存地址在 brk 指針內(nèi)，那么將此虛擬內(nèi)存地址映射到物理內(nèi)存地址上，完成缺頁異常修復(fù)過程，并且返回到觸發(fā)異常的地方進行運行。

從上面的過程可以看出，不對申請的虛擬內(nèi)存地址進行讀寫操作是不會觸發(fā)申請新的物理內(nèi)存。所以，這就解釋了為什么申請 1GB 的內(nèi)存，但實際上只使用了 404 KB 的物理內(nèi)存。

五、總結(jié)

本文主要解釋了內(nèi)存申請的原理，并且了解到 malloc 申請的只是虛擬內(nèi)存，而且物理內(nèi)存的申請延遲到對虛擬內(nèi)存進行讀寫的時候，這樣做可以減輕進程對物理內(nèi)存使用的壓力。

責(zé)任編輯：武曉燕來源： Linux內(nèi)核那些事

內(nèi)存分配 CPU

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看