Linux虛擬地址空間和物理地址空間怎么映射的?
在之前的文章中《CPU是如何訪問內存的?》,我們知道了CPU是如何訪問內存的,本篇文章我們來講下虛擬地址空間和物理地址空間的映射。
通常32位Linux內核地址空間劃分0~3G為用戶空間,3~4G為內核空間。注意這里是32位內核地址空間劃分,64位內核地址空間劃分是不同的。下面以X86為例。
物理地址空間布局
- 物理地址空間的頂部以下一段空間,被PCI設備的I/O內存映射占據,它們的大小和布局由PCI規范所決定。
- 640K~1M這段地址空間被BIOS和VGA適配器所占據。
Linux系統在初始化時,會根據實際的物理內存的大小,為每個物理頁面創建一個page對象,所有的page對象構成一個mem_map數組。
進一步,針對不同的用途,Linux內核將所有的物理頁面劃分到3類內存管理區中,如圖,分別為:
- ZONE_DMA:范圍是0~16M,該區域的物理頁面專門供I/O設備的DMA使用。之所以需要單獨管理DMA的物理頁面,是因為DMA使用物理地址訪問內存,不經過MMU,并且需要連續的緩沖區,所以為了能夠提供物理上連續的緩沖區,必須從物理地址空間專門劃分一段區域用于DMA。
- ZONE_NORMAL:范圍是16M~896M,該區域的物理頁面是內核能夠直接使用的。
- ZONE_HIGHMEM:圍是896M~結束,該區域即為高端內存,內核不能直接使用。
linux虛擬地址內核空間分布
在kernel image下面有16M的內核空間用于DMA操作。位于內核空間高端的128M地址主要由3部分組成,分別為vmalloc area,持久化內核映射區,臨時內核映射區。
由于ZONE_NORMAL和內核線性空間存在直接映射關系,所以內核會將頻繁使用的數據如kernel代碼、GDT、IDT、PGD、mem_map數組等放在ZONE_NORMAL里。而將用戶數據、頁表(PT)等不常用數據放在ZONE_ HIGHMEM里,只在要訪問這些數據時才建立映射關系(kmap())。比如,當內核要訪問I/O設備存儲空間時,就使用ioremap()將位于物理地址高端的mmio區內存映射到內核空間的vmalloc area中,在使用完之后便斷開映射關系。
linux虛擬地址用戶空間分布
用戶進程的代碼區一般從虛擬地址空間的0x08048000開始,這是為了便于檢查空指針。代碼區之上便是數據區,未初始化數據區,堆區,棧區,以及參數、全局環境變量。
linux虛擬地址與物理地址映射的關系
Linux將4G的線性地址空間分為2部分,0~3G為user space,3G~4G為kernel space。
由于開啟了分頁機制,內核想要訪問物理地址空間的話,必須先建立映射關系,然后通過虛擬地址來訪問。為了能夠訪問所有的物理地址空間,就要將全部物理地址空間映射到1G的內核線性空間中,這顯然不可能。于是,內核將0~896M的物理地址空間一對一映射到自己的線性地址空間中,這樣它便可以隨時訪問ZONE_DMA和ZONE_NORMAL里的物理頁面;此時內核剩下的128M線性地址空間不足以完全映射所有的ZONE_HIGHMEM,Linux采取了動態映射的方法,即按需的將ZONE_HIGHMEM里的物理頁面映射到kernel space的***128M線性地址空間里,使用完之后釋放映射關系,以供其它物理頁面映射。雖然這樣存在效率的問題,但是內核畢竟可以正常的訪問所有的物理地址空間了。