Linux系統(tǒng)管理：linux內(nèi)存分配方法總結(jié)

打印 | 收藏

內(nèi)存映射結(jié)構(gòu)：

　　1、32位地址線尋址4G的內(nèi)存空間，其中0-3G為用戶程序所獨(dú)有，3G-4G為內(nèi)核占有。

　　2、struct page：整個物理內(nèi)存在初始化時，每個4kb頁面生成一個對應(yīng)的struct page結(jié)構(gòu)，這個page結(jié)構(gòu)就獨(dú)一無二的代表這個物理內(nèi)存頁面，并存放在mem_map全局?jǐn)?shù)組中。

　　3、段式映射：首先根據(jù)代碼段選擇子cs為索引，以GDT值為起始地址的段描述表中選擇出對應(yīng)的段描述符，隨后根據(jù)段描述符的基址，本段長度，權(quán)限信息等進(jìn)行校驗(yàn)，校驗(yàn)成功后。cs：offset中的32位偏移量直接與本段基址相累加，得出最終訪問地址。

　　0-3G與mem_map的映射方式：

　　因linux中采用的段式映射為flat模式，所以從邏輯地址到線性地址沒有變化。從段式出來進(jìn)入頁式，每個用戶進(jìn)程都獨(dú)自擁有一個頁目錄表（pdt），運(yùn)行時存放于CR3。 CR3（頁目錄） + 前10位 => 頁面表基址 + 中10位 => 頁表項(xiàng) + 后12位 => 物理頁面地址

　　3G-4G與mem_map的映射方式：

　　分為三種類型：低端內(nèi)存/普通內(nèi)存/高端內(nèi)存。

　　低端內(nèi)存：3G-3G+16M 用于DMA __pa線性映射

　　普通內(nèi)存：3G+16M-3G+896M __pa線性映射（若物理內(nèi)存<896M，則分界點(diǎn)就在3G+實(shí)際內(nèi)存）

　　高端內(nèi)存：3G+896-4G 采用動態(tài)的分配方式

　　4、高端內(nèi)存(假設(shè)3G+896為高端內(nèi)存起址)

　　作用：訪問到1G以外的物理內(nèi)存空間。

　　線性地址共分為三段：vmalloc段/kmap段/kmap_atomic段（針對與不同的內(nèi)存分配方式）

　　從內(nèi)存分配函數(shù)的結(jié)構(gòu)來看主要分為下面幾個部分：

　　a.伙伴算法(最原始的面向頁的分配方式)

　　alloc_pages 接口：

　　struct page * alloc_page(unsigned int gfp_mask)--分配一頁物理內(nèi)存并返回該頁物理內(nèi)存的page結(jié)構(gòu)指針。

　　struct page * alloc_pages(unsigned int gfp_mask， unsigned int order)--分配個連續(xù)的物理頁并返回分配的第一個物理頁的page結(jié)構(gòu)指針。

　　<釋放函數(shù)：__free_page(s)>

　　內(nèi)核中定義：#define alloc_page(gfp_mask) alloc_pages(gfp_mask， 0)

　　最終都是調(diào)用 __alloc_pages. 其中MAX_ORDER 11，及最大分配到到頁面?zhèn)€數(shù)為2^10（即4M）。

　　分配頁后還不能直接用，需要得到該頁對應(yīng)的虛擬地址：

　　void *page_address(struct page *page)；

　　低端內(nèi)存的映射方式：__va((unsigned long)(page - mem_map) << 12)

　　高端內(nèi)存到映射方式：struct page_address_map分配一個動態(tài)結(jié)構(gòu)來管理高端內(nèi)存。(內(nèi)核是訪問不到vma的3G以下的虛擬地址的) 具體映射由kmap / kmap_atomic執(zhí)行。

　　get_free_page接口：(alloc_pages接口兩步的替代函數(shù))

　　unsigned long get_free_page(unsigned int gfp_mask)

　　unsigned long __get_free_page(unsigned int gfp_mask)

　　Unsigned long __get_free_pages(unsigned int gfp_mask， unsigned int order)

　　<釋放函數(shù)：free_page>

　　與alloc_page(s)系列最大的區(qū)別是無法申請高端內(nèi)存，因?yàn)樗祷氐绞且粋€線性地址，而高端內(nèi)存是需要額外映射才可以訪問的。

　　b.slab高速緩存（反復(fù)分配很多同一大小內(nèi)存）注：使用較少

　　kmem_cache_t* xx_cache；

　　創(chuàng)建： xx_cache = kmem_cache_create(“name”， sizeof(struct xx)， SLAB_HWCACHE_ALIGN， NULL， NULL)；

　　分配： kmem_cache_alloc(xx_cache， GFP_KERNEL)；

　　釋放： kmem_cache_free(xx_cache， addr)；

　　內(nèi)存池

　　mempool 不使用。

　　c.kmalloc（最常用的分配接口）注：必須小于128KB

　　GFP_ATOMIC 不休眠，用于中斷處理等情況

　　GFP_KERNEL 會休眠，一般狀況使用此標(biāo)記

　　GFP_USER 會休眠

　　__GFP_DMA 分配DMA內(nèi)存

　　kmalloc/kfree

　　d.vmalloc/vfree vmalloc采用高端內(nèi)存預(yù)留的虛擬空間來收集內(nèi)存碎片引起的不連續(xù)的物理內(nèi)存頁，是用于非連續(xù)物理內(nèi)存分配。

　　當(dāng)kmalloc分配不到內(nèi)存且無物理內(nèi)存連續(xù)的需求時，可以使用。（優(yōu)先從高端內(nèi)存中查找）

　　e.ioremap()/iounmap()

　　ioremap()的作用是把device寄存器和內(nèi)存的物理地址區(qū)域映射到內(nèi)核虛擬區(qū)域，返回值為內(nèi)核的虛擬地址。使用的線性地址區(qū)間也在vmmlloc段

　　注：

　　vmalloc()與 alloc_pages(_GFP_HIGHMEM)+kmap()；前者不連續(xù)，后者只能映射一個高端內(nèi)存頁面

　　__get_free_pages與alloc_pages(NORMAL)+page_address()；兩者完全等同

　　內(nèi)核地址通過 __va/__pa進(jìn)行中低內(nèi)存的直接映射

　　高端內(nèi)存采用kmap/kmap_atomic的方式來映射

　　個人總結(jié)如下：

　　a.在<128kB的一般內(nèi)存分配時，使用kmalloc

　　允許睡眠：GFP_KERNEL

　　不允許睡眠：GFP_ATOMIC

　　b.在>128kB的內(nèi)存分配時，使用get_free_pages，獲取成片頁面，直接返回虛擬地址（<4M）（或alloc_pages + page_address）

　　c.b失敗，

　　如果要求分配高端內(nèi)存：alloc_pages(_GFP_HIGHMEM)+kmap（僅能映射一個頁面）

　　如果不要求內(nèi)存連續(xù)：則使用vmalloc進(jìn)行分配邏輯連續(xù)的大塊頁面.(不建議)/分配速度較慢，訪問速率較慢。

　　d.頻繁創(chuàng)建和銷毀很多較大數(shù)據(jù)結(jié)構(gòu)，使用slab.

　　e.高端內(nèi)存映射：

　　允許睡眠：kmap (永久映射)

　　不允許睡眠：kmap_atomic (臨時映射)會覆蓋以前到映射（不建議）

上一條：Linux系統(tǒng)管理：Fedora與Ubuntu內(nèi)核比較
下一條：Linux系統(tǒng)管理：截獲Linux操作系統(tǒng)異常處理

射精一区欧美专区|国产精品66xx|亚洲视频一区导航|日韩欧美人妻精品中文|超碰婷婷xxnx|日韩无码综合激情|特级黄片一区二区|四虎日韩成人A√|久久精品内谢片|亚洲成a人无码电影

Linux系統(tǒng)管理：linux內(nèi)存分配方法總結(jié)

相關(guān)文章