Linux冷熱頁機(jī)制概念詳細(xì)介紹

發(fā)布時(shí)間:2024-02-23
linux是一套免費(fèi)使用和自由傳播的類unix操作系統(tǒng),是一個(gè)基于posix和unix的多用戶、多任務(wù)、支持多線程和多cpu的操作系統(tǒng)。它能運(yùn)行主要的unix工具軟件、應(yīng)用程序和網(wǎng)絡(luò)協(xié)議。它支持32位和64位硬件。linux繼承了unix以網(wǎng)絡(luò)為核心的設(shè)計(jì)思想,是一個(gè)性能穩(wěn)定的多用戶網(wǎng)絡(luò)操作系統(tǒng)。linux操作系統(tǒng)是企業(yè)和個(gè)人建站的優(yōu)選操作系統(tǒng),根據(jù)西部數(shù)碼的虛擬主機(jī)租用數(shù)據(jù)顯示,采用linux系統(tǒng)比windows系統(tǒng)的用戶要高,相比windows,linux所支持的wordpress建站系統(tǒng)是用戶選擇它的最大原因。
今天我們來講解linux中的冷熱頁機(jī)制
什么是冷熱頁?
在linux kernel的物理內(nèi)存管理的buddy system中,引入了冷熱頁的概念。冷頁表示該空閑頁已經(jīng)不再高速緩存中了(一般是指l2 cache),熱頁表示該空閑頁仍然在高速緩存中。冷熱頁是針對于每cpu的,每個(gè)zone中,都會針對于所有的cpu初始化一個(gè)冷熱頁的per-cpu-pageset.
為什么要有冷熱頁?
作用有3點(diǎn):
buddy allocator在分配order為0的空閑頁的時(shí)候,如果分配一個(gè)熱頁,那么由于該頁已經(jīng)存在于l2 cache中了。cpu寫訪問的時(shí)候,不需要先把內(nèi)存中的內(nèi)容讀到cache中,然后再寫。如果分配一個(gè)冷頁,說明該頁不在l2 cache中。一般情況下,盡可能用熱頁,是容易理解的。什么時(shí)候用冷頁呢?while allocating a physical page frame, there is a bit specifying whether we would like a hot or a cold page (that is, a page likely to be in the cpu cache, or a page not likely to be there). if the page will be used by the cpu, a hot page will be faster. if the page will be used for device dma the cpu cache would be invalidated anyway, and a cold page does not waste precious cache contents.
簡單翻譯一下:當(dāng)內(nèi)核分配一個(gè)物理頁框時(shí),有一些規(guī)范來約束我們是分配熱頁還是冷頁。當(dāng)頁框是cpu使用的,則分配熱頁。當(dāng)頁框是dma設(shè)備使用的,則分配冷頁。因?yàn)閐ma設(shè)備不會用到cpu高速緩存,所以沒必要使用熱頁。
buddy system在給某個(gè)進(jìn)程分配某個(gè)zone中空閑頁的時(shí)候,首先需要用自旋鎖鎖住該zone,然后分配頁。這樣,如果多個(gè)cpu上的進(jìn)程同時(shí)進(jìn)行分配頁,便會競爭。引入了per-cpu-set后,當(dāng)多個(gè)cpu上的進(jìn)程同時(shí)分配頁的時(shí)候,競爭便不會發(fā)生,提高了效率。另外當(dāng)釋放單個(gè)頁面時(shí),空閑頁面首先放回到per-cpu-pageset中,以減少zone中自旋鎖的使用。當(dāng)頁面緩存中的頁面數(shù)量超過閥值時(shí),再將頁面放回到伙伴系統(tǒng)中。
使用每cpu冷熱頁還有一個(gè)好處是,能保證某個(gè)頁一直黏在1個(gè)cpu上,這有助于提高cache的命中率。
冷熱頁的數(shù)據(jù)結(jié)構(gòu)
struct per_cpu_pages { int count; // number of pages in the list int high; // high watermark, emptying needed int batch; // chunk size for buddy add/remove // lists of pages, one per migrate type stored on the pcp-lists 每個(gè)cpu在每個(gè)zone上都有migrate_pcptypes個(gè)冷熱頁鏈表(根據(jù)遷移類型劃分) struct list_head lists[migrate_pcptypes]; };在linux中,對于uma的架構(gòu),冷熱頁是在一條鏈表上進(jìn)行管理。熱頁在前,冷頁在后。cpu每釋放一個(gè)order為0的頁,如果per-cpu-pageset中的頁數(shù)少于其指定的閾值,便會將釋放的頁插入到冷熱頁鏈表的開始處。這樣,之前插入的熱頁便會隨著其后熱頁源源不斷的插入向后移動,其頁由熱變冷的幾率便大大增加。
怎樣分配冷熱頁
在分配order為0頁的時(shí)候(冷熱頁機(jī)制只處理單頁分配的情況),先找到合適的zone,然后根據(jù)需要的migratetype類型定位冷熱頁鏈表(每個(gè)zone,對于每個(gè)cpu,有3條冷熱頁鏈表,對應(yīng)于:migrate_unmovable、migrate_reclaimable、migrate_movable)。若需要熱頁,則從鏈表頭取下一頁(此頁最“熱”);若需要冷頁,則從鏈表尾取下一頁(此頁最“冷”)。
分配函數(shù)(關(guān)鍵部分已添加注釋):
/* * really, prep_compound_page() should be called from __rmqueue_bulk(). but * we cheat by calling it from here, in the order > 0 path. saves a branch * or two. */ static inline struct page *buffered_rmqueue(struct zone *preferred_zone, struct zone *zone, int order, gfp_t gfp_flags, int migratetype) { unsigned long flags; struct page *page; //分配標(biāo)志是__gfp_cold才分配冷頁 int cold = !!(gfp_flags & __gfp_cold); again: if (likely(order == 0)) { struct per_cpu_pages *pcp; struct list_head *list; local_irq_save(flags); pcp = &this_cpu_ptr(zone->pageset)->pcp; list = &pcp->lists[migratetype]; if (list_empty(list)) { //如果缺少頁,則從buddy system中分配。 pcp->count += rmqueue_bulk(zone, 0, pcp->batch, list, migratetype, cold); if (unlikely(list_empty(list))) goto failed; } if (cold) //分配冷頁時(shí),從鏈表尾部分配,list為鏈表頭,list->prev表示鏈表尾 page = list_entry(list->prev, struct page, lru); else //分配熱頁時(shí),從鏈表頭分配 page = list_entry(list->next, struct page, lru); //分配完一個(gè)頁框后從冷熱頁鏈表中刪去該頁 list_del(&page->lru); pcp->count--; } else {//如果order!=0(頁框數(shù)>1),則不從冷熱頁鏈表中分配 if (unlikely(gfp_flags & __gfp_nofail)) { /* * __gfp_nofail is not to be used in new code. * * all __gfp_nofail callers should be fixed so that they * properly detect and handle allocation failures. * * we most definitely don't want callers attempting to * allocate greater than order-1 page units with * __gfp_nofail. */ warn_on_once(order > 1); } spin_lock_irqsave(&zone->lock, flags); page = __rmqueue(zone, order, migratetype); spin_unlock(&zone->lock); if (!page) goto failed; __mod_zone_page_state(zone, nr_free_pages, -(1 << order)); } __count_zone_vm_events(pgalloc, zone, 1 << order); zone_statistics(preferred_zone, zone, gfp_flags); local_irq_restore(flags); vm_bug_on(bad_range(zone, page)); if (prep_new_page(page, order, gfp_flags)) goto again; return page; failed: local_irq_restore(flags); return null; }
上一個(gè):蘋果生長后期要施鉀肥
下一個(gè):茶葉的沖泡應(yīng)該怎樣把握時(shí)間

網(wǎng)站三級域名是什么意思?三級域名的設(shè)置方法是怎樣的?
數(shù)顯壓力變送器(迅鵬)MP-JQ
單機(jī)紅色警戒之共和國之輝中文版怎樣下載(紅色警戒2之共和國之輝怎么下載安裝)
德國fara電源/高壓電源
幸福樹蚧殼蟲怎么防治?
承諾生效時(shí)合同是否成立
巖韻密碼:三曰
云南普洱茶產(chǎn)區(qū)楚雄州古茶樹資源分布介紹
飲茶禮儀要知道一點(diǎn)
防水接近開關(guān)_LMG-E19-AG1/耐高溫_220VAC
十八禁 网站在线观看免费视频_2020av天堂网_一 级 黄 色 片免费网站_绝顶高潮合集Videos