混亂的Linux內(nèi)核實(shí)時(shí)線(xiàn)程優(yōu)先級(jí)
背景
Linux會(huì)把進(jìn)程分為普通進(jìn)程和實(shí)時(shí)進(jìn)程,普通進(jìn)程采用CFS之類(lèi)調(diào)度算法,而實(shí)時(shí)進(jìn)程則是采用SCHED_FIFO或SCHED_RR。
無(wú)論優(yōu)先級(jí)高低,實(shí)時(shí)進(jìn)程都會(huì)優(yōu)先于SCHED_NORMAL中的所有進(jìn)程先執(zhí)行,因?yàn)楹笳呃锩娑际瞧胀ǖ姆菍?shí)時(shí)進(jìn)程。
內(nèi)核線(xiàn)程的優(yōu)先級(jí)
Linux內(nèi)核會(huì)將大量(并且在不斷增加中)工作放置在內(nèi)核線(xiàn)程中,這些線(xiàn)程是在內(nèi)核地址空間中運(yùn)行的特殊進(jìn)程。大多數(shù)內(nèi)核線(xiàn)程運(yùn)行在SCHED_NORMAL類(lèi)中,必須與普通用戶(hù)空間進(jìn)程爭(zhēng)奪CPU時(shí)間。但是有一些內(nèi)核線(xiàn)程它的開(kāi)發(fā)者們認(rèn)為它們非常特殊,應(yīng)該比用戶(hù)空間進(jìn)程要有更高優(yōu)先級(jí)。因此也會(huì)把這些內(nèi)核線(xiàn)程放到SCHED_FIFO中去。
那么問(wèn)題來(lái)了,某個(gè)內(nèi)核線(xiàn)程的實(shí)時(shí)優(yōu)先級(jí)到底該設(shè)為多少呢?
要回答這個(gè)問(wèn)題,不僅需要判斷這個(gè)線(xiàn)程相對(duì)于所有其他實(shí)時(shí)線(xiàn)程是否更加重要,還要跟用戶(hù)態(tài)的實(shí)時(shí)進(jìn)程比較誰(shuí)更重要。這是一個(gè)很難回答的問(wèn)題,更何況在不同的系統(tǒng)和工作模式下這個(gè)答案很有可能還會(huì)各不相同。
所以一般來(lái)說(shuō),內(nèi)核開(kāi)發(fā)人員也就是看心情直接隨便選一個(gè)實(shí)時(shí)優(yōu)先級(jí)。
現(xiàn)在的一些內(nèi)核實(shí)時(shí)線(xiàn)程如下:
最近大神Peter Zijlstra又看到有內(nèi)核開(kāi)發(fā)者隨便給內(nèi)核線(xiàn)程設(shè)置優(yōu)先級(jí),終于看不下去了, 指責(zé)這種把內(nèi)核線(xiàn)程放入SCHED_FIFO的做法毫無(wú)意義:
"the kernel has no clue what actual priority it should use for various things, so it is useless (or worse, counter productive) to even try"
所以他發(fā)了一個(gè)系列[PATCH 00/23] sched: Remove FIFO priorities from modules 把設(shè)置內(nèi)核線(xiàn)程優(yōu)先級(jí)的接口干脆都給刪了,省得再有人瞎搞。
這個(gè)系列Patch(點(diǎn)擊閱讀原文可直達(dá))主要做了下面幾件事情:
刪除了原有的sched_setschedule() / sched_setattr() 接口
增加了
- sched_set_fifo(p)
- sched_set_fifo_low(p)
- sched_set_normal(p, nice)
其中調(diào)用sched_set_fifo()會(huì)將指定進(jìn)程放到SCHED_FIFO類(lèi)中,其優(yōu)先級(jí)為50——這只是min和max之間的一半位置。
對(duì)于需求不那么迫切的線(xiàn)程,sched_set_fifo_low()將優(yōu)先級(jí)設(shè)置為最低值(1)。
而調(diào)用sched_set_normal()會(huì)將線(xiàn)程返回給定好的值SCHED_NORMAL類(lèi)。
通過(guò)只留下這三個(gè)接口可以避免開(kāi)發(fā)者們?cè)俨煌5厝ルS機(jī)選取內(nèi)核線(xiàn)程優(yōu)先級(jí),因?yàn)檫@樣本來(lái)毫無(wú)意義,當(dāng)然如果需要的話(huà)系統(tǒng)管理員還是可以按需調(diào)整不同進(jìn)/線(xiàn)程的優(yōu)先級(jí)。
到目前為止,這個(gè)系列Patch已經(jīng)有不少得到Reviewed-by,相信如果合入后,內(nèi)核線(xiàn)程混亂的優(yōu)先級(jí)狀況會(huì)得到持續(xù)改善。
本文轉(zhuǎn)載自微信公眾號(hào)「 Linux閱碼場(chǎng)」,可以通過(guò)以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系 Linux閱碼場(chǎng)公眾號(hào)。