單個花生超產(chǎn)(打一芯片技術(shù))
單個花生超產(chǎn)(打一芯片技術(shù))
謎底:多核
一個花生要是超產(chǎn)了,必定有多個果仁兒,對吧?果仁兒又叫做“核兒”,所以這個謎底就是“多核”下面介紹一些有趣的多核知識。
多內(nèi)核是指在一枚處理器中集成兩個或多個完整的計算引擎(內(nèi)核)。多核技術(shù)的開發(fā)源于工程師們認(rèn)識到,僅僅提高單核芯片的速度會產(chǎn)生過多熱量且無法帶來相應(yīng)的性能改善,先前的處理器產(chǎn)品就是如此。他們認(rèn)識到,在先前產(chǎn)品中以那種速率,處理器產(chǎn)生的熱量很快會超過太陽表面。即便是沒有熱量問題,其性價比也令人難以接受,速度稍快的處理器價格要高很多。
英特爾工程師們開發(fā)了多核芯片,使之滿足“橫向擴(kuò)展”(而非“縱向擴(kuò)充”)方法,從而提高性能。該架構(gòu)實現(xiàn)了“分治法”戰(zhàn)略。通過劃分任務(wù),線程應(yīng)用能夠充分利用多個執(zhí)行內(nèi)核,并可在特定的時間內(nèi)執(zhí)行更多任務(wù)。多核處理器是單枚芯片(也稱為“硅核”),能夠直接插入單一的處理器插槽中,但操作系統(tǒng)會利用所有相關(guān)的資源,將它的每個執(zhí)行內(nèi)核作為分立的邏輯處理器。通過在兩個執(zhí)行內(nèi)核之間劃分任務(wù),多核處理器可在特定的時鐘周期內(nèi)執(zhí)行更多任務(wù)。
多核架構(gòu)能夠使用的軟件更出色地運行,并創(chuàng)建一個促進(jìn)未來的軟件編寫更趨完善的架構(gòu)。盡管認(rèn)真的軟件廠商還在探索全新的軟件并發(fā)處理模式,但是,隨著向多核處理器的移植,已有軟件無需被修改就可支持多核平臺。操作系統(tǒng)專為充分利用多個處理器而設(shè)計,且無需修改就可運行。為了充分利用多核技術(shù),應(yīng)用開發(fā)人員需要在程序設(shè)計中融入更多思路,但設(shè)計流程與對稱多處理 (SMP) 系統(tǒng)的設(shè)計流程相同,并且單線程應(yīng)用也繼續(xù)運行。
得益于線程技術(shù)的應(yīng)用在多核處理器上運行時將顯示出卓越的性能可擴(kuò)充性。此類軟件包括多媒體應(yīng)用(內(nèi)容創(chuàng)建、編輯,以及本地和數(shù)據(jù)流回放)、工程和其他技術(shù)計算應(yīng)用以及諸如應(yīng)用服務(wù)器和數(shù)據(jù)庫等中間層與后層服務(wù)器應(yīng)用。
多核技術(shù)能夠使服務(wù)器并行處理任務(wù),此前,這可能需要使用多個處理器,多核系統(tǒng)更易于擴(kuò)充,并且能夠在更纖巧的外形中融入更強(qiáng)大的處理性能,這種外形所用的功耗更低、計算功耗產(chǎn)生的熱量更少。多核技術(shù) 是處理器發(fā)展的必然。
為什么要發(fā)展多核
為什么不能用單核的設(shè)計達(dá)到用戶對處理器性能不斷提高的要求呢?答案是功耗問題限制了單核處理器不斷提高性能的發(fā)展途徑。
作為計算機(jī)核心的處理器就是將輸入的數(shù)字化的數(shù)據(jù)和信息,進(jìn)行加工和處理,然后將結(jié)果輸出。假定計算機(jī)的其他子系統(tǒng)不存在瓶頸的話,那么影響計算機(jī)性能高低的核心部件就是處理器。反映在指令上就是處理器執(zhí)行指令的效率。
處理器性能 = 主頻 x IPC
從上面的公式可以看出,衡量處理器性能的主要指標(biāo)是每個時鐘周期內(nèi)可以執(zhí)行的指令數(shù)(IPC: Instruction Per Clock)和處理器的主頻。其實頻率就是每秒鐘做周期性變化的次數(shù),1秒鐘只有1次時鐘周期的改變叫1Hz(赫茲)。主頻為1GHz 就是1秒鐘有10億個時鐘周期。
因此,提高處理器性能就是兩個途徑:提高主頻和提高每個時鐘周期內(nèi)執(zhí)行的指令數(shù)(IPC)。處理器微架構(gòu)的變化可以改變IPC,效率更高的微架構(gòu)可以提高IPC從而提高處理器的性能。但是,對于同一代的架構(gòu),改良架構(gòu)來提高IPC的幅度是非常有限的,所以在單核處理器時代通過提高處理器的主頻來提高性能就成了唯一的手段。
不幸的是,給處理器提高主頻不是沒有止境的,從下面的推導(dǎo)中可以看出,處理器的功耗和處理器內(nèi)部的電流、電壓的平方和主頻成正比,而主頻和電壓成正比。
因為: “處理器功耗 正比于 電流x 電壓 x 電壓 x 主頻”,“主頻 正比于 電壓”
所以:“處理器功耗 正比于 主頻的三次方”
如果通過提高主頻來提高處理器的性能,就會使處理器的功耗以指數(shù)(三次方)而非線性(一次方)的速度急劇上升,很快就會觸及所謂的“頻率的墻”(frequency wall)。過快的能耗上升,使得業(yè)界的多數(shù)廠商尋找另外一個提高處理器性能的因子,提高IPC。
提高IPC可以通過提高指令執(zhí)行的并行度來實現(xiàn),而提高并行度有兩種途徑:一是提高處理英特爾®酷睿™ 架構(gòu)5大優(yōu)勢器微架構(gòu)的并行度;二是采用多核架構(gòu)。
在采用同樣的微架構(gòu)的情況下,為了達(dá)到處理器IPC的目的,我們可以采用多核的方法,同時有效地控制功耗的急劇上升。為什么?看看下面的推導(dǎo)。
因為:“處理器功耗 正比于 電流x 電壓 x 電壓 x 主頻”,“IPC 正比于 電流”
所以:“處理器功耗 正比于 IPC”
由單核處理器增加到雙核處理器,如果主頻不變的話,IPC理論上可以提高一倍,功耗理論上也就最多提高一倍,因為功耗的增加是線性的。而實際情況是,雙核處理器性能達(dá)到單核處理器同等性能的時候,前者的主頻可以更低,因此功耗的下降也是指數(shù)方(三次方)下降的。反映到產(chǎn)品中就是雙核處理器的起跳主頻可以比單核處理器更低,性能更好。
由此可見,將來處理器發(fā)展的趨勢是:為了達(dá)到更高的性能,在采用相同微架構(gòu)的情況下,可以增加處理器的內(nèi)核數(shù)量同時維持較低的主頻。這樣設(shè)計的效果是,更多的并行提高IPC,較低的主頻有效地控制了功耗的上升。
除了多核技術(shù)的運用,采用更先進(jìn)的高能效微架構(gòu)可以進(jìn)一步提高IPC和降低功耗——即提高能效?;谟⑻貭?amp;reg;酷睿™ 架構(gòu)的英特爾® 酷睿™ 2 雙核處理器和至強(qiáng)處理器就是現(xiàn)實中的例子。相比英特爾前一代的NetBurst 微架構(gòu)(Intel® Pentium® 4 和Pentium® D),酷睿微架構(gòu)采用的英特爾® 寬區(qū)動態(tài)執(zhí)行引擎和英特爾® 高級數(shù)字媒體增強(qiáng)技術(shù),就是提高IPC的創(chuàng)新技術(shù);英特爾® 智能功率特性則是降低微架構(gòu)功耗的技術(shù)。
一些芯片的廠商指出,當(dāng)處理器的頻率達(dá)到某種程度后,處理器在工作量的要求會比速度的要求要大,且0.13微米所含的晶體管已很高,將來65納米和45納米,其1組光罩的成本會倍增。但是,這種成本成倍的增長并不會給廠商們帶來相應(yīng)的收入增長。且發(fā)熱量和干擾的因素的介入使得集成度和處理器的頻率已經(jīng)越來越趨近于一個極限。
因此,使摩爾定律失效的有可能是技術(shù),有可能是經(jīng)濟(jì)效益。
處理器實際性能是處理器在每個時鐘周期內(nèi)所能處理器指令數(shù)的總量,因此增加一個內(nèi)核,理論上處理器每個時鐘周期內(nèi)可執(zhí)行的單元數(shù)將增加一倍。原因很簡單,因為它可以并行的執(zhí)行指令,含有幾個內(nèi)核,單位時間可以執(zhí)行的指令數(shù)量上限就會增加幾倍。而在芯片內(nèi)部多嵌入幾個內(nèi)核的難度要遠(yuǎn)遠(yuǎn)比加大內(nèi)核的集成度要簡單很多。于是,多核就能夠在不提高生產(chǎn)難度的前提下,用多個低頻率核心產(chǎn)生超過高頻率單核心的處理效能,特別是服務(wù)器產(chǎn)品需要面對大量并行數(shù)據(jù),多核心分配任務(wù)更能夠提高工作效率??梢钥醋饕环N多處理器協(xié)作的微縮形式,并且達(dá)到更加的性能價格比,一套系統(tǒng)達(dá)到多套系統(tǒng)的性能。
多核的介入,使得摩爾定律在另一個層面的意義上,避免了尷尬的局面。從單核到雙核到多核的發(fā)展就證明了摩爾定律還是非常正確的。從單核到雙核再到多核的發(fā)展,可能是摩爾定律問世以來在芯片發(fā)展歷史上速度最快的性能提升過程。"