Go 面試官:什么是協程,協程和線程的區別和聯系?
大家好,我是煎魚。
最近金三銀四,是面試的季節。在我的 Go 讀者交流群里出現了許多小伙伴在討論自己面試過程中所遇到的一些 Go 面試題。
今天的男主角,是工程師的必修技能,那就是 “什么是協程,協程和線程的區別和聯系?”
既要理解線程,還要講解協程,并且詮釋兩者間的區別,但是由于提到線程,就必然涉及進程,因此本文將會同時梳理介紹 “進程、協程、協程” 三者的隨筆知識,希望能引發大家的一些思考。
吸魚之路開始。
進程
進程是什么
進程是操作系統對一個正在運行的程序的一種抽象,進程是資源分配的最小單位。
進程在操作系統中的抽象表現
為什么有進程
為什么會有 ”進程“ 呢?說白了還是為了合理壓榨 CPU 的性能和分配運行的時間片,不能 “閑著“。
在計算機中,其計算核心是 CPU,負責所有計算相關的工作和資源。單個 CPU 一次只能運行一個任務。如果一個進程跑著,就把唯一一個 CPU 給完全占住,那是非常不合理的。
那為什么要壓榨 CPU 的性能?因為 CPU 實在是太快,太快,太快了,寄存器僅僅能夠追的上他的腳步,RAM 和別的掛在各總線上的設備則更是望塵莫及。
多進程的緣由
如果總是在運行一個進程上的任務,就會出現一個現象。就是任務不一定總是在執行 ”計算型“ 的任務,會有很大可能是在執行網絡調用,阻塞了,CPU 豈不就浪費了?
進程的上下文切換
這又出現了多進程,多個 CPU,多個進程。多進程就是指計算機系統可以同時執行多個進程,從一個進程到另外一個進程的轉換是由操作系統內核管理的,一般是同時運行多個軟件。
線程
有了多進程,想必在操作系統上可以同時運行多個進程。那么為什么有了進程,還要線程呢?
原因如下:
進程間的信息難以共享數據,父子進程并未共享內存,需要通過進程間通信(IPC),在進程間進行信息交換,性能開銷較大。
創建進程(一般是調用 fork 方法)的性能開銷較大。
大家又把目光轉向了進程內,能不能在進程里做點什么呢?
進程由多個線程組成
一個進程可以由多個稱為線程的執行單元組成。每個線程都運行在進程的上下文中,共享著同樣的代碼和全局數據。
多個進程,就可以有更多的線程。多線程比多進程之間更容易共享數據,在上下文切換中線程一般比進程更高效。
原因如下:
- 線程之間能夠非常方便、快速地共享數據。
- 只需將數據復制到進程中的共享區域就可以了,但需要注意避免多個線程修改同一份內存。
- 創建線程比創建進程要快 10 倍甚至更多。
- 線程都是同一個進程下自家的孩子,像是內存頁、頁表等就不需要了。
協程是怎么回事
協程是什么
協程(Coroutine)是用戶態的線程。通常創建協程時,會從進程的堆中分配一段內存作為協程的棧。
線程的棧有 8 MB,而協程棧的大小通常只有 KB,而 Go 語言的協程更夸張,只有 2-4KB,非常的輕巧。
協程的誕生
根據維基百科的說法,馬爾文·康威于 1958 年發明了術語 “coroutine” 并用于構建匯編程序,關于協程最初的出版解說在 1963 年發表。
也就是歷史上是先有的 “協程”,再有的 “線程”,線程是在在協程的基礎上添加了棧等功能后擴展出來的。
但為什么一開始協程沒有火起來呢?這個比較難考證,大概率還是與 60 年前的計算機時代背景有關。
而如今人們把協程調度的邏輯更進一步抽象為 “等 IO,讓出,IO 完畢”,在此基礎上人們發現協程的方式能解決多線程環境下很多代碼邏輯 “混亂”。
協程的優勢
既然線程似乎已經很好地填補了進程的遺憾,那怎么又出來了一個 “協程”,難道是重復造輪子嗎?
協程的優勢(via InfoQ @八兩)如下:
- 節省 CPU:避免系統內核級的線程頻繁切換,造成的 CPU 資源浪費。好鋼用在刀刃上。而協程是用戶態的線程,用戶可以自行控制協程的創建于銷毀,極大程度避免了系統級線程上下文切換造成的資源浪費。
- 節約內存:在 64 位的Linux中,一個線程需要分配 8MB 棧內存和 64MB 堆內存,系統內存的制約導致我們無法開啟更多線程實現高并發。而在協程編程模式下,可以輕松有十幾萬協程,這是線程無法比擬的。
- 穩定性:前面提到線程之間通過內存來共享數據,這也導致了一個問題,任何一個線程出錯時,進程中的所有線程都會跟著一起崩潰。
- 開發效率:使用協程在開發程序之中,可以很方便的將一些耗時的IO操作異步化,例如寫文件、耗時 IO 請求等。
協程本質上就是用戶態下的線程,所以也有人說協程是 “輕線程”,但我們一定要區分用戶態和內核態的區別,很關鍵。
總結
歸歸根到底,在日常或面試中遇到 “什么是協程,協程和線程的區別和聯系?” 這類問題時,面試者常規會把進程、線程、協程都介紹一遍。
為了方便記憶和詮釋,推薦大家結合故事來講會比較好,這一塊可以參考阮一峰大神翻譯的《進程與線程的一個簡單解釋》,會帶來不少好感。
而最關鍵的部分,在于協程和線程的區別和聯系是什么?
我們可以通過文章中的介紹,從協程 -> 線程的歷史進程來說明。接著進一步對比協程和線程兩者的優勢和缺點,就能比較好的詮釋區別和聯系了。
更優秀的部分,可以詮釋完基本概念和區別后,進一步延伸都你所面試的崗位,例如是 Go 語言,就可以介紹 Go 語言的協程的具體應用和實現。
畢竟,Go 語言可以輕輕松松開數十萬個協程,毫無波瀾。這樣能夠更好的體現你對協程、線程的知識深度和廣度應用,而不是單純的背概念。
參考
線程和進程的區別是什么?
有了多線程,為什么還要有協程?
進程與線程的一個簡單解釋