本篇文章帶大家聊聊Node中的各種I/O模型,介紹一下Node的靈魂—非阻塞異步IO,希望對(duì)大家有所幫助!
node.js極速入門課程:進(jìn)入學(xué)習(xí)
【相關(guān)教程推薦:nodejs視頻教程、編程教學(xué)】
我們以網(wǎng)絡(luò)請(qǐng)求IO為例,首先介紹服務(wù)端處理一次完整的網(wǎng)絡(luò)IO請(qǐng)求的典型流程:
應(yīng)用程序獲得一個(gè)操作結(jié)果,通常包括兩個(gè)不同的階段:
-
等待數(shù)據(jù)準(zhǔn)備好
- 從內(nèi)核向進(jìn)程復(fù)制數(shù)據(jù)
以下,我們以 recvfrom
函數(shù)為例,解釋說(shuō)明各種IO模型
阻塞式 I/O 模型(blocking I/O)
阻塞調(diào)用是指調(diào)用結(jié)果返回之前,當(dāng)前線程會(huì)被掛起,調(diào)用線程只有在等待系統(tǒng)內(nèi)核層面所有操作完成之后,調(diào)用才會(huì)結(jié)束。
阻塞I/O造成了cpu的等待I/O,浪費(fèi)了CPU的時(shí)間片。
非阻塞式I/O模型(non-blocking I/O)
相比于前者,非阻塞I/O不帶數(shù)據(jù)直接返回,要獲取數(shù)據(jù),還需要通過(guò)文件描述符再次嘗試讀取數(shù)據(jù)
非阻塞調(diào)用得到返回(并不是真實(shí)的期待數(shù)據(jù))之后,CPU時(shí)間片可以用于處理其他的事情,可以明顯提升性能。
但是隨之而來(lái)的問(wèn)題是,之前的操作并不是一次完整的I/O,返回得到的結(jié)果不是期望得到的業(yè)務(wù)數(shù)據(jù),而僅僅是異步調(diào)用狀態(tài)。
為了獲取完整的數(shù)據(jù),應(yīng)用程序需要重復(fù)調(diào)用IO操作來(lái)確認(rèn)操作是否已經(jīng)完成,這種操作我們稱之為輪詢,常見的幾種輪詢策略如下
忙輪詢
這是最原始,也是性能最低的一種方式,通過(guò)重復(fù)調(diào)用來(lái)檢查I/O狀態(tài)達(dá)到獲取完整數(shù)據(jù)的目的
優(yōu)點(diǎn):編程簡(jiǎn)單
缺點(diǎn):CPU一直耗費(fèi)在輪詢上,同時(shí)影響服務(wù)器性能,因?yàn)槟爿喸冎蠓?wù)器還要進(jìn)行作答
I/O復(fù)用模型(I/O multiplexing)
在 I/O 復(fù)用模型中,會(huì)用到 Select 或 Poll 函數(shù)或 Epoll 函數(shù)(Linux 2.6 以后的內(nèi)核開始支持),這兩個(gè)函數(shù)也會(huì)使進(jìn)程阻塞,但是和阻塞 I/O 有所不同。
這三個(gè)函數(shù)可以同時(shí)阻塞多個(gè) I/O 操作,而且可以同時(shí)對(duì)多個(gè)讀操作,多個(gè)寫操作的 I/O 函數(shù)進(jìn)行檢測(cè),直到有數(shù)據(jù)可讀或可寫時(shí),才真正調(diào)用 I/O 操作函數(shù)。
三種I/O復(fù)用機(jī)制的區(qū)別如下
-
select
由于select采用1024長(zhǎng)度的數(shù)組來(lái)存儲(chǔ)文件狀態(tài),因此最多可以同時(shí)檢測(cè)1024個(gè)文件描述符
-
poll
相比select略有改進(jìn),采用鏈表避免了1024的長(zhǎng)度限制,并且能避免不需要的遍歷檢查,相比select性能稍有改善
-
epoll/kqueue
是linux下效率最高的I/O事件通知機(jī)制,輪詢時(shí)如果沒(méi)有檢測(cè)到I/O事件,將會(huì)進(jìn)行休眠,直到事件發(fā)生將線程喚醒。它是真正利用了事件通知,執(zhí)行回調(diào),而不是遍歷(文件描述符)查詢,因此不會(huì)浪費(fèi)CPU
小結(jié):本質(zhì)上說(shuō),輪詢?nèi)匀皇且环N同步操作,因?yàn)閼?yīng)用程序仍然在等待I/O完全返回,等待期間要么遍歷文件描述狀態(tài),要么休眠等待事件的發(fā)生。
信號(hào)驅(qū)動(dòng)式I/O模型(signal-driven I/O)
在信號(hào)驅(qū)動(dòng)式 I/O 模型中,應(yīng)用程序使用信號(hào)驅(qū)動(dòng) I/O,并安裝一個(gè)信號(hào)處理函數(shù),進(jìn)程繼續(xù)運(yùn)行并不阻塞。
當(dāng)數(shù)據(jù)準(zhǔn)備好時(shí),程序會(huì)收到一個(gè) SIGIO 信號(hào),可以在信號(hào)處理函數(shù)中調(diào)用 I/O 操作函數(shù)處理數(shù)據(jù)。
小結(jié):到此為止,信號(hào)驅(qū)動(dòng)式I/O模型是更加符合我們的異步需求的,程序會(huì)在等待數(shù)據(jù)的過(guò)程中異步執(zhí)行其他的業(yè)務(wù)邏輯。
但是?。。?/strong> 在數(shù)據(jù)從內(nèi)核復(fù)制到用戶空間過(guò)程中依然是阻塞的,并不能算是一場(chǎng)徹底的革命(異步)。
理想中的(Node)非阻塞異步I/O
我們理想中的異步I/O應(yīng)該是應(yīng)用程序發(fā)起非阻塞調(diào)用,無(wú)需通過(guò)輪詢的方式進(jìn)行數(shù)據(jù)獲取,更沒(méi)有必要在數(shù)據(jù)拷貝階段進(jìn)行無(wú)謂的等待,而是能夠在I/O完成之后,通過(guò)信號(hào)或者回調(diào)函數(shù)的方式傳遞給應(yīng)用程序,在此期間應(yīng)用程序可以執(zhí)行其他業(yè)務(wù)邏輯。
實(shí)際的異步I/O
實(shí)際上,linux平臺(tái)下原生支持了異步I/O(AIO),但是目前 AIO 并不完善,因此在 Linux 下實(shí)現(xiàn)高并發(fā)網(wǎng)絡(luò)編程時(shí)都是以 I/O 復(fù)用模型為主。
而Windows 下通過(guò) IOCP 實(shí)現(xiàn)了真正的異步 I/O。
多線程模擬異步I/O
linux平臺(tái)下,Node利用線程池,通過(guò)讓部分線程進(jìn)行阻塞I/O或者非阻塞I/O+輪詢的方式完成數(shù)據(jù)獲取,讓某一個(gè)單獨(dú)的線程進(jìn)行計(jì)算,通過(guò)線程之間的通信,將I/O結(jié)果進(jìn)行傳遞,這樣便實(shí)現(xiàn)了異步I/O的模擬。
其實(shí)Windows平臺(tái)下的IOCP異步異步方案底層也是采用線程池的方式實(shí)現(xiàn)的,所不同的是,后者的線程池是由系統(tǒng)內(nèi)核進(jìn)行托管的。
我們常說(shuō)Node是單線程的,但其實(shí)只能說(shuō)是JS執(zhí)行在單線程中,無(wú)論是*nix還是windows平臺(tái),底層都是利用線程池來(lái)完成I/O操作。