淺談Java中IO和NIO的本質(zhì)和區(qū)別
IO的作用就是從外部系統(tǒng)讀取數(shù)據(jù)到j(luò)ava程序中,或者把java程序中輸出的數(shù)據(jù)寫回到外部系統(tǒng)。這里的外部系統(tǒng)可能是磁盤,網(wǎng)絡(luò)流等等。
因?yàn)閷?duì)所有的外部數(shù)據(jù)的處理都是由操作系統(tǒng)內(nèi)核來實(shí)現(xiàn)的,對(duì)于java應(yīng)用程序來說,只是調(diào)用操作系統(tǒng)中相應(yīng)的接口方法,從而和外部數(shù)據(jù)進(jìn)行交互。
所有IO的本質(zhì)就是對(duì)Buffer的處理,我們把數(shù)據(jù)放入Buffer供系統(tǒng)寫入外部數(shù)據(jù),或者從系統(tǒng)Buffer中讀取從外部系統(tǒng)中讀取的數(shù)據(jù)。如下圖所示:
用戶空間也就是我們自己的java程序有一個(gè)Buffer,系統(tǒng)空間也有一個(gè)buffer。所以會(huì)出現(xiàn)系統(tǒng)空間緩存數(shù)據(jù)的情況,這種情況下系統(tǒng)空間將會(huì)直接返回Buffer中的數(shù)據(jù),提升讀取速度。
DMA和虛擬地址空間在繼續(xù)講解之前,我們先講解兩個(gè)操作系統(tǒng)中的基本概念,方便后面我們對(duì)IO的理解。
現(xiàn)代操作系統(tǒng)都有一個(gè)叫做DMA(Direct memory access)的組件。這個(gè)組件是做什么的呢?
一般來說對(duì)內(nèi)存的讀寫都是要交給CPU來完成的,在沒有DMA的情況下,如果程序進(jìn)行IO操作,那么所有的CPU時(shí)間都會(huì)被占用,CPU沒法去響應(yīng)其他的任務(wù),只能等待IO執(zhí)行完成。這在現(xiàn)代應(yīng)用程序中是無法想象的。
如果使用DMA,則CPU可以把IO操作轉(zhuǎn)交給其他的操作系統(tǒng)組件,比如數(shù)據(jù)管理器來操作,只有當(dāng)數(shù)據(jù)管理器操作完畢之后,才會(huì)通知CPU該IO操作完成。現(xiàn)代操作系統(tǒng)基本上都實(shí)現(xiàn)了DMA。
虛擬地址空間也叫做(Virtual address space),為了不同程序的互相隔離和保證程序中地址的確定性,現(xiàn)代計(jì)算機(jī)系統(tǒng)引入了虛擬地址空間的概念。簡(jiǎn)單點(diǎn)講可以看做是跟實(shí)際物理地址的映射,通過使用分段或者分頁的技術(shù),將實(shí)際的物理地址映射到虛擬地址空間。
對(duì)于上面的IO的基本流程圖中,我們可以將系統(tǒng)空間的buffer和用戶空間的buffer同時(shí)映射到虛擬地址空間的同一個(gè)地方。這樣就省略了從系統(tǒng)空間拷貝到用戶空間的步驟。速度會(huì)更快。
同時(shí)為了解決虛擬空間比物理內(nèi)存空間大的問題,現(xiàn)代計(jì)算機(jī)技術(shù)一般都是用了分頁技術(shù)。
分頁技術(shù)就是將虛擬空間分為很多個(gè)page,只有在需要用到的時(shí)候才為該page分配到物理內(nèi)存的映射,這樣物理內(nèi)存實(shí)際上可以看做虛擬空間地址的緩存。
虛擬空間地址分頁對(duì)IO的影響就在于,IO的操作也是基于page來的。
比較常用的page大小有:1,024, 2,048, 和 4,096 bytes。
IO的分類IO可以分為File/Block IO和Stream I/O兩類。
對(duì)于File/Block IO來說,數(shù)據(jù)是存儲(chǔ)在disk中,而disk是由filesystem來進(jìn)行管理的。我們可以通過filesystem來定義file的名字,路徑,文件屬性等內(nèi)容。
filesystem通過把數(shù)據(jù)劃分成為一個(gè)個(gè)的data blocks來進(jìn)行管理。有些blocks存儲(chǔ)著文件的元數(shù)據(jù),有些block存儲(chǔ)著真正的數(shù)據(jù)。
最后filesystem在處理數(shù)據(jù)的過程中,也進(jìn)行了分頁。filesystem的分頁大小可以跟內(nèi)存分頁的大小一致,或者是它的倍數(shù),比如 2,048 或者 8,192 bytes等。
并不是所有的數(shù)據(jù)都是以block的形式存在的,我們還有一類IO叫做stream IO。
stream IO就像是管道流,里面的數(shù)據(jù)是序列被消費(fèi)的。
IO和NIO的區(qū)別java1.0中的IO是流式IO,它只能一個(gè)字節(jié)一個(gè)字節(jié)的處理數(shù)據(jù),所以IO也叫做Stream IO。
而NIO是為了提升IO的效率而生的,它是以Block的方式來讀取數(shù)據(jù)的。
Stream IO中,input輸入一個(gè)字節(jié),output就輸出一個(gè)字節(jié),因?yàn)槭荢tream,所以可以加上過濾器或者過濾器鏈,可以想想一下web框架中的filter chain。在Stream IO中,數(shù)據(jù)只能處理一次,你不能在Stream中回退數(shù)據(jù)。
在Block IO中,數(shù)據(jù)是以block的形式來被處理的,因此其處理速度要比Stream IO快,同時(shí)可以回退處理數(shù)據(jù)。但是你需要自己處理buffer,所以復(fù)雜程度要比Stream IO高。
一般來說Stream IO是阻塞型IO,當(dāng)線程進(jìn)行讀或者寫操作的時(shí)候,線程會(huì)被阻塞。
而NIO一般來說是非阻塞的,也就是說在進(jìn)行讀或者寫的過程中可以去做其他的操作,而讀或者寫操作執(zhí)行完畢之后會(huì)通知NIO操作的完成。
在IO中,主要分為DataOutPut和DataInput,分別對(duì)應(yīng)IO的out和in。
DataOutPut有三大類,分別是Writer,OutputStream和ObjectOutput。
看下他們中的繼承關(guān)系:
DataInput也有三大類,分別是ObjectInput,InputStream和Reader。
看看他們的繼承關(guān)系:
ObjectOutput和ObjectInput類比較少,這里就不列出來了。
統(tǒng)計(jì)一下大概20個(gè)類左右,搞清楚這20個(gè)類的用處,恭喜你java IO你就懂了!
對(duì)于NIO來說比較復(fù)雜一點(diǎn),首先,為了處理block的信息,需要將數(shù)據(jù)讀取到buffer中,所以在NIO中Buffer是一個(gè)非常中要的概念,我們看下NIO中的Buffer:
從上圖我們可以看到NIO中為我們準(zhǔn)備了各種各樣的buffer類型使用。
另外一個(gè)非常重要的概念是channel,channel是NIO獲取數(shù)據(jù)的通道:
NIO需要掌握的類的個(gè)數(shù)比IO要稍稍多一點(diǎn),畢竟NIO要復(fù)雜一點(diǎn)。
以上就是淺談Java中IO和NIO的本質(zhì)和區(qū)別的詳細(xì)內(nèi)容,更多關(guān)于Java中IO和NIO的本質(zhì)和區(qū)別的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. 原生js實(shí)現(xiàn)的觀察者和訂閱者模式簡(jiǎn)單示例2. asp讀取xml文件和記數(shù)3. JS錯(cuò)誤處理與調(diào)試操作實(shí)例分析4. JS實(shí)現(xiàn)表單中點(diǎn)擊小眼睛顯示隱藏密碼框中的密碼5. python基于scrapy爬取京東筆記本電腦數(shù)據(jù)并進(jìn)行簡(jiǎn)單處理和分析6. Python ellipsis 的用法詳解7. 在終端啟動(dòng)Python時(shí)報(bào)錯(cuò)的解決方案8. Python如何實(shí)現(xiàn)感知器的邏輯電路9. 基于android studio的layout的xml文件的創(chuàng)建方式10. PHP實(shí)現(xiàn)基本留言板功能原理與步驟詳解
