詳解Java 虛擬機(jī)垃圾收集機(jī)制
1 垃圾收集發(fā)生的區(qū)域
之前我們介紹過 Java 內(nèi)存運(yùn)行時區(qū)域的各個部分,其中程序計(jì)數(shù)器、虛擬機(jī)棧、本地方法棧三個區(qū)域隨線程共存亡。棧中的每一個棧幀分配多少內(nèi)存基本上在類結(jié)構(gòu)確定下來時就已知,因此這幾個區(qū)域的內(nèi)存分配和回收都具有確定性,不需要考慮如何回收的問題,當(dāng)方法結(jié)束或線程結(jié)束,內(nèi)存自然也跟著回收了
而 Java 堆和方法區(qū)這兩個區(qū)域則有顯著的不確定性,只有在程序運(yùn)行時我們才能知道程序究竟創(chuàng)建了哪些對象,創(chuàng)建了多少對象,所以這部分內(nèi)存的分配和回收是動態(tài)的,垃圾收集器所關(guān)注的正是這部分內(nèi)存該如何管理
2 如何判定需要被回收的對象?
如果一個對象沒有被其他對象引用,則證明這個對象可以被回收,因?yàn)樗呀?jīng)沒有實(shí)際用途了。那我們怎么去判斷一個對象是否可回收呢?業(yè)界主要有兩種判斷方式:
1. 引用計(jì)數(shù)法在對象中添加一個引用計(jì)數(shù)器,每當(dāng)有一個地方引用它時,計(jì)數(shù)器值加一;當(dāng)引用失效,計(jì)數(shù)器值減一;任何時刻計(jì)數(shù)器值都為零的對象就是不可能再被使用了。這種方法雖然會占用額外的內(nèi)存空間用于計(jì)數(shù),但它的原理簡單,判定效率也高,大多數(shù)情況下它都是一個不錯的算法。然而,這個看似簡單的算法卻需要考慮很多額外情況,否則將無法保證其正確工作,例如單純的引用計(jì)數(shù)法就很難解決對象之間相互循環(huán)引用的問題
2. 可達(dá)性分析算法該算法的基本思路是通過一系列稱為 GC Roots 的根對象作為起始節(jié)點(diǎn)集,從這些節(jié)點(diǎn)開始,根據(jù)引用關(guān)系向下搜索,搜索過程走過的路徑稱為引用鏈。如果某個對象到 GC Roots 間沒有任何引用鏈相連,則證明此對象是不可能再被使用,可以回收
在 Java 技術(shù)體系中,可以作為 GC Roots 的對象包括:
在虛擬機(jī)棧(棧幀中的本地變量表)中引用的對象 方法區(qū)中類靜態(tài)屬性引用的對象 方法區(qū)中常量引用的對象 本地方法棧中 JNI(即通常所說的 Native 方法)引用的對象 Java 虛擬機(jī)內(nèi)部的引用,如基本數(shù)據(jù)類型對應(yīng)的 Class 對象,一些常駐的異常對象(NullPointException、OutOfMemoryError) 所有被同步鎖持有的對象 反映 Java 虛擬機(jī)內(nèi)部情況的 JMXBean、JVMTI 中注冊的回調(diào)、本地代碼緩存等除了這些固定的 GC Roots 集合外,根據(jù)用戶所選用的垃圾收集器以及當(dāng)前回收的內(nèi)存區(qū)域的不同,還可以有其他對象臨時加入,共同構(gòu)成完整的 GC Roots 集合
3 四種引用類型
無論是通過引用計(jì)數(shù)法還是可達(dá)性分析算法,判斷對象是否存活都和引用離不開關(guān)系。在 JDK1.2 以前,Java 里的引用是很傳統(tǒng)的定義:如果 reference 類型的數(shù)據(jù)中存儲的數(shù)值代表的是另外一塊內(nèi)存的起始地址,就稱該 reference 數(shù)據(jù)是代表某塊內(nèi)存、某個對象的引用。這種定義當(dāng)然沒有什么不對,但現(xiàn)在看來顯得太狹隘了,比如我們希望描述一類對象:當(dāng)內(nèi)存空間足夠時,能保留在內(nèi)存中,如果內(nèi)存空間在進(jìn)行了垃圾收集后仍然緊張,則可以拋棄這些對象,很多系統(tǒng)的緩存功能都符合這樣的應(yīng)用場景
JDK1.2 對引用的概念作了補(bǔ)充,將引用分為強(qiáng)引用(Strongly Reference)、軟引用(SoftReference)、弱引用(Weak Reference)和虛引用(Phantom Reference),強(qiáng)度依次減弱
強(qiáng)引用形如 Object obj = new Object() 這種引用關(guān)系就是我們常說的強(qiáng)引用。無論什么情況,只要強(qiáng)引用關(guān)系存在,對象就永遠(yuǎn)不會被回收
軟引用用來描述一些有用但非必須的對象。此類對象只有在進(jìn)行一次垃圾收集仍然沒有足夠內(nèi)存時,才會在第二次垃圾收集時被回收。JDK1.2 之后提供了 SoftReference 類來實(shí)現(xiàn)軟引用
弱引用也是用來描述那些非必須對象,但它的強(qiáng)度比軟引用更弱一些。被軟引用關(guān)聯(lián)的對象只能生存到下一次垃圾收集發(fā)生為止,當(dāng)垃圾收集器開始工作,無論當(dāng)前內(nèi)存是否足夠,都會回收掉只被弱引用關(guān)聯(lián)的對象。JDK1.2 之后提供了 WeakReference 類來實(shí)現(xiàn)軟引用
虛引用最弱的一種引用關(guān)系,一個對象是否存在虛引用,絲毫不會對其生存時間造成任何影響,也無法通過虛引用來取得一個對象實(shí)例。設(shè)置虛引用關(guān)聯(lián)的唯一目的就是讓這個對象被回收時能收到一個系統(tǒng)通知。JDK1.2 之后提供了 PhantomReference 類來實(shí)現(xiàn)軟引用
4 finalize() 方法
在可達(dá)性分析中被判定為不可達(dá)的對象,并不是立即赴死,至少要經(jīng)歷兩次標(biāo)記過程:如果對象在進(jìn)行可達(dá)性分析后發(fā)現(xiàn)沒有與 GC Root 相連接的引用鏈,那么它將被第一次標(biāo)記,隨后再進(jìn)行一次篩選,篩選條件是對象是否有必要執(zhí)行 finalize() 方法,如果對象沒有覆蓋 finalize() 方法或是 finalize() 方法已經(jīng)被調(diào)用過,則都視為“沒有必要執(zhí)行”
如果對象被判定為有必要執(zhí)行 finalize() 方法,那么該對象將會被放置在一個名為 F-Queue 的隊(duì)列之中,并在稍后由一條由虛擬機(jī)自動創(chuàng)建的、低調(diào)度優(yōu)先級的 Finalizer 線程去執(zhí)行它們的 finalize() 方法。注意這里所說的執(zhí)行是指虛擬機(jī)會觸發(fā)這個方法開始運(yùn)行,但并不承諾一定會等待它運(yùn)行結(jié)束。這樣做的原因是防止某個對象的 finalize() 方法執(zhí)行緩慢,或者發(fā)生死循環(huán),導(dǎo)致 F-Queue 隊(duì)列中的其他對象永久處于等待狀態(tài)
finalize() 方法是對象逃脫死亡命運(yùn)的最后一次機(jī)會,稍后收集器將對 F-Queue 中的對象進(jìn)行第二次小規(guī)模標(biāo)記,如果對象希望在 finalize() 方法中成功拯救自己,只要重新與引用鏈上的任何一個對象建立關(guān)聯(lián)即可,那么在第二次標(biāo)記時它將被移出“即將回收”的集合;如果對象這時候還沒有逃脫,那基本上就真的要被回收了
任何一個對象的 finalize() 方法都只會被系統(tǒng)自動調(diào)用一次,如果對象面臨下一次回收,它的 finalize() 方法將不會再執(zhí)行。finalize() 方法運(yùn)行代價高,不確定性大,無法保證各個對象的調(diào)用順序,因此已被官方明確聲明為不推薦使用的語法
5 回收方法區(qū)
方法區(qū)的垃圾收集主要回收兩部分:廢棄的常量和不再使用的類型。判定一個常量是否廢棄相對簡單,與對象類似,只要某個常量不再被引用,就會被清理。而判定一個類型是否屬于“不再被使用的類”的條件就比較苛刻了,需要同時滿足下面三個條件:
該類的所有實(shí)例都已經(jīng)被回收,即 Java 堆中不存在該類及其任何派生子類的實(shí)例 加載該類的類加載器已經(jīng)被回收 該類對應(yīng)的 java.lang.Class 對象沒有在任何地方被引用,無法再任何地方通過反射訪問該類的方法Java 虛擬機(jī)允許對滿足上述三個條件的無用類進(jìn)行回收,但并不是說必然被回收,僅僅是允許而已。關(guān)于是否要對類型進(jìn)行回收,HotSpot 虛擬機(jī)提供了 -Xnoclassgc 參數(shù)進(jìn)行控制
6 分代收集理論
當(dāng)前商業(yè)虛擬機(jī)的垃圾收集器大多數(shù)都遵循了“分代收集”的設(shè)計(jì)理論,分代收集理論其實(shí)是一套符合大多數(shù)程序運(yùn)行實(shí)際情況的經(jīng)驗(yàn)法則,主要建立在兩個分代假說之上:
弱分代假說:絕大多數(shù)對象都是朝生夕滅的 強(qiáng)分代假說:熬過越多次垃圾收集過程的對象就越難以消亡這兩個分代假說共同奠定了多款常用垃圾收集器的一致設(shè)計(jì)原則:收集器應(yīng)該將 Java 堆劃分出不同的區(qū)域,將回收對象依據(jù)年齡(即對象熬過垃圾收集過程的次數(shù))分配到不同的區(qū)域之中存儲,把存活時間短的對象集中在一起,每次回收只關(guān)注如何保留少量存活的對象,即新生代(Young Generation);把難以消亡的對象集中在一起,虛擬機(jī)就可以使用較低的頻率來回收這個區(qū)域,即老年代(Old Generation)
正因?yàn)閯澇隽瞬煌膮^(qū)域,垃圾收集器才可以每次只回收其中一個或多個區(qū)域,因此才有了“Minor GC”、“Major GC”、“Full GC”這樣的回收類型劃分,也才能夠針對不同的區(qū)域采用不同的垃圾收集算法,因而有了“標(biāo)記-復(fù)制”算法、“標(biāo)記-清除”算法、“標(biāo)記-整理”算法
分代收集并非只是簡單劃分一下內(nèi)存區(qū)域,它至少存在一個明顯的困難:對象之間不是孤立的,對象之間會存在跨代引用。假如現(xiàn)在要進(jìn)行只局限于新生代的垃圾收集,根據(jù)前面可達(dá)性分析的知識,與 GC Roots 之間不存在引用鏈即為可回收,但新生代的對象很有可能會被老年代所引用,那么老年代對象將臨時加入 GC Roots 集合中,我們不得不再額外遍歷整個老年代中的所有對象來確保可達(dá)性分析結(jié)果的正確性,這無疑為內(nèi)存回收帶來很大的性能負(fù)擔(dān)。為了解決這個問題,就需要對分代收集理論添加第三條經(jīng)驗(yàn)法則:
跨代引用假說:跨代引用相對于同代引用僅占少數(shù)存在互相引用的兩個對象,應(yīng)該是傾向于同時生存或同時消亡的,舉個例子,如果某個新生代對象存在跨代引用,由于老年代對象難以消亡,會使得新生代對象同樣在收集時得以存活,進(jìn)而年齡增長后晉升到老年代,那么跨代引用也隨之消除了。既然跨帶引用只是少數(shù),那么就沒必要去掃描整個老年代,也不必專門記錄每一個對象是否存在哪些跨代引用,只需在新生代上建立一個全局的數(shù)據(jù)結(jié)構(gòu),稱為記憶集(Remembered Set),這個結(jié)構(gòu)把老年代劃分為若干個小塊,標(biāo)識出老年代的哪一塊內(nèi)存會存在跨代引用。此后當(dāng)發(fā)生 Minor GC 時,只有包含了跨代引用的小塊內(nèi)存里的對象才會被加入 GC Roots 進(jìn)行掃描
7 標(biāo)記 - 清除算法如其名,算法分為標(biāo)記和清除兩個階段:首先標(biāo)記出所有需要回收的對象,在標(biāo)記完成之后,統(tǒng)一回收所有被標(biāo)記的對象,也可以反過來,標(biāo)記存活的對象,統(tǒng)一回收所有未被標(biāo)記的對象。標(biāo)記過程就是對象是否屬于垃圾的判定過程。標(biāo)記 - 清除算法執(zhí)行過程如圖所示:
標(biāo)記 - 清除算法是最基礎(chǔ)的算法,后續(xù)的收集算法都是以標(biāo)記 - 清除算法為基礎(chǔ),對其缺點(diǎn)進(jìn)行改進(jìn),它的主要缺點(diǎn)有兩個:
執(zhí)行效率不穩(wěn)定如果 Java 堆中包含大量對象且大部分需要回收,則必須進(jìn)行大量標(biāo)記和清除的動作‘
內(nèi)存空間碎片化問題標(biāo)記、清除之后會產(chǎn)生大量不連續(xù)的內(nèi)存碎片,內(nèi)存碎片太多會導(dǎo)致下次分配較大對象時無法找到足夠的連續(xù)內(nèi)存,從而不得不提前觸發(fā)一次垃圾收集動作
8 標(biāo)記 - 復(fù)制算法
為了解決標(biāo)記 - 清除算法面對大量可回收對象時執(zhí)行效率低的問題,復(fù)制算法將可用內(nèi)存按容量劃分為大小相等的兩塊,每次只使用其中一塊,當(dāng)這一塊內(nèi)存用完了,就將還存活著的對象復(fù)制到另外一內(nèi)存上,再把已使用過的內(nèi)存空間一次清理掉
如果內(nèi)存中多數(shù)對象都是存活的,這種算法無疑會產(chǎn)生大量內(nèi)存間復(fù)制的開銷,但對于多數(shù)對象都是可回收的情況,算法需要復(fù)制的就是占少數(shù)的存活對象,而且每次都是針對整個半?yún)^(qū)進(jìn)行內(nèi)存回收,分配內(nèi)存時也不用考慮空間碎片的問題,只要移動堆頂指針,按順序分配即可。不過這種算法的缺陷也顯而易見,可用內(nèi)存被縮小為原來的一半
標(biāo)記 - 復(fù)制算法大多用于新生代。實(shí)際上,新生代中的對象大多數(shù)都熬不過第一輪收集,因此不需要按 1:1 的比例來劃分新生代的內(nèi)存空間。具體做法是將新生代劃分為一塊較大的 Eden 區(qū)和兩塊較小的 Survivor 區(qū),每次分配只使用 Eden 區(qū)和其中一塊 Survivor 區(qū)。發(fā)生垃圾收集時,將 Eden 區(qū)和 Survivor 區(qū)中仍然存活的對象一次性復(fù)制到另一個 Survivor 區(qū),然后直接清理掉 Eden 區(qū)和已經(jīng)用過的 Survivor 區(qū)。HotSpot 虛擬機(jī)默認(rèn) Eden 和 Survivor 的大小比例是 8:1:1
當(dāng) Survivor 空間不足以容納一次 Minor GC 之后存活的對象時,就需要依賴其他內(nèi)存區(qū)域(大多是老年代)進(jìn)行分配擔(dān)保,上一次新生代存活下來的對象直接進(jìn)入老年代
9 標(biāo)記 - 整理算法
標(biāo)記 - 復(fù)制算法不適合用在對象存活率高的區(qū)域,而且會浪費(fèi)一半的空間,因此老年代一般不采用這種算法,取而代之的是有針對性的標(biāo)記 - 整理算法。標(biāo)記 - 整理算法的標(biāo)記過程與標(biāo)記 - 清除算法一樣,但后續(xù)步驟不是直接清理可回收對象,而是讓所有存活對象都向內(nèi)存空間的一側(cè)移動,然后直接清理掉邊界以外的內(nèi)存
是否移動回收后的存活對象是一項(xiàng)優(yōu)缺點(diǎn)并存的風(fēng)險決策,尤其是在老年代這種每次回收都有大量對象存活的區(qū)域,移動存活對象并更新其引用將會是一個極為繁重的操作,必須暫停用戶應(yīng)用程序線程才能進(jìn)行,像這樣的停頓行為被稱為“Stop the World”。但如果不考慮移動存活對象,又會影響內(nèi)存分配和訪問的效率,為此使用者必須小心權(quán)衡其中的得失。一種和稀泥式的解決方案就是讓虛擬機(jī)平時采用標(biāo)記 - 清除算法,直到內(nèi)存空間碎片化程度大到影響對象分配時,再采用標(biāo)記 - 整理算法收集一次,已獲得規(guī)整的內(nèi)存空間
以上就是詳解Java 虛擬機(jī)垃圾收集機(jī)制的詳細(xì)內(nèi)容,更多關(guān)于java 虛擬機(jī)垃圾收集機(jī)制的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. Python如何批量生成和調(diào)用變量2. windows服務(wù)器使用IIS時thinkphp搜索中文無效問題3. Python基于requests實(shí)現(xiàn)模擬上傳文件4. python利用opencv實(shí)現(xiàn)顏色檢測5. Python sorted排序方法如何實(shí)現(xiàn)6. Python 中如何使用 virtualenv 管理虛擬環(huán)境7. 通過CSS數(shù)學(xué)函數(shù)實(shí)現(xiàn)動畫特效8. ASP.NET MVC實(shí)現(xiàn)橫向展示購物車9. ASP.Net Core(C#)創(chuàng)建Web站點(diǎn)的實(shí)現(xiàn)10. Python獲取B站粉絲數(shù)的示例代碼
