Java解析xml文件遇到特殊符號(hào)異常的情況(處理方案)
在一次Java解析xml文件的開發(fā)過程中,使用SAX解析時(shí),出現(xiàn)了這樣一個(gè)異常信息:
Error on line 60 of document : 對(duì)實(shí)體 'xxx' 的引用必須以 ’;’ 分隔符結(jié)尾;
我打開xml文件后,發(fā)現(xiàn)該“xxx'符號(hào)之前跟著一個(gè)”&“符號(hào),后來了解到,這類符號(hào)在xml里屬于一種特殊符號(hào),而特殊符號(hào)若沒用轉(zhuǎn)義符表示,直接用到xml文件里,就會(huì)在使用SAX等方式做解析時(shí)出現(xiàn)奇怪的異常。
其實(shí),這都是因?yàn)檫@些特殊字符造成的。
XML當(dāng)中特殊符號(hào)包括< > & ’ '等,它們是不允許作為xml文件的PCDATA,若想使用話,需用轉(zhuǎn)義符代替:
< <> >& &" '' ’
那么,若要正常讀取xml文件數(shù)據(jù),應(yīng)該如何使用轉(zhuǎn)義符替換呢?
剛開始是想百度一番如何解決,卻發(fā)現(xiàn)好多帖子都是好幾年前的,且都沒有寫清楚怎么個(gè)解決方法,大多都是提到是特殊符號(hào)引起的解析異常,但怎么過濾掉,顯得含糊其辭,因此,只能自己胡亂搗鼓一番,搗鼓出一個(gè)比較合適的將特殊字符過濾的方案。
實(shí)現(xiàn)思路其實(shí)很簡單,我們可以在讀取xml文件使用SAX解析前,先把xml文件通過Reader讀取,然后按行讀取出來拼接成一個(gè)String字符串,再使用字符串的替換方法replaceAll()將特殊符號(hào)進(jìn)行替換,替換后,就可以將字符串形式的xml直接轉(zhuǎn)成Document對(duì)象做xml解析了:
String xmlStr=s.replaceAll('&','&');
轉(zhuǎn)換方法代碼如下:
StringBuffer buffer = new StringBuffer(); BufferedReader bf= new BufferedReader(new FileReader('D:測(cè)試.xml')); String s = null; while((s = bf.readLine())!=null){ buffer.append(s.trim()); } String str = buffer.toString(); //在這一步進(jìn)行字符替換,替換成合法轉(zhuǎn)義字符 String xml=str.replaceAll('&','&'); //這里就可以將處理過的xml文件進(jìn)行讀取解析了 Document document = DocumentHelper.parseText(xml);
至此,就可以解決Java解析xml文件遇到特殊符號(hào)&出現(xiàn)異常的問題了。
以上就是Java解析xml文件遇到特殊符號(hào)異常的情況(處理方案)的詳細(xì)內(nèi)容,更多關(guān)于Java解析xml文件的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. Python如何批量生成和調(diào)用變量2. 基于 Python 實(shí)踐感知器分類算法3. ASP.Net Core對(duì)USB攝像頭進(jìn)行截圖4. Python 中如何使用 virtualenv 管理虛擬環(huán)境5. python利用opencv實(shí)現(xiàn)顏色檢測(cè)6. ASP.NET MVC實(shí)現(xiàn)橫向展示購物車7. 通過CSS數(shù)學(xué)函數(shù)實(shí)現(xiàn)動(dòng)畫特效8. ASP.Net Core(C#)創(chuàng)建Web站點(diǎn)的實(shí)現(xiàn)9. ajax動(dòng)態(tài)加載json數(shù)據(jù)并詳細(xì)解析10. windows服務(wù)器使用IIS時(shí)thinkphp搜索中文無效問題
