文章詳情頁(yè)

java - 如何用正則提取html內(nèi)容

瀏覽：117日期：2023-12-04 08:35:21

問(wèn)題描述

<p class='info-detail-head-classify-subname'><a href='http://www.cgvv.com.cn/wenda/11492.html' target='_blank'>財(cái)富</a></p> 想用java 提取財(cái)富兩個(gè)字請(qǐng)問(wèn)用正則怎么提取用jsoup會(huì)不會(huì)簡(jiǎn)單一點(diǎn)

問(wèn)題解答

回答1：

可以使用jsoup和regex, 推薦使用jsoup!jsoup document:https://jsoup.org/cookbook/in...http://www.open-open.com/jsoup/

import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element;import java.util.regex.Matcher; import java.util.regex.Pattern;public class Main { public static void main(String[] args) {// 方法１: jsoup String html = '<p class='info-detail-head-classify-subname'><a href='http://www.cgvv.com.cn/wenda/11492.html' target='_blank'>財(cái)富</a></p>';Document doc = Jsoup.parse(html); Element element = doc.getElementById('info_detail_head_classify_type'); System.out.println(element.text());// 方法2: regex Pattern r = Pattern.compile('<a.*>(.*)</a>'); Matcher m = r.matcher(html); if (m.find()) {System.out.println(m.group(1)); }} }回答2：

<a[^>]*>([^<]*)</a>

取<a></a>中的內(nèi)容

HTML

上一條：java - 反射數(shù)組:為什么每次獲取Modifiers都是public,abstract,以及final下一條：java - Kafka:如果消息的保存策略被設(shè)置為2天，那么在一個(gè)消息被發(fā)布的兩天時(shí)間內(nèi)，它都是可以被消費(fèi)的。之后它將被丟棄以釋放空間。

相關(guān)文章：

1. docker安裝后出現(xiàn)Cannot connect to the Docker daemon.2. 為什么我ping不通我的docker容器呢？？？3. android - webview 自定義加載進(jìn)度條4. mysql - 怎么讓 SELECT 1+null 等于 15. javascript - 微信音樂(lè)分享6. 網(wǎng)頁(yè)爬蟲 - 用Python3的requests庫(kù)模擬登陸B(tài)ilibili總是提示驗(yàn)證碼錯(cuò)誤怎么辦?7. javascript - 微信小程序封裝定位問(wèn)題（封裝異步并可能多次請(qǐng)求）8. 并發(fā)模型 - python將進(jìn)程池放在裝飾器里為什么不生效也沒(méi)報(bào)錯(cuò)9. linux - openSUSE 上,如何使用 QQ?10. python 怎樣用pickle保存類的實(shí)例？

排行榜

					
					android - webview 自定義加載進(jìn)度條
docker安裝后出現(xiàn)Cannot connect to the Docker daemon.
為什么我ping不通我的docker容器呢？？？
javascript - 如何讓移動(dòng)端網(wǎng)頁(yè)的輸入框固定在底部？
java - 請(qǐng)教一個(gè)spring定時(shí)任務(wù)的問(wèn)題
codeigniter本地引用Bootstrap樣式不生效
javascript - html頁(yè)面怎么調(diào)起ios的app
python2安裝失敗
android Textview 設(shè)置超鏈接后    字體變白  點(diǎn)擊后才會(huì)顯示藍(lán)色的超鏈接顏色
關(guān)于docker下的nginx壓力測(cè)試
docker鏡像push報(bào)錯(cuò)
				

熱門標(biāo)簽

国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

java - 如何用正則提取html內(nèi)容