国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術(shù)文章
文章詳情頁

xpath - python怎么用lxml處理

瀏覽:93日期:2022-09-22 09:54:52

問題描述

例如:

<p>沒<em><!--red_beg-->aa<!--red_end--></em></p><p>沒<em><!--red_beg-->aa<!--red_end--></em>沒<em><!--red_beg-->aa<!--red_end--></em></p><p>沒</p>

就是在p標(biāo)簽里可能會出現(xiàn)同樣的em標(biāo)簽,而且數(shù)量不定,那我怎么獲取p的內(nèi)容,包括em里的內(nèi)容。例如第二個(gè)p獲取輸出是‘沒aa沒aa’

或者獲取到p節(jié)點(diǎn)之后,怎么把里面的內(nèi)容轉(zhuǎn)換為字符串

問題解答

回答1:

今天偶然學(xué)到處理這個(gè)問題的方法,特意翻出來這個(gè)問題回答。題主你可以看一下xpath的軸,比如你要取得第二個(gè)<p>標(biāo)簽的“沒aa沒aa”,實(shí)際是取得它全部后代節(jié)點(diǎn)的文本內(nèi)容,可以使用element_dom.xpath('//p[2]//descendant::text()')來取得,拿到的結(jié)果是一個(gè)這樣[’沒’, ’aa’, ’沒’, ’aa’]的list,然后自己手動拼接成字符串就可以了,比如''.join(list)。同理,如果你需要進(jìn)行其他操作,也可以使用類似的方法。

回答2:

換bs4,string和text之間的異同就在這里。

回答3:

lxml.html的.text_content()方法,可以獲取當(dāng)前節(jié)點(diǎn)和所有子節(jié)點(diǎn)的文本內(nèi)容。

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 国产精品夜色视频一区二区 | 久色视频在线 | 国产黄色小视频在线观看 | 亚洲成人中文字幕 | 欧美一级成人影院免费的 | 亚洲精品成人a在线观看 | 国产一区二区精品在线观看 | 欧美2区 | 久久99精品久久久久久秒播放器 | 国产欧美日韩精品第一区 | 日本三级日产三级国产三级 | 亚洲激情视频网站 | 日日狠狠久久偷偷四色综合免费 | 一级毛片免费视频观看 | 上海一级毛片 | 欧美美女一区二区三区 | 成人欧美精品久久久久影院 | 狠狠88综合久久久久综合网 | 亚洲欧美一区二区三区综合 | 欧美a极品极品欧美 | 另类在线视频 | 最新亚洲精品国自产在线观看 | 美女张开腿让男人操 | 久久精品视 | 久久香蕉国产线看观看式 | 免费人成在观看 | 成人在线免费视频播放 | 精品日韩欧美一区二区三区在线播放 | 免费一区二区三区久久 | 亚洲国产精品线在线观看 | 91香蕉国产观看免费人人 | 欧美色欧美色 | 成人欧美日韩视频一区 | www.亚洲天堂| 亚洲 欧美 成人 | 精品视频国产狼人视频 | 久久久久久久久久免费视频 | 国产日韩欧美在线一二三四 | 国产人成在线视频 | 99热久久精品免费精品 | 欧美精品久久 |