a標(biāo)簽 url 正則怎么寫(python 或者js)
問(wèn)題描述
<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>
我要取 href里的鏈接
6個(gè)鏈接 前三個(gè)符合條件 正則怎么寫(即鏈接中必須帶有參數(shù)viewkey page viewtype category)
第二個(gè)和第三個(gè)鏈接相同 怎么去重復(fù)(python下)
問(wèn)題解答
回答1:# python 2.7import rea = ’’’<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>’’’print set(re.findall(’’’(?=.*(?:viewkey))(?=.*(?:page))(?=.*(?:viewtype))(?=.*(?:category))href=['’]([^’']+)’’’, a))回答2:
提取前三個(gè)鏈接:
links= re.findall(r’href='http://www.cgvv.com.cn/wenda/(.*?=rf)'’,l_string,re.S)
去重:
new_links=set(links)
相關(guān)文章:
1. java - spring 4.+ 利用reponse 下載文件看不到文件到底有多大,但是能下載成功 ?2. mysql - sql 優(yōu)化問(wèn)題,between比in好?3. javascript - 請(qǐng)問(wèn) chrome 為什么會(huì)重復(fù)加載圖片資源?4. 個(gè)人主頁(yè)博客統(tǒng)計(jì)中的“進(jìn)入博客”不能點(diǎn)擊5. pycharm運(yùn)行python3.6突然出現(xiàn)R6034問(wèn)題,請(qǐng)問(wèn)如何處理?6. html - flask后臺(tái)傳一個(gè)null到前端7. java - 為什么hibernate查詢表集報(bào)錯(cuò)?8. mysql 5個(gè)left關(guān)鍵 然后再用搜索條件 幾千條數(shù)據(jù)就會(huì)卡,如何解決呢9. mysql - 字符串根據(jù)字典替換10. 就一臺(tái)服務(wù)器,mysql數(shù)據(jù)庫(kù)想實(shí)現(xiàn)自動(dòng)備份,如何設(shè)計(jì)?
