成人视屏在线观看-国产99精品-国产精品1区2区-欧美一级在线观看-国产一区二区日韩-色九九九

您的位置:首頁技術(shù)文章
文章詳情頁

Python lxml庫的簡單介紹及基本使用講解

瀏覽:9日期:2022-07-01 14:43:44
1.lxml庫介紹

lxml是XML和HTML的解析器,其主要功能是解析和提取XML和HTML中的數(shù)據(jù);lxml和正則一樣,也是用C語言實現(xiàn)的,是一款高性能的python HTML、XML解析器,也可以利用XPath語法,來定位特定的元素及節(jié)點信息

HTML是超文本標記語言,主要用于顯示數(shù)據(jù),他的焦點是數(shù)據(jù)的外觀XML是可擴展標記語言,主要用于傳輸和存儲數(shù)據(jù),他的焦點是數(shù)據(jù)的內(nèi)容

2.安裝lxml方法

方法1:在cmd運行窗口中輸入:pip install lxml

Python lxml庫的簡單介紹及基本使用講解

方法2:在Pycharm中下載File?Setting?Project?Project Interpreter?點擊右上角的“+”—第1步

Python lxml庫的簡單介紹及基本使用講解

第2步

Python lxml庫的簡單介紹及基本使用講解

第3步

Python lxml庫的簡單介紹及基本使用講解

方法3:進入這個網(wǎng)站進行下載:https://lxml.de/index.html

Python lxml庫的簡單介紹及基本使用講解

3.基本使用

我們可以利用他解析HTML代碼,并且在解析HTML代碼的時候,如果HTML代碼不規(guī)范或者不完整,lxml解析器會自動修復(fù)或補全代碼,從而提高效率

實例1:解析HTML代碼塊

#提取html中的數(shù)據(jù)from lxml import etreetext = ’’’<html> <div class='clearfix'> <div class='nav_com'> <ul> <li class='active'><a href='http://www.cgvv.com.cn/' rel='external nofollow' >推薦</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/python' rel='external nofollow' >Python</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/java' rel='external nofollow' >Java</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/web' rel='external nofollow' >前端</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/arch' rel='external nofollow' >架構(gòu)</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/db' rel='external nofollow' >數(shù)據(jù)庫</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/5g' rel='external nofollow' >5G</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/game' rel='external nofollow' >游戲開發(fā)</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/mobile' rel='external nofollow' >移動開發(fā)</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/ops' rel='external nofollow' >運維</a></li> </ul> </div> </div></html>></html>>’’’#將字符串解析為html文檔html = etree.HTML(text)#print(html)#將字符串序列化為htmlresult = etree.tostring(html).decode(’utf-8’)print(result)

實例2:讀取并解析html文件

#將html文件進行解析from lxml import etree#將html文件進行讀取html = etree.parse(’data.html’)#將html內(nèi)容序列化result = etree.tostring(html).decode(’utf-8’)print(result)

到此這篇關(guān)于Python lxml庫的簡單介紹及基本使用講解的文章就介紹到這了,更多相關(guān)Python lxml庫使用內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 亚洲精品视频免费在线观看 | 久草资源在线观看 | 亚洲第一视频在线观看 | 中文字幕中文字幕中中文 | 日韩欧美一区二区久久 | 美女视频黄.免费网址 | 日韩精品一区在线观看 | 性做久久久久免费观看 | 国产精品视频永久免费播放 | 欧美视频一区在线观看 | 欧美不卡在线视频 | 在线观看毛片网站 | 国产三级毛片视频 | 久久免费视频网站 | 国产经典一区 | 日韩在线视频线视频免费网站 | 欧美日韩一区二区在线观看视频 | 天天se天天cao综合网蜜芽 | 九九在线偷拍视频在线播放 | 久久精品国产99久久99久久久 | 国产97在线视频 | 人成免费网站 | 在线精品欧美日韩 | 久久久黄色大片 | 在线视频观看免费视频18 | 中国国产成人精品久久 | 久久精品国产亚洲aa | 一本久道综合久久精品 | 精品久久中文字幕有码 | 中国a级黄色片 | 久久毛片免费看 | 国产精品亚洲专区在线播放 | 国产a级高清版毛片 | 亚洲精品一区二区三区四 | 玖玖国产在线 | 欧美性夜欢 | 特别福利视频在线观看 | aaaa毛片| 亚洲精品国产综合久久一线 | 特级毛片aaaa免费观看 | 久久毛片免费 |