国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術文章
文章詳情頁

Python lxml庫的簡單介紹及基本使用講解

瀏覽:3日期:2022-07-01 14:43:44
1.lxml庫介紹

lxml是XML和HTML的解析器,其主要功能是解析和提取XML和HTML中的數據;lxml和正則一樣,也是用C語言實現的,是一款高性能的python HTML、XML解析器,也可以利用XPath語法,來定位特定的元素及節點信息

HTML是超文本標記語言,主要用于顯示數據,他的焦點是數據的外觀XML是可擴展標記語言,主要用于傳輸和存儲數據,他的焦點是數據的內容

2.安裝lxml方法

方法1:在cmd運行窗口中輸入:pip install lxml

Python lxml庫的簡單介紹及基本使用講解

方法2:在Pycharm中下載File?Setting?Project?Project Interpreter?點擊右上角的“+”—第1步

Python lxml庫的簡單介紹及基本使用講解

第2步

Python lxml庫的簡單介紹及基本使用講解

第3步

Python lxml庫的簡單介紹及基本使用講解

方法3:進入這個網站進行下載:https://lxml.de/index.html

Python lxml庫的簡單介紹及基本使用講解

3.基本使用

我們可以利用他解析HTML代碼,并且在解析HTML代碼的時候,如果HTML代碼不規范或者不完整,lxml解析器會自動修復或補全代碼,從而提高效率

實例1:解析HTML代碼塊

#提取html中的數據from lxml import etreetext = ’’’<html> <div class='clearfix'> <div class='nav_com'> <ul> <li class='active'><a href='http://www.cgvv.com.cn/' rel='external nofollow' >推薦</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/python' rel='external nofollow' >Python</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/java' rel='external nofollow' >Java</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/web' rel='external nofollow' >前端</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/arch' rel='external nofollow' >架構</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/db' rel='external nofollow' >數據庫</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/5g' rel='external nofollow' >5G</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/game' rel='external nofollow' >游戲開發</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/mobile' rel='external nofollow' >移動開發</a></li> <li class=''><a href='http://www.cgvv.com.cn/nav/ops' rel='external nofollow' >運維</a></li> </ul> </div> </div></html>></html>>’’’#將字符串解析為html文檔html = etree.HTML(text)#print(html)#將字符串序列化為htmlresult = etree.tostring(html).decode(’utf-8’)print(result)

實例2:讀取并解析html文件

#將html文件進行解析from lxml import etree#將html文件進行讀取html = etree.parse(’data.html’)#將html內容序列化result = etree.tostring(html).decode(’utf-8’)print(result)

到此這篇關于Python lxml庫的簡單介紹及基本使用講解的文章就介紹到這了,更多相關Python lxml庫使用內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 日本免费在线 | 国产主播福利片在线观看 | 97精品国产高清在线看入口 | 国产成人精品免费 | 手机国产精品一区二区 | 国产午夜在线观看视频播放 | 久久国产欧美日韩高清专区 | 国产精品午夜国产小视频 | 欧美日韩精彩视频 | 欧美日中文字幕 | 免费观看一级成人毛片 | 一级毛片免费观看不卡的 | 国产成人在线视频网站 | 国内久久| 12345国产精品高清在线 | 一本久久道久久爱 | 亚洲国产欧美目韩成人综合 | 看看免费a一片欧 | 在线观看毛片视频 | 一级一片一a一片 | 欧美成人影院 在线播放 | 婷婷丁香花麻豆 | 日本一区二区三区高清福利视频 | 久久免费精品国产视频 | 亚洲人成网国产最新在线 | 中文字幕在线视频精品 | 动漫精品一区二区 | 久草5| 中文字幕亚洲综合久久男男 | 欧美久久久久欧美一区 | 一色屋色费精品视频在线看 | 久久国产精品高清一区二区三区 | 亚洲在线免费观看 | 久久精品亚洲一级毛片 | 欧美jizz19性欧美 | 亚洲品质自拍视频网站 | 日韩三级视频 | 免费看黄网 | 欧美国产日韩一区二区三区 | 久久久欧美综合久久久久 | 99精品免费视频 |