国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術文章
文章詳情頁

Python爬蟲防封ip的一些技巧

瀏覽:66日期:2022-07-14 18:18:34

在編寫爬蟲爬取數(shù)據(jù)的時候,因為很多網(wǎng)站都有反爬蟲措施,所以很容易被封IP,就不能繼續(xù)爬了。在爬取大數(shù)據(jù)量的數(shù)據(jù)時更是瑟瑟發(fā)抖,時刻擔心著下一秒IP可能就被封了。

本文就如何解決這個問題總結出一些應對措施,這些措施可以單獨使用,也可以同時使用,效果更好。

偽造User-Agent

在請求頭中把User-Agent設置成瀏覽器中的User-Agent,來偽造瀏覽器訪問。比如:

headers ={’User-Agent’:’Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36’} resp = requests.get(url,headers = headers)

還可以先收集多種瀏覽器的User-Agent,每次發(fā)起請求時隨機從中選一個使用,可以進一步提高安全性:

Python爬蟲防封ip的一些技巧

把上面隨機選擇一個User-Agent的代碼封裝成一個函數(shù):

Python爬蟲防封ip的一些技巧

在每次重復爬取之間設置一個隨機時間間隔

比如:

time.sleep(random.randint(0,3)) # 暫停0~3秒的整數(shù)秒,時間區(qū)間:[0,3]

或:

time.sleep(random.random()) # 暫停0~1秒,時間區(qū)間:[0,1)

偽造cookies

若從瀏覽器中可以正常訪問一個頁面,則可以將瀏覽器中的cookies復制過來使用,比如:

Python爬蟲防封ip的一些技巧

注:用瀏覽器cookies發(fā)起請求后,如果請求頻率過于頻繁仍會被封IP,這時可以在瀏覽器上進行相應的手工驗證(比如點擊驗證圖片等),然后就可以繼續(xù)正常使用該cookies發(fā)起請求。

使用代理

可以換著用多個代理IP來進行訪問,防止同一個IP發(fā)起過多請求而被封IP,比如:

附:GitHub上的一個'反反爬蟲'項目

道高一尺魔高一丈,你有反爬蟲措施,那我也有各種'反反爬蟲'的措施,GitHub上就有一位大神專門整理了一個這樣的項目:Anti-Anti-Spider,鏈接地址為:github.com/luyishisi/An可以研究一下。

以上就是Python爬蟲防封ip的一些技巧的詳細內(nèi)容,更多關于Python爬蟲防封ip的資料請關注好吧啦網(wǎng)其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 国产美女作爱全过程免费视频 | 久久小视频 | 欧美日韩在线播放一区二区三区 | 三级中文字幕永久在线视频 | 自拍 第一页 | 韩国激情啪啪 | 欧美亚洲国产视频 | 中文字幕视频免费在线观看 | 国产欧美日韩一区 | 久久久久无码国产精品一区 | 亚洲高清在线观看看片 | 国产一区二区日韩欧美在线 | 国产一级一级一级成人毛片 | 目韩一区二区三区系列片丶 | 欧美激情精品久久久久久久九九九 | 亚洲高清不卡 | 欧美日韩一区二区高清视 | 日本成人免费观看 | 天堂精品高清1区2区3区 | 欧美一区二区三区在线观看 | 日韩精品久久久毛片一区二区 | 爱逼综合网| 99在线视频免费 | 992人人tv香蕉国产精品 | 亚洲精品久久久成人 | 久久福利青草精品免费 | 成人爱做日本视频免费 | 日本欧美一区二区三区视频 | 亚洲综合91社区精品福利 | 欧美亚洲激情视频 | 亚州中文 | 国产成人精品免费视 | 久草勉费视频 | 免费男女乱淫真视频播放 | 免费看香港一级毛片 | 91福利国产在线观看香蕉 | 欧美精品束缚一区二区三区 | 日韩欧美在线观看视频一区二区 | 香蕉香蕉国产片一级一级毛片 | 国产在线精品福利一区二区三区 | 欧美高清性刺激毛片 |