文章詳情頁

快速一鍵生成Python爬蟲請求頭

瀏覽：5日期：2022-06-26 13:08:36

今天介紹個神奇的網站！堪稱爬蟲偷懶的神器！

我們在寫爬蟲，構建網絡請求的時候，不可避免地要添加請求頭( headers )，以 mdn 學習區為例，我們的請求頭是這樣的：

快速一鍵生成Python爬蟲請求頭

一般來說，我們只要添加 user-agent 就能滿足絕大部分需求了，Python 代碼如下：

import requestsheaders = { #’authority’: ’developer.mozilla.org’, #’pragma’: ’no-cache’, #’cache-control’: ’no-cache’, #’upgrade-insecure-requests’: ’1’, ’user-agent’: ’Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 YaBrowser/19.7.0.1635 Yowser/2.5 Safari/537.36’, #’accept’: ’text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3’, #’accept-encoding’: ’gzip, deflate, br’, #’accept-language’: ’zh-CN,zh-TW;q=0.9,zh;q=0.8,en-US;q=0.7,en;q=0.6’, #’cookie’: 你的cookie,}response = requests.get(’https://developer.mozilla.org/zh-CN/docs/learn’, headers=headers)

但是有些請求，我們要把特定的 headers 參數添加上才能獲得正確的網絡響應，不知道哪個參數是必要的情況下，就要先把所有參數都添加上，再逐個排除。

但是手動復制粘貼 headers 字典里的每一個鍵值對太費事了

一個不那么方便的解決方案：

用正則表達式或者直接字符串替換，把 headers 字符串直接轉化為字典，封裝成函數方便以后反復調用。

有的人喜歡用這種方法，每次復制headers信息，然后調用自己封裝好的函數，但我覺得還是挺麻煩的。

那么還有沒有快速一鍵生成 Python 爬蟲請求頭的方法呢？這里給大家介紹兩個：

網站在線轉換 Postman實戰演練

抓取網站：https://developer.mozilla.org...

網站在線轉換

1，Chrome 打開開發者選項（ f12 ）---> network 選項卡 ---> 刷新頁面,獲取請求 ---> 找到頁面信息對應的請求 (通過請求的名稱、后綴和 response 內容來判斷)

快速一鍵生成Python爬蟲請求頭

2，右鍵，copy ---> copy as cURL (bash)，注意不是【copy as cURL (cmd)】

快速一鍵生成Python爬蟲請求頭

3，打開網站，https://curl.trillworks.com/，粘貼 cURL (bash) 到左邊 curl command，右邊會自動出 Python 代碼

快速一鍵生成Python爬蟲請求頭

4，生成代碼如下圖

快速一鍵生成Python爬蟲請求頭

5，print ( response.text ) 就可以直接打印網頁源代碼啦！

Postman

1，下載 postman ( Chrome 也有個 postman 的插件，操作應該差不多)

2，打開 postman，彈出的界面可以直接關掉

快速一鍵生成Python爬蟲請求頭

3，import --> paste raw text，在 Chrome 里復制 curl (bash)，粘貼到下面的對話框里，點擊 import 按鈕

快速一鍵生成Python爬蟲請求頭

4，點擊 send，模擬網絡請求，下方可查看源代碼

快速一鍵生成Python爬蟲請求頭

5，確保源代碼正常后，點擊 code

快速一鍵生成Python爬蟲請求頭

6，左上角可以選擇編程語言，右上角復制到剪貼板

快速一鍵生成Python爬蟲請求頭

大功告成！

其實我本人平時都是用第一種，網站比較穩定，基本沒出現過異常；有了這個神器就不用自己再構造請求頭了，先一鍵生成，然后再根據需求調一調就好了，幾秒鐘就搞定了。

以上就是快速一鍵生成Python爬蟲請求頭的詳細內容，更多關于快速一鍵生成Python爬蟲請求頭的資料請關注好吧啦網其它相關文章！

Python 編程

上一條：python re模塊和正則表達式下一條：10個頂級Python實用庫推薦

相關文章：

1. PHP字符串前后字符或空格刪除方法介紹2. css進階學習選擇符3. XML入門的常見問題(一)4. 將properties文件的配置設置為整個Web應用的全局變量實現方法5. Laravel操作session和cookie的教程詳解6. jsp實現登錄界面7. Echarts通過dataset數據集實現創建單軸散點圖8. html小技巧之td,div標簽里內容不換行9. 淺談SpringMVC jsp前臺獲取參數的方式 EL表達式10. 解析原生JS getComputedStyle

排行榜

					
					python 浮點數四舍五入需要注意的地方
Redis Java Lettuce驅動框架原理解析
python批量替換文件名中的共同字符實例
python 實現aes256加密
如何基于windows實現python定時爬蟲
Python 如何將integer轉化為羅馬數(3999以內)
java實現圖形化界面計算器
詳解Java中的不可變對象
Python使用shutil模塊實現文件拷貝
java開發時各類工具的使用規范
關于Java下奇怪的Base64詳解