文章詳情頁

python - scrapy抓取知網response的內容重復

瀏覽：110日期：2022-06-27 08:47:44

問題描述

遍歷請求翻頁的url

for i in range(3): yield Request('http:xx/page/%s'%str(i),callback=self.parse_page)

結果response請求成功但是每次內容都一樣的沒變化都是第一次請求時的內容，但是用postman分別請求分頁的url就沒有這問題。= = 是被ban了嗎之前就不會這樣

問題解答

回答1：

那就要分析一下用postman或者瀏覽器訪問時請求的header頭和用scrapy請求頭有什么區別

回答2：

被反爬識別到了

回答3：

看下控制臺打印的log，看看是否正確抓取了下一頁2017-06-29 09:26:13 [scrapy] DEBUG: Scraped from <200 http:xx/page/x>,注意最后一個x(http:xx/page/x)是否是變化的

Python 編程

上一條：PC端訪問卻變成移動端地址問題#python#scrapy下一條：【python小白】問關于導入嵌套的包的問題

相關文章：

1. mac OSX10.12.4 (16E195)下Mysql 5.7.18找不到配置文件my.cnf2. mysql - 怎么生成這個sql表？3. mysql儲存json錯誤4. php - 公眾號文章底部的小程序二維碼如何統計？5. mysql - 表名稱前綴到底有啥用？6. mysql - 數據庫表中，兩個表互為外鍵參考如何解決7. Navicat for mysql 中以json格式儲存的數據存在大量反斜杠，如何去除？8. 在mybatis使用mysql的ON DUPLICATE KEY UPDATE語法實現存在即更新應該使用哪個標簽?9. mysql - 數據庫建字段，默認值空和empty string有什么區別 11010. sql語句 - 如何在mysql中批量添加用戶？

排行榜

					
					angular.js - angular TypeError: Cannot read property ’id’ of undefined？
javascript - 求助：vue2.0中使用element ui遇到的問題
mysql - sysbench cpu測試的結果看不懂，求解
angular.js - 使用angularjs的路由調用界面，從controller上可以調用，但是頁面上獲取不到數據。
javascript - canvas toDataURL()跨域問題
在MySQL中，執行了DELIMITER // 這個語句后分號還有什么作用？
javascript - 切換掉當前頁面后該頁面的js動畫會暫停？
sql語句 - 如何在mysql中批量添加用戶？
javascript - gif動圖導致頁面閃爍的問題
mac OSX10.12.4 (16E195)下Mysql 5.7.18找不到配置文件my.cnf
在mybatis使用mysql的ON DUPLICATE KEY UPDATE語法實現存在即更新應該使用哪個標簽?
				

熱門標簽

国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

python - scrapy抓取知網response的內容重復