文章詳情頁

python - scrapy 爬取pages比實際進入items的多得多？

瀏覽：91日期：2022-07-23 10:55:26

2017-05-12 23:39:52 [scrapy.extensions.logstats] INFO:Crawled 3000 pages (at 61 pages/min), scraped 454 items (at 10 items/min)

為什么我使用scrapy爬取的時候訪問pages要比實際進入items的的多的多?就是爬了半天items里沒有幾條數據入庫的有什么辦法解決么？

問題解答

回答1：

重定向了，你看到了吧，重定向就得請求兩個頁面啊。還有就是看有不有頁面解析發生了錯誤。

Python 編程

上一條：算法 - python ahocorasick 從本地文件讀取文本，進行關鍵字匹配，匹配失敗下一條：運行python程序時出現“應用程序發生異?！钡膬却驽e誤？

相關文章：

1. angular.js - angular內容過長展開收起效果2. 關于nginx location配置的問題，root到底是什么3. angular.js - angularjs的自定義過濾器如何給文字加顏色？4. docker鏡像push報錯5. 關于docker下的nginx壓力測試6. 大家好，請問在python腳本中怎么用virtualenv激活指定的環境？7. 并發模型 - python將進程池放在裝飾器里為什么不生效也沒報錯8. python的前景到底有大？如果不考慮數據挖掘，機器學習這塊？9. python 怎樣用pickle保存類的實例？10. python2安裝失敗

国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

python - scrapy 爬取pages比實際進入items的多得多？