文章詳情頁

python - Scrapy如何得到原始的start_url

瀏覽：149日期：2022-06-27 15:45:21

問題描述

Scrapy爬蟲時，由于重定向或是其他原因，會導(dǎo)致原始的start_url發(fā)生改變，怎樣才能得到原始的start_url?

def start_requests(self): start_url = ’your_scrapy_start_url’ yield Request(start_url, self.parse) def parse(self, response): item = YourItem() item[’start_url’] = 原始請求的start_url yield item

問題解答

回答1：

參考文章：Scrapy爬蟲常見問題總結(jié)

利用Request中的meta參數(shù)傳遞信息

def start_requests(self): start_url = ’your_scrapy_start_url’ yield Request(start_url, self.parse, meta={’start_url’:start_url}) def parse(self, response): item = YourItem() item[’start_url’] = response.meta[’start_url’] yield item

Python 編程

上一條：python - 使用TensorFlow創(chuàng)建邏輯回歸模型訓(xùn)練結(jié)果為nan下一條：正則表達(dá)式 - 在python中怎么匹配IP地址

相關(guān)文章：

1. 在mybatis使用mysql的ON DUPLICATE KEY UPDATE語法實現(xiàn)存在即更新應(yīng)該使用哪個標(biāo)簽?2. 哭遼求大佬解答控制器的join方法怎么轉(zhuǎn)模型方法3. mysql儲存json錯誤4. mysql - 怎么生成這個sql表？5. mysql - 數(shù)據(jù)庫表中，兩個表互為外鍵參考如何解決6. Navicat for mysql 中以json格式儲存的數(shù)據(jù)存在大量反斜杠，如何去除？7. sql語句 - 如何在mysql中批量添加用戶？8. mysql - 表名稱前綴到底有啥用？9. 編輯成功不顯示彈窗10. 怎么php怎么通過數(shù)組顯示sql查詢結(jié)果呢，查詢結(jié)果有多條，如圖。

排行榜

					
					angular.js - angular TypeError: Cannot read property ’id’ of undefined？
javascript - 求助：vue2.0中使用element ui遇到的問題
mysql - sysbench cpu測試的結(jié)果看不懂，求解
angular.js - 使用angularjs的路由調(diào)用界面，從controller上可以調(diào)用，但是頁面上獲取不到數(shù)據(jù)。
javascript - canvas toDataURL()跨域問題
在MySQL中，執(zhí)行了DELIMITER // 這個語句后分號還有什么作用？
javascript - 切換掉當(dāng)前頁面后該頁面的js動畫會暫停？
javascript - sublime3 怎么讓.vue文件也支持emmet語法
sql語句 - 如何在mysql中批量添加用戶？
javascript - gif動圖導(dǎo)致頁面閃爍的問題
mac OSX10.12.4 (16E195)下Mysql 5.7.18找不到配置文件my.cnf
				

熱門標(biāo)簽

国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

python - Scrapy如何得到原始的start_url