python - Scrapy如何得到原始的start_url
問(wèn)題描述
Scrapy爬蟲(chóng)時(shí),由于重定向或是其他原因,會(huì)導(dǎo)致原始的start_url發(fā)生改變,怎樣才能得到原始的start_url?
def start_requests(self): start_url = ’your_scrapy_start_url’ yield Request(start_url, self.parse) def parse(self, response): item = YourItem() item[’start_url’] = 原始請(qǐng)求的start_url yield item
問(wèn)題解答
回答1:參考文章:Scrapy爬蟲(chóng)常見(jiàn)問(wèn)題總結(jié)
利用Request中的meta參數(shù)傳遞信息
def start_requests(self): start_url = ’your_scrapy_start_url’ yield Request(start_url, self.parse, meta={’start_url’:start_url}) def parse(self, response): item = YourItem() item[’start_url’] = response.meta[’start_url’] yield item
相關(guān)文章:
1. php - MySQL數(shù)據(jù)庫(kù)設(shè)計(jì),獲取點(diǎn)贊的人數(shù)2. python3.x - python連oanda的模擬交易api獲取json問(wèn)題第二問(wèn)3. javascript - h5微信中怎么禁止橫屏4. mysql - 這種分級(jí)一對(duì)多,且分級(jí)不平衡的模型該怎么設(shè)計(jì)表?5. javascript - 有適合開(kāi)發(fā)手機(jī)端Html5網(wǎng)頁(yè)小游戲的前端框架嗎?6. python - 怎么把char*對(duì)象轉(zhuǎn)換成PyObject*對(duì)象7. MYSQL 根據(jù)兩個(gè)字段值查詢(xún) 但兩個(gè)值的位置可能是互換的,這個(gè)怎么查?8. mysql - linux連接數(shù)據(jù)庫(kù)報(bào)錯(cuò)9. java - 線(xiàn)上應(yīng)用,如果數(shù)據(jù)庫(kù)操作失敗的話(huà)應(yīng)該如何處理?10. MySQL中的enum類(lèi)型有什么優(yōu)點(diǎn)?
