文章詳情頁

selenium - 請教一下 Python 爬蟲工具

瀏覽：137日期：2022-06-27 16:46:59

問題描述

1)我要抓的是 Instagram 某明星的粉絲2)Instagram pc 站使用了大量的 js 渲染3)沒寫過爬蟲,老板明天就要數據

我目前使用的是BeautifulSoup, selenium 和phantomjs

代碼 demo 大概是

driver = webdriver.PhantomJS(self.browser)driver.get(self.url)driver.implicitly_wait(3)element = driver.find_element_by_class_name('_s53mj')element.click()html = driver.page_sourcesoup = BeautifulSoup(html)

問題是:1) 我不知道click 有沒有執行成功, click 的元素對不對, driver 好像沒有返回值給我參考2) 即使 click 成功了, 但是他是不是只調了 js里的 click() 方法,并沒有觸發 target 怎么辦3)我不知道是先渲染page_source, 還是應該先 click, 假設執行成功了 click, 是不是也不會再 source 里返回了

啊, 謝各位爬蟲大佬了

問題解答

回答1：

說的是什么意思？百思不得其解啊。。。

selenium自動化，click能模仿用戶點擊，就跟你自己在頁面上點擊一樣，一切都在虛擬瀏覽器驅動中進行。

看你的業務邏輯啊。。。比如有些數據要點擊后才有，那就先click再獲取源代碼。

Python 編程

上一條：Python從URL中提取域名下一條：python - sklearn如何訓練大規模數據集

相關文章：

1. node.js - mysql如何通過knex查詢今天和七天內的匯總數據2. shell - Update query wrong in MySQL3. javascript - 用jsonp抓取qq音樂總是說回調函數沒有定義4. mysql 插入數值到特定的列一直失敗5. mysql 怎么做到update只更新一行數據？6. javascript - 新浪微博網頁版的字數限制是怎么做的7. 怎么在網頁中設置圖片進行左右滑動8. 360瀏覽器與IE瀏覽器有何區別？？？9. sublime可以用其他編譯器替換嗎？10. python - 在使用Pycharm時經常看到如下的樣式，小括號里紅色的部分是什么意思呢？

排行榜

					
					sublime可以用其他編譯器替換嗎？
代碼如下，java用BigDecimal四舍五入怎么還有問題呀？哪種方式是完全沒有問題的？
android - 安卓使用webview播放騰訊、優酷視頻的方法
javascript - vue如何偵聽change事件實現雙向綁定的？
java - Spring使用@Autowired失效但是getBean()可以執行成功
微信開放平臺 - android 微信支付后點完成按鈕，后回調打開第三方頁面，屏幕閃動，求解決方法
angular.js - angularjs動態增加DOM
java - 所有類都是由Object類的記載器加載的嗎？
html5 - vuex 為什么需要action,我發現進行異步操作回調中直接操作mutation也沒有報錯
HTML 5輸入框只能輸入漢字、字母、數字、標點符號？正則如何寫？
javascript - vue報錯，昨天也是這么寫的也沒報錯呀，今天就報錯了，不知原因。求解決
				

熱門標簽

国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

selenium - 請教一下 Python 爬蟲工具