国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術文章
文章詳情頁

python - seleium 爬網頁數據,只能怕當前頁,如果我輸入兩頁的話,會出現初始頁數據下載兩次的情況

瀏覽:91日期:2022-07-16 15:35:58

問題描述

import requestsfrom lxml import html,etreefrom selenium import webdriverimport time, json#how many page do you want to scanpage_numnotint = input('how many page do you want to scan')page_num = int(page_numnotint)file_name = ’jd_goods_data.json’url = ’https://list.jd.com/list.html?cat=1713,3264,3414&page=1&delivery=1&sort=sort_totalsales15_desc&trans=1&JL=4_10_0#J_main ’driver = webdriver.Chrome()driver.get(url)base_html = driver.page_sourceselctor = etree.HTML(base_html)date_info = []name_data, price_data = [], []jd_goods_data = {}for q in range(page_num): i = int(1) while True:name_string = ’//*[@id='plist']/ul/li[%d]/p/p[3]/a/em/text()’ %(i)price_string = ’//*[@id='plist']/ul/li[%d]/p/p[2]/strong[1]/i/text()’ %(i)if i == 60: breakelse: i += 1name = selctor.xpath(name_string)[0]name_data.append(name)price = selctor.xpath(price_string)[0]price_data.append(price)jd_goods_data[name] = priceprint(name_data)with open(file_name, ’w’) as f: json.dump(jd_goods_data, f) time.sleep(2) driver.find_element_by_xpath(’//*[@id='J_bottomPage']/span[1]/a[10]’).click() time.sleep(2)# for k, v in jd_goods_data.items(): # print(k,v) # with open(file_name, ’w’) as f: # json.dump(jd_goods_data, f)

問題解答

回答1:

import requestsfrom lxml import html,etreefrom selenium import webdriverimport time, json#how many page do you want to scanpage_numnotint = input('how many page do you want to scan')page_num = int(page_numnotint)file_name = ’jd_goods_data.json’driver = webdriver.Chrome()date_info = []name_data, price_data = [], []jd_goods_data = {}for q in range(page_num): url = ’https://list.jd.com/list.html?cat=1713,3264,3414&page={page}&delivery=1&sort=sort_totalsales15_desc&trans=1&JL=4_10_0#J_main’.format(page=q) driver.get(url) base_html = driver.page_source selctor = etree.HTML(base_html) i = 1 while True:name_string = ’//*[@id='plist']/ul/li[%d]/p/p[3]/a/em/text()’ %(i)price_string = ’//*[@id='plist']/ul/li[%d]/p/p[2]/strong[1]/i/text()’ %(i)if i == 60: breakelse: i += 1name = selctor.xpath(name_string)[0]name_data.append(name)price = selctor.xpath(price_string)[0]price_data.append(price)jd_goods_data[name] = priceprint(name_data)with open(file_name, ’w’) as f: json.dump(jd_goods_data, f)driver.quit()

標簽: Python 編程
主站蜘蛛池模板: 深爱五月开心网亚洲综合 | 三级免费网站 | 不卡一级毛片免费高清 | 日本成年人视频网站 | 国产三级日本三级在线播放 | 欧美三级成人观看 | 日本高清视频免费在线观看 | 国产一级一级毛片 | 美女黄视频在线观看 | 欧美一级毛片在线播放 | 欧美成人黄色网 | 99精品国产免费久久国语 | 亚洲刺激视频 | 欧美一级人与动毛片免费播放 | a毛片免费全部在线播放毛 a毛片免费视频 | 欧美国产综合在线 | 亚洲图片偷拍区 | 欧美一区二区在线观看 | 久久er热视频在这里精品 | 亚洲国产tv | 亚洲免费视频网站 | 一级v片 | 国产三级国产精品 | 美女黄网站视频 | 成人看片黄a毛片 | 婷婷色九月综合激情丁香 | 亚洲精品国产三级在线观看 | 国内视频自拍 | 亚洲国产三级在线观看 | 国产小说 | 国产精品亚洲欧美 | 亚洲字幕波多野结衣作品 | 亚洲日本韩国在线 | 手机看片精品高清国产日韩 | 久久中出 | 国产女王女m视频vk 国产女王丨vk | 免费一级欧美大片视频在线 | 91成人精品 | av18在线播放 | 91精品免费看 | 日韩欧美在线播放视频 |