python爬不同圖片分別保存在不同文件夾中的實(shí)現(xiàn)
例如,爬取趙麗穎,趙本山,趙文卓,趙歡,趙日天的圖片分別保存在趙麗穎,趙本山,趙文卓,趙歡,趙日天命名的文件夾中,
測(cè)試代碼別的圖就不放了
import requestsimport timeimport os# 請(qǐng)求頭,偽裝成瀏覽器headers = { ’User-Agent’: ’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36’}# keyword = ’云斑白條天牛’ # 關(guān)鍵字keywords = [’趙麗穎’,’趙本山’,’趙文卓’,’趙歡’,’趙日天’]max_page = 2i=1 # 記錄圖片數(shù)for keyword in keywords: os.makedirs(keyword) for page in range(1,max_page): page = page*30 # 網(wǎng)址 url = ’https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord=’+keyword+’&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=©right=&word=’+keyword+’&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn=’+str(page)+’&rn=30&gsm=1e&1596899786625=’ # 請(qǐng)求響應(yīng) response = requests.get(url=url,headers=headers) # 得到相應(yīng)的json數(shù)據(jù) json = response.json() if json.get(’data’): for item in json.get(’data’)[:30]:# 圖片地址img_url = item.get(’thumbURL’)# 獲取圖片image = requests.get(url=img_url)# 下載圖片newstr = ’./’+keyword+’/’+str(i)+’.jpg’# with open(’./%s/%d.jpg’%keywords ,%i,’wb’) as f:with open(newstr,’wb’) as f: f.write(image.content) # 圖片二進(jìn)制數(shù)據(jù)time.sleep(1) # 等待1sprint(’第%d張%s圖片下載完成...’%(i,keyword))i+=1print(’End!’)你要修改的參數(shù)
將你想要爬的數(shù)據(jù)填入keywords 數(shù)組中即可
# 這里放你要查詢的數(shù)組keywords = [’’,’’,’’,’]
max_page是爬取百度圖片的頁(yè)數(shù),一頁(yè)是30張,這里寫2的話就能爬30張,3能爬60張,以此類推
max_page = 3你要的代碼
代碼如下:
import requestsimport timeimport os# 請(qǐng)求頭,偽裝成瀏覽器headers = { ’User-Agent’: ’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36’}# 這里放你要查詢的數(shù)組keywords = [’’,’’,’’,’]max_page = 4i=1 # 記錄圖片數(shù)for keyword in keywords: os.makedirs(keyword) for page in range(1,max_page): page = page*30 # 網(wǎng)址 url = ’https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord=’+keyword+’&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=©right=&word=’+keyword+’&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn=’+str(page)+’&rn=30&gsm=1e&1596899786625=’ # 請(qǐng)求響應(yīng) response = requests.get(url=url,headers=headers) # 得到相應(yīng)的json數(shù)據(jù) json = response.json() if json.get(’data’): for item in json.get(’data’)[:30]:# 圖片地址img_url = item.get(’thumbURL’)# 獲取圖片image = requests.get(url=img_url)# 下載圖片newstr = ’./’+keyword+’/’+str(i)+’.jpg’# with open(’./%s/%d.jpg’%keywords ,%i,’wb’) as f:with open(newstr,’wb’) as f: f.write(image.content) # 圖片二進(jìn)制數(shù)據(jù)time.sleep(1) # 等待1sprint(’第%d張%s圖片下載完成...’%(i,keyword))i+=1 print(’End!’)
到此這篇關(guān)于python爬不同圖片分別保存在不同文件夾中的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)python爬圖片保存不同文件夾內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. php使用正則驗(yàn)證密碼字段的復(fù)雜強(qiáng)度原理詳細(xì)講解 原創(chuàng)2. XML在語(yǔ)音合成中的應(yīng)用3. 基于javaweb+jsp實(shí)現(xiàn)企業(yè)車輛管理系統(tǒng)4. asp.net core 認(rèn)證和授權(quán)實(shí)例詳解5. 基于PHP做個(gè)圖片防盜鏈6. ASP.NET MVC使用Boostrap實(shí)現(xiàn)產(chǎn)品展示、查詢、排序、分頁(yè)7. ASP將數(shù)字轉(zhuǎn)中文數(shù)字(大寫金額)的函數(shù)8. Jsp+Servlet實(shí)現(xiàn)文件上傳下載 文件列表展示(二)9. ASP.NET MVC把數(shù)據(jù)庫(kù)中枚舉項(xiàng)的數(shù)字轉(zhuǎn)換成文字10. jscript與vbscript 操作XML元素屬性的代碼
