国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術(shù)文章
文章詳情頁

python - 使用requests爬取[大街網(wǎng)]職位信息,嘗試多次失敗,幫忙看看我的代碼有什么問題?應(yīng)該怎么改呢?

瀏覽:122日期:2022-06-30 18:36:24

問題描述

之前爬取過幾個(gè)靜態(tài)的網(wǎng)站數(shù)據(jù),都還比較順利,這次遇到ajax,看了幾個(gè)文檔,感覺不是很難,就直接上手了,但還是卡住了。。。

目標(biāo):爬取大街網(wǎng)的職位信息。

過程:1,使用瀏覽器審查元素功能查看數(shù)據(jù)動(dòng)態(tài)加載的地址信息。python - 使用requests爬取[大街網(wǎng)]職位信息,嘗試多次失敗,幫忙看看我的代碼有什么問題?應(yīng)該怎么改呢?

2,根據(jù)顯示的信息配置requests的請求參數(shù)。

data = { ’keyword’: ’python’, ’order’: ’0’, ’city’: ’’, ’recruitType’: ’’, ’salary’: ’’, ’experience’: ’’, ’page’: ’5’, ’positionFunction’: ’’, ’_CSRFToken’: ’’, ’ajax’: ’1’}headers = { ’accept’: ’application/json, text/javascript, */*; q=0.01’, ’accept-language’: ’zh-CN,zh;q=0.8’, ’accept-encoding’: ’gzip, deflate, sdch’, ’cookie’: ’DJ_UVID=MTQ5MDMyMTExNTAzODM2MTc5; DJ_RF=empty; DJ_EU=http%3A%2F%2Fjob.dajie.com%2F; __login_tips=1; dj_cap=9c8c95bdef72e84a9bd7493a5ab91694; USER_ACTION='request^A-^A-^Ajobdetail:^A-'; SO_COOKIE_V2=0c7cGprjIH0q9RHc53CWLLXf151DQ5QvUP5ccPQj4g0B/izuXHm8sp41lJjJJh3nmjAkroj8JczFN/SCLPAUzbOHW7wYWmQ6Zu7s’, ’referer’: ’https://so.dajie.com/job/search?keyword=%E9%A3%9E%E5%88%A9%E6%B5%A6&from=job&clicktype=blank’, ’user-agent’: ’Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36’, ’X-Requested-With’: ’XMLHttpRequest’, ’method’:’get’}

3,將請求頭信息添加到requests.get()中。

response = requests.get(’https://so.dajie.com/job/ajax/search/filter’, params=data, headers=headers)

4,查看返回的頁面信息。

print response.urlprint ’’print response.request.headersprint ’’print response.headersprint ’’print response.content[-1000:]print ’’print response

5,返回的結(jié)果怎么不是期望的json數(shù)據(jù)呢。。。

response.url:https://so.dajie.com/job/ajax/search/filter?salary=&city=&ajax=1&positionFunction=&_CSRFToken=&keyword=python&recruitType=&order=0&experience=&page=5response.request.headers:{’accept-language’: ’zh-CN,zh;q=0.8’, ’accept-encoding’: ’gzip, deflate, sdch’, ’X-Requested-With’: ’XMLHttpRequest’, ’accept’: ’application/json, text/javascript, */*; q=0.01’, ’user-agent’: ’Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36’, ’Connection’: ’keep-alive’, ’referer’: ’https://so.dajie.com/job/search?keyword=%E9%A3%9E%E5%88%A9%E6%B5%A6&from=job&clicktype=blank’, ’cookie’: ’DJ_UVID=MTQ5MDMyMTExNTAzODM2MTc5; DJ_RF=empty; DJ_EU=http%3A%2F%2Fjob.dajie.com%2F; __login_tips=1; dj_cap=9c8c95bdef72e84a9bd7493a5ab91694; USER_ACTION='request^A-^A-^Ajobdetail:^A-'; SO_COOKIE_V2=0c7cGprjIH0q9RHc53CWLLXf151DQ5QvUP5ccPQj4g0B/izuXHm8sp41lJjJJh3nmjAkroj8JczFN/SCLPAUzbOHW7wYWmQ6Zu7s’, ’method’: ’get’}response.headers:{’Date’: ’Wed, 19 Apr 2017 02:00:47 GMT’, ’Content-Length’: ’5944’, ’ETag’: ’'552f21de-1738'’, ’Content-Type’: ’text/html; charset=UTF-8’, ’Connection’: ’keep-alive’}response.content[-1000:]:,這個(gè)頁面去火星了,試試搜索一下吧:</p> <form action='http://so.dajie.com/job/search' target='_top' method='get'> <input type='text' placeholder='搜索感興趣的職位' autocomplete='off' name='keyword'/><button type='submit'>搜索</button> <input type='hidden' name='jobsearch' value='8'/> </form> </p> <p class='error-404'> <p class='buttonwrap'> <a ><b>逛逛大街</b></a> <a href='mailto:service@dajie.com'><b>報(bào)告管理員</b></a> </p> </p> </p> <script type='text/javascript'> $(function(){ $(’input[placeholder]’).each(function(){var $dom = $(this);var tip = $dom.attr(’placeholder’);$.placeholder($dom, { placeTextClass : ’placeholder’, placeText : tip}); }); }); </script> </body></html>response:<Response [299]>

疑問:1,‘https://so.dajie.com/job/ajax...’,這個(gè)頁面打開怎么不是json數(shù)據(jù)頁面呢?我之前看的教程里邊給的鏈接打開就是數(shù)據(jù)額,比如:‘https://rate.tmall.com/list_d...’。2,第一次使用requests請求ajax數(shù)據(jù),是不是請求時(shí)少寫什么東西了?2,我現(xiàn)在只是嘗試修改了各種請求參數(shù),但是還是得不到j(luò)son數(shù)據(jù),思考方向錯(cuò)了?

謝。

問題解答

回答1:

# coding: utf-8import requestsurl = ’https://so.dajie.com/job/search’page_url = ’https://so.dajie.com/job/ajax/search/filter?keyword=python&order=0&city=&recruitType=&salary=&experience=&page=1&positionFunction=&_CSRFToken=&ajax=1’session = requests.Session()session.headers[’referer’] = urlsession.headers[’user-agent’] = ’Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36’session.get(url)r = session.get(page_url)print r.text

直接傳入cookies

# coding: utf-8import requestsdata = { ’keyword’: ’python’, ’order’: ’0’, ’city’: ’’, ’recruitType’: ’’, ’salary’: ’’, ’experience’: ’’, ’page’: ’5’, ’positionFunction’: ’’, ’_CSRFToken’: ’’, ’ajax’: ’1’}headers = { ’cookie’: ’DJ_RF=empty; DJ_EU=http%3A%2F%2Fso.dajie.com%2Fjob%2Fsearch%3Fkeyword%3Dpython%26jobsearch%3D8; DJ_UVID=MTQ5MjU2OTgxOTU1ODg0Mzk1; __login_tips=1; dj_cap=1e41c3c0ca9602c45e6481cb53c19774; SO_COOKIE_V2=6a297gxq5vDDnl9D4q04fhTgrWB11xG9lMj7iLcnP1uM/Zuzzx1dkeHauV4blsO1KsRYQKEQDrDGdiAhRE9efdI8PnREZK1MhzR4’, ’referer’: ’https://so.dajie.com/job/search’, ’user-agent’: ’Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36’}r = requests.get(’https://so.dajie.com/job/ajax/search/filter’, data=data, headers=headers)print r.text

標(biāo)簽: Python 編程
主站蜘蛛池模板: 欧美精品网站 | 毛片免费在线观看网址 | 91理论片 | 又黄又爽又刺激的视频 | 久久一级视频 | 午夜爱爱毛片xxxx视频免费看 | 蜜桃欧美性大片 | 欧美成人亚洲国产精品 | 国产精品99精品久久免费 | 日韩手机看片福利精品 | 久久久婷 | 欧美久草在线 | 亚洲精品久久久久网站 | 国产成人精品视频播放 | 亚洲天堂黄 | 成人免费一区二区三区视频软件 | 成年人看的黄色片 | 亚洲第一男人天堂 | 伊人短视频 | 欧美自拍在线 | 99精品在线观看视频 | 国产一级毛片夜一级毛片 | 欧美黄视频在线观看 | 欧美日韩一区二区综合在线视频 | 日本一线a视频免费观看 | 亚洲一区二区三区四区在线观看 | 久久99在线| 免费小视频在线观看 | 一级中国乱子伦视频 | 欧美成人 综合网播九公社 欧美成人26uuu欧美毛片 | 国产精品资源在线 | 国产成人在线播放视频 | 日韩黄色一级毛片 | 欧美成人精品手机在线观看 | 亚洲精国产一区二区三区 | 免费高清毛片在线播放视频 | 精品视频免费在线观看 | 成人久久18免费软件 | 国产一区二区三区在线免费观看 | 成人久久久| 2020国产微拍精品一区二区 |