国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術(shù)文章
文章詳情頁

Python爬蟲的亂碼問題?

瀏覽:98日期:2022-07-30 16:40:27

問題描述

使用python實(shí)現(xiàn)模擬登陸并爬取返回頁面的時(shí)候出現(xiàn)了亂碼,目標(biāo)網(wǎng)頁的編碼使用utf-8Python爬蟲的亂碼問題?

相關(guān)代碼:

#coding=utf-8import urllibimport urllib2headers={ ’Accept’:’text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8’, ’Accept-Encoding’:’gzip, deflate’, ’Accept-Language’:’zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3’, ’Connection’:’keep-alive’, ’User-Agent’:’Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.73 Safari/537.36’}payload={ ’_eventId’:’submit’, ’lt’:’_cF2A0EB3F-D044-046C-6F4A-C828DE0ACE8E_k8B4BE5F5-4CAD-375D-0DDC-FB84A18445DF’, ’password’:’’, ’submit’:’登 錄’, ’username’:’’}payload=urllib.urlencode(payload)request = urllib2.Request(posturl, payload, headers)print requestresponse = urllib2.urlopen(request)text = response.read()print text

控制臺(tái)輸出信息:Python爬蟲的亂碼問題?

第一次遇見這種亂碼比較懵逼

問題解答

回答1:

urllib2沒有處理壓縮的問題,你要使用gzip解壓,比如這樣

from StringIO import StringIOimport gzipif response.info().get(’Content-Encoding’) == ’gzip’: buf = StringIO(text) f = gzip.GzipFile(fileobj=buf) data = f.read()

總結(jié)urllib2比較底層,建議使用requests

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 日日操夜夜爽 | 欧美一级毛片日韩一级 | 特级毛片永久久免费观看 | 亚州不卡 | 狠狠色丁香婷婷久久综合考虑 | 三级黄色在线播放 | 韩国欧洲一级毛片免费 | 欧美视频精品在线 | 日本一级爽毛片在线看 | 免费看一级毛片欧美 | 日本无卡码免费一区二区三区 | 三级黄色免费看 | 亚洲欧美在线免费 | 深夜福利视频大全在线观看 | 成年女人黄小视频 | 成人网视频免费播放 | 亚洲精品成人一区二区www | 韩国一级免费视频 | 精品国产一区二区三区不卡蜜臂 | 精品久久久久久久久久香蕉 | 欧美日韩精品一区二区三区不卡 | 国产成人高清在线观看播放 | 国产一级一级毛片 | 永久免费91桃色福利 | 美国毛片网 | 欧美做爰xxxⅹ性欧 欧美做爰免费大片在线观看 | 欧美一级毛片欧美毛片视频 | 免费人成在线观看播放国产 | 欧美成人三级网站在线观看 | 国产精品美乳免费看 | 国产精品久久久久久久久久久搜索 | 免费在线一级片 | 国产国产人免费人成成免视频 | 91成人在线视频 | 久久精品视频99 | 久久99亚洲精品一区二区 | 久久一区二区精品综合 | 99九九成人免费视频精品 | 亚洲美女性生活视频 | 亚洲欧美一区二区三区孕妇 | 国产日韩欧美swag在线观看 |