国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

Python 通過(guò)爬蟲(chóng)實(shí)現(xiàn)GitHub網(wǎng)頁(yè)的模擬登錄的示例代碼

瀏覽:16日期:2022-07-13 18:10:38

1. 實(shí)例描述

通過(guò)爬蟲(chóng)獲取網(wǎng)頁(yè)的信息時(shí),有時(shí)需要登錄網(wǎng)頁(yè)后才可以獲取網(wǎng)頁(yè)中的可用數(shù)據(jù),例如獲取 GitHub 網(wǎng)頁(yè)中的注冊(cè)號(hào)碼時(shí),就需要先登錄賬號(hào)才能在登錄后的頁(yè)面中看到該信息,如下圖所示。那么該如何實(shí)現(xiàn)模擬登錄的功能呢?本文實(shí)現(xiàn)將通過(guò)爬蟲(chóng)實(shí)現(xiàn) GitHub 網(wǎng)頁(yè)的模擬登錄。

Python 通過(guò)爬蟲(chóng)實(shí)現(xiàn)GitHub網(wǎng)頁(yè)的模擬登錄的示例代碼

2. 代碼實(shí)現(xiàn)

在實(shí)現(xiàn) GitHub 網(wǎng)頁(yè)的模擬登錄時(shí),首先需要查看提交登錄請(qǐng)求時(shí)都要哪些請(qǐng)求參數(shù),然后獲取登錄請(qǐng)求的所有參數(shù),再發(fā)送登錄請(qǐng)求。如果登錄成功的情況下獲取頁(yè)面中的注冊(cè)號(hào)碼信息即可。具體步驟如下:

(1) 點(diǎn)擊 此處 打開(kāi) GitHub 的登錄頁(yè)面,然后輸入賬號(hào)與密碼,如下圖所示。

Python 通過(guò)爬蟲(chóng)實(shí)現(xiàn)GitHub網(wǎng)頁(yè)的模擬登錄的示例代碼

(2) 用 F12 或者 鼠標(biāo)右鍵單擊網(wǎng)頁(yè)選擇 檢查 打開(kāi)瀏覽器的開(kāi)發(fā)者工具,選擇獲取網(wǎng)絡(luò)請(qǐng)求過(guò)程,然后單擊登錄頁(yè)面中的 Sign in 按鈕,此時(shí)開(kāi)發(fā)者工具中將顯示 GitHub 網(wǎng)頁(yè)的登錄請(qǐng)求過(guò)程,重點(diǎn)查找名稱為 session 的網(wǎng)絡(luò)請(qǐng)求。如下圖所示。

Python 通過(guò)爬蟲(chóng)實(shí)現(xiàn)GitHub網(wǎng)頁(yè)的模擬登錄的示例代碼

(3) 單擊名稱為 session 的網(wǎng)絡(luò)請(qǐng)求,然后在 Headers 請(qǐng)求信息中主要查看 Request Headers與 Form Data 中的各種信息,其中紅框內(nèi)為重要參數(shù)與數(shù)據(jù)。如下圖所示。

Python 通過(guò)爬蟲(chóng)實(shí)現(xiàn)GitHub網(wǎng)頁(yè)的模擬登錄的示例代碼

說(shuō)明:Host 為主頁(yè)面地址,Referer 為當(dāng)前請(qǐng)求的來(lái)源地址。User-Agent 為瀏覽器的頭部信息。Form Data 中的所有信息都是登錄請(qǐng)求的所用參數(shù),其中動(dòng)態(tài)參數(shù)為重要參數(shù),authenticity_token 為加密字符串,login 為登錄的賬號(hào),password 為密碼,其它參數(shù)為靜態(tài)參數(shù)。由于動(dòng)態(tài)參數(shù)只有 authenticity_token、login 以及password ,而用戶名與密碼只需要將動(dòng)態(tài)字符串填寫(xiě)對(duì)應(yīng)的位置即可,所以接下來(lái)需要獲取 authenticity_token 參數(shù)所對(duì)應(yīng)的加密字符串。

(4) 在瀏覽器中退出所登錄的 GitHub 賬號(hào),返回 GitHub 的登錄頁(yè)面,打開(kāi)瀏覽器開(kāi)發(fā)者工具,查看網(wǎng)頁(yè)的 html 代碼,然后在代碼中搜索 authenticity_token 關(guān)鍵詞,標(biāo)簽內(nèi) value 所對(duì)應(yīng)的值為 authenticity_token 參數(shù)的加密字符串。如下圖所示。

Python 通過(guò)爬蟲(chóng)實(shí)現(xiàn)GitHub網(wǎng)頁(yè)的模擬登錄的示例代碼

(5) 實(shí)現(xiàn)爬蟲(chóng)代碼,首先導(dǎo)入所需模塊,然后創(chuàng)建頭部信息,再通過(guò) Session 會(huì)話對(duì)象發(fā)送網(wǎng)絡(luò)請(qǐng)求獲取 authenticity_token 信息,最后通過(guò)所有的登陸請(qǐng)求參數(shù)實(shí)現(xiàn) GitHub 網(wǎng)頁(yè)的登陸請(qǐng)求并提取注冊(cè)號(hào)碼。具體代碼如下:

# -*- coding: utf-8 -*-# @Time : 2020/5/10 23:25# @Author : 我就是任性-Amo# @FileName: 77.通過(guò)爬蟲(chóng)實(shí)現(xiàn)GitHub網(wǎng)頁(yè)的模擬登錄.py# @Software: PyCharm# @Blog :https://blog.csdn.net/xw1680import requests # 導(dǎo)入網(wǎng)絡(luò)請(qǐng)求模塊from lxml import etree # 導(dǎo)入數(shù)據(jù)解析模塊 都是第三方模塊需要安裝 # pip install requests/lxml如果太慢 可以加上鏡像服務(wù)器 或者在Pycharm中使用圖形化界面進(jìn)行安裝class GitHubLogin(object): def __init__(self, username, password): # 構(gòu)造頭部信息 self.headers = { 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) ' 'AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36', 'Host': 'github.com', 'Referer': 'https://github.com/login' } self.login_url = 'https://github.com/login' # 登錄頁(yè)面地址 self.post_url = 'https://github.com/session' # 實(shí)現(xiàn)登錄的請(qǐng)求地址 self.session = requests.Session() # 創(chuàng)建Session會(huì)話對(duì)象 self.user_name = username # 用戶名 self.password = password # 密碼 # 獲取authenticity_token信息 def get_token(self): # 發(fā)送登錄頁(yè)面的網(wǎng)絡(luò)請(qǐng)求 response = self.session.get(self.login_url, headers=self.headers) if response.status_code == 200: # 判斷請(qǐng)求是否成功 html = etree.HTML(response.text) # 解析html # 提取authenticity_token信息 token = html.xpath('//div[@id=’login’]/form/input[1]/@value')[0] # print(token) 測(cè)試是否能夠獲取到token return token # 返回信息 # 實(shí)現(xiàn)登錄 def login(self): # 請(qǐng)求參數(shù) post_data = { 'commit': 'Sign in', 'authenticity_token': self.get_token(), 'login': self.user_name, 'password': self.password, 'webauthn - support': 'supported' } # 發(fā)送登錄請(qǐng)求 response = self.session.post(self.post_url, headers=self.headers, data=post_data) if response.status_code == 200: # 判斷請(qǐng)求是否成功 html = etree.HTML(response.text) # 解析html # 獲取注冊(cè)號(hào)碼 register_number = html.xpath('//div[contains(@class,’Header-item’)][last()]//strong')[0] print(f'注冊(cè)號(hào)碼為: {register_number.text}') else: print('登錄失敗')if __name__ == ’__main__’: user_name = input('請(qǐng)輸入您的用戶名:') # 獲取輸入的用戶名 password = input('請(qǐng)輸入您的密碼:') # 獲取輸入的密碼 login = GitHubLogin(user_name, password) # 創(chuàng)建登錄類對(duì)象并傳遞輸入的用戶名與密碼 login.login()

執(zhí)行以上代碼,輸入用戶名與密碼,即可顯示獲取的注冊(cè)號(hào)碼。如下圖所示:

Python 通過(guò)爬蟲(chóng)實(shí)現(xiàn)GitHub網(wǎng)頁(yè)的模擬登錄的示例代碼

到此這篇關(guān)于Python 通過(guò)爬蟲(chóng)實(shí)現(xiàn)GitHub網(wǎng)頁(yè)的模擬登錄的示例代碼的文章就介紹到這了,更多相關(guān)Python GitHub模擬登錄內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 91福利精品老师国产自产在线 | 日韩最新中文字幕 | 精品视频免费在线观看 | 国产高清日韩 | 免费一级做a爰片性色毛片 免费一极毛片 | 国产欧美在线观看不卡一 | 欧美一区精品二区三区 | 国产aⅴ一区二区三区 | 午夜看片网站 | 欧美亚洲日本一区二区三区浪人 | 亚洲偷自拍另类图片二区 | 精品日本久久久久久久久久 | 一级a毛片免费观看久久精品 | 欧美国产一区二区 | 欧美第一网站 | 亚洲加勒比久久88色综合 | 午夜三级a三级三点在线观看 | 97一级毛片全部免费播放 | 亚洲精品人成网线在线 | 欧美一级网站 | 亚洲欧美视频在线播放 | 精品久久国产 | 日韩欧美中文字幕一区二区三区 | 欧美一区二区三区免费 | 美女张开腿让男人桶爽免 | 国内自拍在线 | 成人免费看黄 | 欧美啊v在线观看 | 九九视频在线看精品 | 九九视频在线免费观看 | 欧美一级日韩一级亚洲一级 | 久久精品国产一区二区三区日韩 | 亚洲欧美男人天堂 | 日韩精品一区二区三区在线观看l | 国产精品专区第二 | 日韩一级片播放 | 国产成人精品男人免费 | 毛片1级| 成年网站在线 | 2022国产精品手机在线观看 | 国产精品免费一区二区三区四区 |