文章詳情頁
想寫一個python分析統(tǒng)計apache 日志文件的腳本
瀏覽:162日期:2022-07-27 15:36:57
問題描述
想寫一個python分析統(tǒng)計apache 網(wǎng)站日志文件并將統(tǒng)計后的數(shù)據(jù)存入mysql中的的腳本,有沒有參考的,沒有思路主要是統(tǒng)計 哪些url被爬取了 及 被爬取次數(shù),以及IP這兩個
問題解答
回答1:先把原始數(shù)據(jù) 規(guī)整化,然后 key 值自己定,然后用 collections 的 Counter 統(tǒng)計,然后再遍歷寫入 db, 大概代碼如下:
data = [’/a 1.2.1.2’, ’/b 2.2.2.2’, ’/c 1.1.1.1’, ’/d 2.2.2.2’, ’/d 2.2.2.2’]from collections import Counterc = Counter(data)print c
Counter({’/d 2.2.2.2’: 2, ’/b 2.2.2.2’: 1, ’/a 1.2.1.2’: 1, ’/c 1.1.1.1’: 1})
你也可以自己維護(hù)字典,鍵為:/PATH:IP 或者什么,自己定,然后一邊遍歷,一邊添加就好了
相關(guān)文章:
1. 關(guān)于nginx location配置的問題,root到底是什么2. docker鏡像push報錯3. angular.js - angular內(nèi)容過長展開收起效果4. 關(guān)于docker下的nginx壓力測試5. angular.js - angularjs的自定義過濾器如何給文字加顏色?6. python 怎樣用pickle保存類的實例?7. 大家好,請問在python腳本中怎么用virtualenv激活指定的環(huán)境?8. python的前景到底有大?如果不考慮數(shù)據(jù)挖掘,機(jī)器學(xué)習(xí)這塊?9. 并發(fā)模型 - python將進(jìn)程池放在裝飾器里為什么不生效也沒報錯10. python2安裝失敗
排行榜

熱門標(biāo)簽