国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術(shù)文章
文章詳情頁

Python 數(shù)據(jù)分析之逐塊讀取文本的實(shí)現(xiàn)

瀏覽:2日期:2022-07-02 11:00:12
背景

《利用Python進(jìn)行數(shù)據(jù)分析》,第 6 章的數(shù)據(jù)加載操作 read_xxx,有 chunksize 參數(shù)可以進(jìn)行逐塊加載。

經(jīng)測(cè)試,它的本質(zhì)就是將文本分成若干塊,每次處理 chunksize 行的數(shù)據(jù),最終返回一個(gè)TextParser 對(duì)象,對(duì)該對(duì)象進(jìn)行迭代遍歷,可以完成逐塊統(tǒng)計(jì)的合并處理。

示例代碼

文中的示例代碼分析如下:

from pandas import DataFrame,Seriesimport pandas as pd path=’D:/AStudy2018/pydata-book-2nd-edition/examples/ex6.csv’# chunksize return TextParserchunker=pd.read_csv(path,chunksize=1000) # an array of Seriestot=Series([])chunkercount=0for piece in chunker:print ’------------piece[key] value_counts start-----------’#piece is a DataFrame,lenth is chunksize=1000,and piece[key] is a Series ,key is int ,value is the key columnprint piece[’key’].value_counts()print ’------------piece[key] value_counts end-------------’#piece[key] value_counts is a Series ,key is the key column, and value is the key counttot=tot.add(piece[’key’].value_counts(),fill_value=0)chunkercount+=1 #last order the seriestot=tot.order(ascending=False)print chunkercountprint ’--------------’流程分析

首先,例子數(shù)據(jù) ex6.csv 文件總共有 10000 行數(shù)據(jù),使用 chunksize=1000 后,read_csv操作返回一個(gè) TextParser 對(duì)象,該對(duì)象總共有10個(gè)元素,遍歷過程中打印 chunkercount驗(yàn)證得到。

其次,每個(gè) piece 對(duì)象是一個(gè) DataFrame 對(duì)象,piece[’key’] 得到的是一個(gè) Series 對(duì)象,默認(rèn)是數(shù)值索引,值為 csv 文件中的 key 列的值,即各個(gè)字符串。

將每個(gè) Series 的 value_counts 作為一個(gè)Series,與上一次統(tǒng)計(jì)的 tot 結(jié)果進(jìn)行 add 操作,最終得到所有塊數(shù)據(jù)中各個(gè) key 的累加值。

最后,對(duì) tot 進(jìn)行 order 排序,按降序得到各個(gè) key 的值在 csv 文件中出現(xiàn)的總次數(shù)。

這里很巧妙了使用 Series 對(duì)象的 add 操作,對(duì)兩個(gè) Series 執(zhí)行 add 操作,即合并相同key:key相同的記錄的值累加,key不存在的記錄設(shè)置填充值為0

輸出結(jié)果為:

Python 數(shù)據(jù)分析之逐塊讀取文本的實(shí)現(xiàn)

到此這篇關(guān)于Python 數(shù)據(jù)分析之逐塊讀取文本的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)Python 逐塊讀取文本內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 久久99久久99精品观看 | 99av视频| 手机看片免费基地 | 午夜三级在线 | 亚洲国产欧美一区 | 国产国产人免费人成成免视频 | 国产亚洲精品久久久久久 | 欧美成人3d动漫专区 | 日本视频播放免费线上观看 | 国产2021中文天码字幕 | 久久久久久毛片免费观看 | 欧洲精品一区二区三区在线观看 | 1024色淫免费视频 | 特级欧美午夜aa毛片 | 久久偷看各类wc女厕 | 久久久久久久久久综合情日本 | 日本www高清免费视频观看 | 久草在线免费色站 | 真实国产普通话对白乱子子伦视频 | 日本卡一卡2卡3卡4精品卡无人区 | 欧美激情一区二区亚洲专区 | 精品国产精品 | 国产成人一区二区三区在线播放 | 不卡的毛片 | 亚洲欧美中文字幕在线网站 | 一级特级欧美a毛片免费 | 国产成人在线视频免费观看 | 日韩一区视频在线 | 51久久夜色精品国产 | 国产免费影院 | 国产一级在线现免费观看 | 精品中文字幕久久久久久 | 精品国产三级a在线观看 | 国产嫩草影院在线观看 | 久草综合在线视频 | 久草在线视频免费播放 | 日本视频在线免费看 | 久久精品视频免费 | 毛片在线观看视频 | 国产日韩欧美视频在线 | 欧美一区二区日韩一区二区 |