国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術文章
文章詳情頁

python - 去除重復行并保留得分最高的行

瀏覽:93日期:2022-07-30 08:05:03

問題描述

第一列(scaffold這一列)相同,則根據第AS列(AS:i:xx)數字 xx的大小,保留數字最大的行。如果數字大小相同則都保留。

舉例,輸入文件

scaffold_010679_1AL.2 16 chr1A 429400034 119 3272M * GACACAAGAGACTCTTTG * AS:i:3268 XS:i:2147 XF:i:0 XE:i:29 NM:i:1scaffold_010679_1AL.2 16 chr1A 429400034 119 3272M * GACACAAGAGACTCTTTG * AS:i:3268 XS:i:2147 XF:i:0 XE:i:29 NM:i:1 scaffold_010679_1AL.2 16 chr1A 429400034 119 3272M * GACACAAGAGACTCTTTG * AS:i:1268 XS:i:2147 XF:i:0 XE:i:29 NM:i:1scaffold_010679_1AL.3 16 chr1A 429397743 19 599S1730M1I279M * 0 0 TGCCGAGGTTTTTGA * AS:i:1998 XS:i:1877 XF:i:3 XE:i:20 NM:i:2 XN:i:1scaffold_010679_1AL.3 16 chr1A 429397743 19 599S1730M1I279M * 0 0 TGCCGAGGTTTTTGA * AS:i:1098 XS:i:1877 XF:i:3 XE:i:20 NM:i:2 XN:i:1

結果文件

scaffold_010679_1AL.2 16 chr1A 429400034 119 3272M * GACACAAGAGACTCTTTG * AS:i:3268 XS:i:2147 XF:i:0 XE:i:29 NM:i:1scaffold_010679_1AL.2 16 chr1A 429400034 119 3272M * GACACAAGAGACTCTTTG * AS:i:3268 XS:i:2147 XF:i:0 XE:i:29 NM:i:1 scaffold_010679_1AL.3 16 chr1A 429397743 19 599S1730M1I279M * 0 0 TGCCGAGGTTTTTGA * AS:i:1998 XS:i:1877 XF:i:3 XE:i:20 NM:i:2 XN:i:1

問題解答

回答1:

# coding: utf-8from itertools import groupbywith open(’a.txt’) as f: data = [line for line in f] #因為數據的列數不相同, 只能以AS:i:為開頭來識別 #取第一列為key, AS:i:列為value lst = [(l.split()[0], _) for l in data for _ in l.split() if _.startswith(’AS:i:’)]#找出同key下的max(value) max_lst = [max(list(g)) for k, g in groupby(lst, lambda x: x[0])]#從原數據里找到同時包含key和value的行 print [line for line in data for _ in max_lst if _[0] in line and _[1] in line]回答2:

awk ’{n=gensub('.*AS:i:([0-9]+).*','1','g')}n>=k[$1]{c[$1]=n==k[$1]?c[$1]'n'$0:$0;k[$1]=n}END{for(i in c)print c[i]}’ file回答3:

grep '`sort -r -t '*' -k 3 b.txt | head -1 |awk -F '*' ’{split($3,a,' ');print a[1]}’`' b.txt

python - 去除重復行并保留得分最高的行

思路文件按星號*分列分3列,按照第三列降序排序,取出第一行,取出AS:i:最大數,grep搜索之,得到結果。

是我沒仔細看提問,失誤了~~結果不對

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 日本久久草| 亚洲人成网址在线播放a | 亚洲一区日韩一区欧美一区a | 国产三级理论 | 99视频免费在线 | 国产呦精品一区二区三区网站 | 久久国产免费观看精品3 | 亚洲自偷自拍另类12p | 亚洲最新在线视频 | 欧美一级大黄特黄毛片视频 | 久草资源在线视频 | 精品亚洲欧美高清不卡高清 | 亚洲美女色成人综合 | 国产一区视频在线 | 国产九九免费视频网站 | 成人欧美精品久久久久影院 | 国产成人美女福利在线观看 | a级毛片在线观看 | 欧美一区二区三区视频在线观看 | 美女网站18 | 亚洲系列中文字幕一区二区 | 国内自拍第100页 | 国产aⅴ精品一区二区三区久久 | 俄罗斯美女在线观看一区 | 国产精品人成人免费国产 | 88精品视频| 色综合久久88一加勒比 | 成人精品一区二区三区中文字幕 | 国产一区二区不卡 | 国产专区在线 | 全部aⅴ极品视觉盛宴精品 全部免费a级毛片 | 久草a在线 | 国产精品美女一区二区 | 久久精品国产三级不卡 | 欧美高清日本三级人妇 | 国产精品美女久久福利网站 | 韩国免费一级成人毛片 | 国产一区二区亚洲精品 | 国产成人综合久久亚洲精品 | 午夜伦y4480影院中文字幕 | 韩国主播19福利视频在线 |