Python 批量讀取文件中指定字符的實(shí)現(xiàn)
1、背景
從指定的NLP生成的文件中讀取指定的字符。
2、待讀取文件
是以':'作為分隔符的數(shù)據(jù),每一行以回車結(jié)束。此文件為XXX.train
3、讀取每一句中的漢字
...file_train = os.path.join(rootDir,'data/train/rg_train_'+modle_date+'_'+aiscene+'.train') with open(file_train, ’r’)as fp:textlist = fp.readlines()for text in textlist:if ':' in text:L4ID = text.split(':')[-2]Msg = text.split(':')[-1]if query_start == Msg.strip('n'):print('Msg is in train:',Msg)...
代碼中先獲取文件,然后讀取每一行,然后以':'作為分隔符。(-1代表倒數(shù)第一個(gè),-2代表倒數(shù)第二個(gè))
不管是txt文件還是xml文件還是其他的,都可以用這種方法來批量替換文件中字符串:
# -*- coding:utf-8 -*-__author__ = ’ShawDa’import globxmls = glob.glob(’xml_files/*.xml’)for one_xml in xmls: print(one_xml) f = open(one_xml, ’r+’, encoding=’utf-8’) all_the_lines = f.readlines() f.seek(0) f.truncate() for line in all_the_lines: line = line.replace(’dog’, ’pig’) line = line.replace(’cat’, ’bike’) f.write(line) f.close()
到此這篇關(guān)于Python 批量讀取文件中指定字符的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)Python 批量讀取指定字符內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. 用xslt+css讓RSS顯示的跟網(wǎng)頁一樣漂亮2. ASP.NET MVC把數(shù)據(jù)庫中枚舉項(xiàng)的數(shù)字轉(zhuǎn)換成文字3. 《CSS3實(shí)戰(zhàn)》筆記--漸變設(shè)計(jì)(一)4. 測試模式 - XSL教程 - 55. Ajax實(shí)現(xiàn)異步加載數(shù)據(jù)6. 教你JS更簡單的獲取表單中數(shù)據(jù)(formdata)7. ASP.NET Core自定義中間件的方式詳解8. html5手機(jī)觸屏touch事件介紹9. CSS3實(shí)現(xiàn)動(dòng)態(tài)翻牌效果 仿百度貼吧3D翻牌一次動(dòng)畫特效10. 讓chatgpt將html中的圖片轉(zhuǎn)為base64方法示例
