Python fileinput模塊如何逐行讀取多個文件
Python 提供了 fileinput 模塊,通過該模塊中的 input() 函數,我們能同時打開指定的多個文件,還可以逐個讀取這些文件中的內容。
fileinput 模塊中 input() 該函數的語法格式如下:
fileinput.input(files='filename1, filename2, ...', inplace=False, backup=’’, bufsize=0, mode=’r’, openhook=None)
此函數會返回一個 FileInput 對象,它可以理解為是將多個指定文件合并之后的文件對象。其中,各個參數的含義如下:
files:多個文件的路徑列表; inplace:用于指定是否將標準輸出的結果寫回到文件,此參數默認值為 False; backup:用于指定備份文件的擴展名; bufsize:指定緩沖區的大小,默認為 0; mode:打開文件的格式,默認為 r(只讀格式); openhook:控制文件的打開方式,例如編碼格式等。注意,和 open() 函數不同,input() 函數不能指定打開文件的編碼格式,這意味著使用該函數讀取的所有文件,除非以二進制方式進行讀取,否則該文件編碼格式都必須和當前操作系統默認的編碼格式相同,不然 Python 解釋器可能會提示 UnicodeDecodeError 錯誤。
和 open() 函數返回單個的文件對象不同,fileinput 對象無需調用類似 read()、readline()、readlines() 這樣的函數,直接通過 for 循環即可按次序讀取多個文件中的數據。
值得一提的是,fileinput 模塊還提供了很多使用的函數(如表 1 所示),通過調用這些函數,可以幫我們更快地實現想要的功能。
表 fileinput 模塊常用函數
函數名 功能描述 fileinput.filename() 返回當前正在讀取的文件名稱。 fileinput.fileno() 返回當前正在讀取文件的文件描述符。 fileinput.lineno() 返回當前讀取了多少行。 fileinput.filelineno() 返回當前正在讀取的內容位于當前文件中的行號。 fileinput.isfirstline() 判斷當前讀取的內容在當前文件中是否位于第 1 行。 fileinput.nextfile() 關閉當前正在讀取的文件,并開始讀取下一個文件。 fileinput.close() 關閉 FileInput 對象。
文件描述符是一個文件的代號,其值為一個整數。后續章節將會介紹關于文件描述符的操作。
講了這么多,接下來舉個例子。假設使用 input() 讀取 2 個文件,分別為 my_file.txt 和 file.txt,它們位于同一目錄,且各自包含的內容如下所示:
#file.txtPython教程http://c.biancheng.net/python/
#my_file.txtLinux教程http://c.biancheng.net/linux_tutorial/
下面程序演示了如何使用 input() 函數依次讀取這 2 個文件:
import fileinput#使用for循環遍歷 fileinput 對象for line in fileinput.input(files=(’my_file.txt’, ’file.txt’)):# 輸出讀取到的內容print(line)# 關閉文件流fileinput.close()
在使用 fileinput 模塊中的 input() 函數之前,一定要先引入 fileinput 模塊。
程序執行結果為:
Linux教程
http://c.biancheng.net/linux_tutorial/Python教程
http://c.biancheng.net/python/
顯然,讀取文件內容的次序,取決于 input() 函數中文件名的先后次序。
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。
相關文章: