Python格式化文本段落之textwrap庫(kù)
前文是針對(duì)普通的字符串?dāng)?shù)據(jù)進(jìn)行處理。今天,我們要講解的textwrap庫(kù),是對(duì)多文本進(jìn)行處理的庫(kù)。比如對(duì)于段落的縮進(jìn),填充,截取等,都可以通過(guò)textwrap庫(kù)進(jìn)行操作。
特別是自己編寫(xiě)打印程序的時(shí)候,可以使用該庫(kù)進(jìn)行校正文檔非常便捷,大大的加快了文本格式的處理。話不多說(shuō),我們來(lái)一步步學(xué)習(xí)textwrap庫(kù)。
二、切割文檔一般來(lái)說(shuō),一篇英文文檔在不考慮換行的情況下,默認(rèn)是填充整個(gè)文檔行才切換至下一行的?,F(xiàn)在,我們需要保證每行必須有且僅有50個(gè)字符怎么辦?
我們可以使用textwrap.fill方法,具體代碼如下:
import textwrapcontent = ''with open(’英文文檔.txt’, ’r’, encoding=’utf-8’) as f: content = f.read()print(content)print('----')print(textwrap.fill(content, width=50))
運(yùn)行之后,分割線上下分別為原文檔與textwrap.fill處理后的文檔:
讀者可以自行測(cè)試,保證每行加上空格不多于50個(gè)字符,而且也沒(méi)有任何的縮進(jìn)效果。
三、文本縮進(jìn)既然通過(guò)textwrap.fill達(dá)不到文檔縮進(jìn)的效果。下面我們?cè)賮?lái)認(rèn)識(shí)一個(gè)新的函數(shù)textwrap.indent()函數(shù)。
import textwrapcontent = ''with open(’英文文檔.txt’, ’r’, encoding=’utf-8’) as f: content = f.read()print(textwrap.indent(content,' '))
textwrap.indent()函數(shù)具有兩個(gè)參數(shù),一個(gè)是需要縮進(jìn)的字符串,另一個(gè)是匹配的縮進(jìn)字符。比如這里就是空了2格,那么字符串每行前面都會(huì)縮進(jìn)2格。
當(dāng)然,我們還可以選擇特定的行進(jìn)行縮進(jìn),textwrap.indent()函數(shù)還有第3個(gè)參數(shù)predicate,需要給它提供一個(gè)方法設(shè)置特定的規(guī)則。具體代碼如下:
import textwrapdef choice_line(line): return len(line) % 2 == 0content = ''with open(’英文文檔.txt’, ’r’, encoding=’utf-8’) as f: content = f.read()indent_str = textwrap.indent(content, ' ',predicate=choice_line)print(indent_str)
這里,博主設(shè)置的規(guī)則是,當(dāng)某行的字符串個(gè)數(shù)除2取余數(shù)等于0時(shí),就縮進(jìn)。否則便不縮進(jìn)。運(yùn)行之后,效果如下:
既然有縮進(jìn)文本,那么肯定就也有反向的操作去除縮進(jìn)。下面,我們來(lái)通過(guò)函數(shù)textwrap.dedent()來(lái)去除縮進(jìn)。
import textwrapcontent = ''with open(’英文文檔.txt’, ’r’, encoding=’utf-8’) as f: content = f.read()indent_str = textwrap.indent(content, ' ')print(textwrap.dedent(indent_str))
textwrap.dedent()函數(shù)只有需要操作的文本一個(gè)參數(shù),效果如下:
這樣,我們就實(shí)現(xiàn)了去除縮進(jìn)。
五、截?cái)辔谋?p>除了縮進(jìn)與截?cái)嘀猓覀冞€可以通過(guò)textwrap庫(kù)截?cái)辔谋具M(jìn)行操作。比如,我們常??吹侥承┵Y訊App簡(jiǎn)介會(huì)這樣寫(xiě)“某某什么什么等等[…]”描述,這就是截取某文開(kāi)頭文字形成的結(jié)果字符串,textwrap.shorten正好可以完整實(shí)現(xiàn),而且不會(huì)截?cái)嘤⑽摹?/p>import textwrapcontent = ''with open(’英文文檔.txt’, ’r’, encoding=’utf-8’) as f: content = f.read()print(textwrap.shorten(content, 100))
運(yùn)行之后,效果如下:
到此這篇關(guān)于Python格式化文本段落之textwrap庫(kù)的文章就介紹到這了,更多相關(guān)Python textwrap庫(kù)內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. 低版本IE正常運(yùn)行HTML5+CSS3網(wǎng)站的3種解決方案2. 利用CSS制作3D動(dòng)畫(huà)3. 使用Spry輕松將XML數(shù)據(jù)顯示到HTML頁(yè)的方法4. 測(cè)試模式 - XSL教程 - 55. html5手機(jī)觸屏touch事件介紹6. 用xslt+css讓RSS顯示的跟網(wǎng)頁(yè)一樣漂亮7. 《CSS3實(shí)戰(zhàn)》筆記--漸變?cè)O(shè)計(jì)(一)8. JSP的Cookie在登錄中的使用9. xpath簡(jiǎn)介_(kāi)動(dòng)力節(jié)點(diǎn)Java學(xué)院整理10. 讀大數(shù)據(jù)量的XML文件的讀取問(wèn)題
