UNIX中的文件切割
UNIX的SHELL功能強(qiáng)大,非Windows可比,從上面使用的TAR、FTP已可管窺。同樣,UNIX已經(jīng)提供了文件切割功能,不需要費(fèi)力氣去尋找第三方的文件切割程序。能完成這個(gè)功能的UNIX命令就是DD。
要切割的大文件為DGJD,共98336321字節(jié),則:
dd if=dgjd of=zz1 bs=1 count=20000000 dd if=dgjd of=zz2 bs=1 count=20000000 skip=20000000 dd if=dgjd of=zz3 bs=1 count=20000000 skip=40000000 dd if=dgjd of=zz4 bs=1 count=20000000 skip=60000000 dd if=dgjd of=zz5 bs=1 count=18336321 skip=80000000
其中IF(INPUT FILENAME)是要切割的大文件名,OF(OUTPUT FILENAME)是切割后的子文件名,BS是指明以多少字節(jié)作為一個(gè)切割記錄單位,COUNT是要切割的單位記錄數(shù),SKIP是說明切割時(shí)的起點(diǎn),單位同樣以BS設(shè)定值為準(zhǔn)。通過上述五條指令就將DGJD大文件切割成為4個(gè)2千萬字節(jié)、1個(gè)18336321字節(jié)的子文件。要注意的是SKIP的值不能錯(cuò)。 由此也不難看出,DD切割是“非損耗”式的切割,并且支持從任意位置開始的任意大小的切割。
要將生成的ZZ1、ZZ2、ZZ3、ZZ4四個(gè)子文件組裝為XDGJD,則:
dd if=zz1 of=xdgjd bs=1 count=20000000 dd if=zz2 of=xdgjd bs=1 count=20000000 seek=20000000 dd if=zz3 of=xdgjd bs=1 count=20000000 seek=40000000 dd if=zz4 of=xdgjd bs=1 count=20000000 seek=60000000 dd if=zz5 of=xdgjd bs=1 count=18336321 seek=80000000
其中SKIP參數(shù)改為SEEK參數(shù),指明組裝的新大文件XDGJD每次的開始位置是從文件頭開始多少字節(jié)。如果缺省,則組裝從文件頭開始,顯然這不是我們每次都希望的, 所以需用SEEK參數(shù)明確指出開始位置。通過以上5個(gè)指令,即可將5個(gè)子文件重新組裝為一個(gè)大文件。
將切割后生成的子文件重新用FTP傳送,結(jié)果有的能夠順利傳送, 有的仍然導(dǎo)致網(wǎng)絡(luò)癱瘓,不怕,繼續(xù)切割,切成每個(gè)一千萬字節(jié),再傳,OK!成功傳送!
測試表明,每次傳送的文件最好小于12M字節(jié),否則可能導(dǎo)致網(wǎng)絡(luò)故障。另外,DD這個(gè)命令最初是為了進(jìn)行編碼轉(zhuǎn)換而設(shè)計(jì)的,用于在大型機(jī)中將EBCDIC字符代碼轉(zhuǎn)換為ASCII代碼,但此功能已不常用,現(xiàn)在DD成了文件系統(tǒng)備份的工具,以及做一些類似文件切割的“另類業(yè)務(wù)”,正所謂“有心栽花花不開,無心插柳柳成蔭”,不過對于用戶來說,重要的是軟件能否完成自己需要的功能,它的“本職工作”是什么并不重要,“不管白貓黑貓,捉住老鼠就是好貓”!實(shí)用為本,軟件的生命力就在于實(shí)用。
