Unix操作系統(tǒng)tar 問題解析
現(xiàn)在各家銀行的儲(chǔ)蓄、信用卡等計(jì)算機(jī)業(yè)務(wù)處理系統(tǒng)均運(yùn)行Unix操作系統(tǒng)平臺(tái)。電子化的發(fā)展拓展了銀行的業(yè)務(wù)領(lǐng)域,提高了工作效率,加強(qiáng)了業(yè)務(wù)的準(zhǔn)確性、保密性、安全性,樹立了銀行的社會(huì)形象,產(chǎn)生間接的經(jīng)濟(jì)效益。電子化銀行的發(fā)展對(duì)計(jì)算機(jī)數(shù)據(jù)的可靠性提出了更高的要求。
據(jù)筆者調(diào)查,在Unix操作系統(tǒng)上備份和恢復(fù)數(shù)據(jù)的控制程序決大多數(shù)是用tar命令實(shí)現(xiàn)的。tar命令具有使用簡(jiǎn)單好學(xué)易用的特點(diǎn)。但筆者在使用tar命令的過程中,發(fā)現(xiàn)tar命令對(duì)于中國(guó)用戶具有一個(gè)嚴(yán)重的隱患:對(duì)文件名為漢字且較長(zhǎng)的文件能夠歸檔打包,但不能解開該檔案包。
例如:
1?先創(chuàng)立一個(gè)長(zhǎng)漢字文件名文件:
# cat /etc/passwd 長(zhǎng)長(zhǎng)長(zhǎng)長(zhǎng)長(zhǎng)長(zhǎng)長(zhǎng)長(zhǎng)長(zhǎng)長(zhǎng)長(zhǎng)長(zhǎng)長(zhǎng)長(zhǎng)長(zhǎng)長(zhǎng)長(zhǎng)長(zhǎng)
2?將該文件歸檔至abc文件包:
3?解開或查看abc檔案包:
# tar xvf abc 或atr tvf abc
abc檔案包將不能解開或查看。
一、 剖析
Unix操作系統(tǒng)的tar命令產(chǎn)生的歸檔文件稱tar格式檔案文件,具有以下格式:
1?每個(gè)文件被加上了一個(gè)512字節(jié)的文件屬性頭,然后以512字節(jié)為單位塊在包中連續(xù)存放,占有整數(shù)個(gè)塊。***一個(gè)塊不能寫滿,其后用0x00填寫。
2?如文件長(zhǎng)度為零字節(jié)或是鏈接文件,則只有512字節(jié)的文件屬性頭。
3?用1024字節(jié)的0x00作為檔案文件尾。
4?文件屬性頭結(jié)構(gòu):
- char dummy [512];512字節(jié)文件屬性頭
- char name[100]; 100字節(jié)以內(nèi)文件名
- char mode [8]; 八進(jìn)制文件權(quán)限
- char uid[8]; 八進(jìn)制文件主人號(hào)
- char gid[8]; 八進(jìn)制文件組號(hào)
- char size[12]; 八進(jìn)制文件長(zhǎng)度
- char mtime[12]; 八進(jìn)制文件修改時(shí)間
- char chksum[8]; 八進(jìn)制屬性頭校驗(yàn)和
- char 1inkf1ag; 文件連接狀態(tài)
- char 1inkname[100]; 連接文件名
- char extno[4]; 連續(xù)卷分卷號(hào)
- char extota1[4]; 分卷個(gè)數(shù)
- char efsize[12]; 八進(jìn)制續(xù)分卷文件長(zhǎng)度
- char compid; 文件壓縮狀態(tài)
Unix操作系統(tǒng)文件屬性頭結(jié)構(gòu)中字節(jié)校驗(yàn)和chksum是頭結(jié)構(gòu)除chksum部分的字節(jié)和加八進(jìn)制數(shù)400加文件壓縮狀態(tài)值后轉(zhuǎn)換為八進(jìn)制得到的。文件壓縮狀態(tài)為‘1'時(shí)表示文件內(nèi)容處于壓縮狀態(tài),在解包時(shí),tar命令將自動(dòng)調(diào)用compress把文件內(nèi)容解壓縮,而不改變文件名。
筆者在分析一個(gè)含有長(zhǎng)漢字文件名的tar檔案文件時(shí)發(fā)現(xiàn):長(zhǎng)漢字文件名的屬性頭中chksum值是錯(cuò)誤的。經(jīng)分析發(fā)現(xiàn)造成這種錯(cuò)誤的原因是:一個(gè)漢字的字節(jié)和是負(fù)整數(shù),長(zhǎng)漢字文件名的屬性頭的字節(jié)和有可能為負(fù)整數(shù),Unix操作系統(tǒng)tar命令源程序由于為西文而未能判斷屬性頭字節(jié)和為負(fù)的情況。
在創(chuàng)立檔案文件時(shí),Unix操作系統(tǒng)tar命令用sprintf函數(shù)轉(zhuǎn)換屬性頭字節(jié)和為八進(jìn)制輸出到chksum,這時(shí)破壞了chksum正常格式。在打開檔案文件時(shí),tar命令用sscanf函數(shù)從屬性頭按八進(jìn)制格式化讀取chksum時(shí),不能得到正確數(shù)據(jù),tar命令將中止展開檔案文件。
二、 解決方法
從上面分析我們得出以下結(jié)論:1要解決問題必須修改tar源程序,充分考慮漢化Unix操作系統(tǒng)產(chǎn)生的tar檔案包文件屬性頭中字節(jié)校驗(yàn)和為負(fù)的情況。2編寫修補(bǔ)程序,將出錯(cuò)的tar檔案文件屬性頭中字節(jié)校驗(yàn)和chksum修復(fù)。
***種方法需得到Unix操作系統(tǒng)公司源程序級(jí)的技術(shù)支持或由Unix操作系統(tǒng)公司技術(shù)人員解決,這也是筆者對(duì)Unix操作系統(tǒng)公司的建議,我們只能期待。
第二種方法筆者進(jìn)行了有效的嘗試,并用c編寫了一個(gè)修補(bǔ)程序mtar.c,經(jīng)編譯成mtar運(yùn)行程序,本程序具有以下功能:
- A?mtar -v tarfi1e 修補(bǔ)任何原因造成的tar檔案包中文件的chksum錯(cuò)誤包括本程序的-c功能。
- B?mtar -t tarfi1e 查考tar檔案包中文件信息。
- C? mtar -c tarfi1e 加密tar檔案包,使tar命令不能打開該包。
- D? mtar -p tarfi1e 將包中的所有文件置壓縮狀態(tài)標(biāo)志。
- E? mtar -u tarfi1e 將包中所有文件置非壓縮狀態(tài)標(biāo)志。
這樣,我們就對(duì)Unix操作系統(tǒng)的tar的問題進(jìn)行了解析,并且提出了解決方法。希望能幫助大家解決tar的問題。
【編輯推薦】