linux下zip文件解壓亂碼問(wèn)題的解決辦法分享

本篇文章主要介紹了解決linuxlinux文件解壓linux,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下。

原因

由于zip格式并沒(méi)有指定編碼格式,windows下生成的zip文件中的編碼是GBK/GB2312等,因此,導(dǎo)致這些zip文件在Linux下解壓時(shí)出現(xiàn)亂碼問(wèn)題,因?yàn)長(zhǎng)inux下的默認(rèn)編碼是UTF8。

解決方案一

使用7z解壓。

linuxp7zip和convmv

#?fedora  $?su?-c?'yum?install?p7zip?convmv'  #?ubuntu  $?sudo?apt-get?install?p7zip?convmv

執(zhí)行一下命令解壓縮

#?使用7z解壓縮  $?LANG=C?7za?x?your-zip-file.zip  #?遞歸轉(zhuǎn)碼  $?convmv?-f?GBK?-t?utf8?--notest?-r?.

解決方案二

在windows上壓縮的文件,是以系統(tǒng)默認(rèn)編碼中文來(lái)壓縮文件。由于zip文件中沒(méi)有聲明其編碼,所以linux上的unzip一般以默認(rèn)編碼解壓,中文文件名會(huì)出現(xiàn)亂碼。

雖然2005年就有人把這報(bào)告為bug, 但是info-zip的官方網(wǎng)站沒(méi)有把自動(dòng)識(shí)別編碼列入計(jì)劃,可能他們不認(rèn)為這是個(gè)問(wèn)題。Sun對(duì)java中存在N年的zip編碼問(wèn)題,采用了同樣的處理方式。

有2種方式解決問(wèn)題:

1. 通過(guò)unzip行命令解壓,指定linux

unzip -O CP936 xxx.zip (用GBK, GB18030也可以)

有趣的是unzip的manual中并無(wú)這個(gè)選項(xiàng)的說(shuō)明, unzip –help對(duì)這個(gè)參數(shù)有一行簡(jiǎn)單的說(shuō)明。

2. 在環(huán)境linux中,指定unzip參數(shù),總是以指定的字符集顯示和解壓文件

/etc/environment中加入2行

UNZIP="-O?CP936"  ZIPINFO="-O?CP936"

這樣Gnome桌面的歸檔文件管理器(file-roller)可以正常使用unzip解壓中文,但是file-roller本身并不能設(shè)置編碼傳遞給unzip。

? 版權(quán)聲明
THE END
喜歡就支持一下吧
點(diǎn)贊7 分享