UTF-8 是一種用於存儲 Unicode 的標準字元編碼方法,該方法用於顯示各種語言。
由於 Unicode 和 UTF-8 是在20世紀90年代之後開發的,ZIP格式的初始版本(於20世紀80年代製造)不支持UTF-8。 然而,隨著ZIP格式成為標準存檔格式,並且需要支持Unicode,人們引入了幾種方法來處理ZIP檔案上的 UTF-8 字串。
Bandizip 支持其中兩個方式;一種方式是將檔名轉換為UTF-8,另一種方式是將額外的UTF-8檔名存儲在額外的頭欄位中,同時將原始檔名存儲在MBCS中。
Bandizip 會將檔名存儲在ZIP檔案中,並將其轉換為UTF-8。 這是 APPNOTE 定義的一種標準檔名存儲方法,但有些檔案管理員有時無法識別ZIP檔案或處理不當,將導致檔名損壞。 APPNOTE
Bandizip 將額外的UTF-8檔名存儲在ZIP格式的額外頭欄位中,而同時將原始檔名存儲在MBCS中。 APPNOTE還將此方法定義為“Info ZIP Unicode路徑額外欄位” 因為它使用額外的欄位來存儲UTF-8檔名,所以文件大小將比以前的檔案大幾十位元組。 但是,原始檔名存儲在MBCS中,囙此檔案更安全、更相容。
由於大多數歸檔軟體(譬如 7-zip、Winrar 和 Winzip 著些軟體)都支持此功能,囙此它可以防止您的檔名在使用不同系統語言的作業系統中被破壞。
下圖顯示了將韓國作業系統上壓縮的ZIP檔案發送到日本語作業系統時使用該功能與不使用該功能的區別。
TAR和TGZ格式是主要在Unix上使用的歸檔格式(使用UTF-8檔名)。此功能使您可以在Unix上選取TAR/TGZ檔案,而不會出現檔名問題。
注:某些Windows應用程序可能無法正確識別TAR/TGZ格式的UTF-8內碼表。