Как я могу избежать испорченных языков при разархивировании файлов Unicode?

Question

Как я могу избежать испорченных языков при разархивировании файлов Unicode?

Часто бывает, что я вижу неизвестные имена файлов при распаковке zip-файлов.

Например,

 ╕╢╣¤└╟╝║-Bb└╠┴╢╛╟▒т┐ы-┼м╢є╕о│▌,┼╫│╩╗Ў╝╥╞∙ ╝╥╟┴╢є│ы╗Ў╝╥╞∙ ,╞о╖│╞ъ

Что может быть решением проблемы?

6

unicode unzip

Источник

Taeyeon 09 май '15 в 02:23

5 ответов

Другие вопросы по тегам unicode unzip

user.dz 27 май '15 в 08:18 2015-05-27 08:18 · Answer 1 · 2015-05-27 08:18

Для архивирования оригинальных файлов может использоваться корейская кодировка MS Windows cp-949. Пытаться unzip с опцией кодировки Windows.

unzip -O cp-949 <file.zip>

Примечание: я проверил профиль оригинального плаката, чтобы узнать, где он / она (Сеул, Южная Корея). Для других пользователей вы должны проверить происхождение zip и изменить кодировку соответственно.

wisbucky 10 мар '16 в 22:39 2016-03-10 22:39 · Answer 2 · 2016-03-10 22:39

Попробуйте использовать p7zip. (@Pilot6 упомянул, что p7zip не работает хорошо для кодировок, отличных от UTF-8, но если вам нужна только UTF-8, это простое решение.)

apt-get update
apt-get install p7zip-full
7z x thefile.zip -o"outputDir"

7

Источник

wisbucky 10 мар '16 в 22:39

Pilot6 10 май '15 в 08:56 2015-05-10 08:56 · Answer 3 · 2015-05-10 08:56

Если вы используете стандартный Ubuntu Archive Manager и Ubuntu версии 14.04+, это можно решить, установив исправленный Archive Manager (файл-ролик). Проблема в том, что file-roller использует p7zip для распаковки zip-архивов, если установлен p7zip-full. Но p7zip плохо справляется с кодировками не-UTF-8. Я исправил файл-ролик, чтобы всегда использовать unzip для этой цели. Сам распаковать был исправлен. Запатченный файл-ролик можно установить с моего ppa

sudo add-apt-repository ppa:hanipouspilot/file-roller
sudo apt-get update
sudo apt-get install file-roller

DWads 07 сен '17 в 06:17 2017-09-07 06:17 · Answer 4 · 2017-09-07 06:17

miniunzip в пакете minizip также, кажется, хорошо работает с именами не-ascii

0

Источник

DWads 07 сен '17 в 06:17

Paul Chen 29 май '21 в 09:14 2021-05-29 09:14 · Answer 5 · 2021-05-29 09:14

Мне удалось двумя способами:

      unzip -O cp936 file.zip
unzip -O GBK file.zip

0

Источник

Paul Chen 29 май '21 в 09:14