Как правильно читать файлы в кодировке ANSI?
У меня есть некоторые файлы, которые Ubuntu не может прочитать (кодировка ANSI), но Windows может прочитать это хорошо.
Когда я открываю его в gedit или notepad++, это выглядит так:
Çã ÇáÊÍæíá áÜÜ
Как я могу заставить Ubuntu хорошо читать файлы, закодированные в формате ANSI?
4 ответа
ANSI означает более или менее ничего - наиболее вероятным кандидатом для вашей кодировки является Windows-1252. Вы можете конвертировать файл с
iconv -f WINDOWS-1252 -t utf8 < filein.txt > fileout.txt
но помните, что большинство кодировок (прочитайте связанную статью, если вы не уверены, что это значит) не могут быть надежно угаданы, поэтому вам необходимо знать точную кодировку, чтобы придать смысл вашим данным.
Из комментариев кажется, что вы, скорее всего, ищете какую-то арабскую кодировку --- в этом случае проверьте WINDOWS-1256
,
Список доступных кодировок для iconv
находится на GitHub, или вы можете найти его с помощью команды
iconv --list
Обратите внимание, что в начале списка есть несколько кодировок, похожих на ANSI.
Если вы не хотите конвертировать его, как указано в ответе Rmano, вы можете использовать Geany или Kate для их чтения / редактирования, если они есть, по умолчанию арабская кодировка в Windows - CP-1256 (WINDOWS-1256
). Просто имейте в виду, что переход на UTF-8 рекомендуется для всех. Он поддерживается Notepad++ и редактором заметок Windows по умолчанию.
Geany
sudo apt-get install geany
Кейт
sudo apt-get install kate
Gedit может работать с файлами, закодированными, например, с помощью Windows-1250. Выберите "Открыть", "Дополнительные документы", Кодировка символов: "Центральноевропейская (WINDOWS-1250"). Если его там нет, добавьте его с помощью этой опции.
Я пытался прочитать файл в режиме ANSI в Ubuntu и смог это сделать.
Я попробовал возвышенный текст, gedit и т. Д., Но у меня почему-то не получилось, наконец-то я попробовал терминал в Ubuntu, и команда cat помогла мне.
Я открыл терминал в расположении файла, затем использовал
cat filename.txt
И это сработало как талисман, если текстовый файл содержит синтаксис ANSI, он будет отображаться правильно.
Надеюсь, поможет.