Как правильно читать файлы в кодировке ANSI?

У меня есть некоторые файлы, которые Ubuntu не может прочитать (кодировка ANSI), но Windows может прочитать это хорошо.

Когда я открываю его в gedit или notepad++, это выглядит так:

Çã ÇáÊÍæíá áÜÜ

Как я могу заставить Ubuntu хорошо читать файлы, закодированные в формате ANSI?

4 ответа

Решение

ANSI означает более или менее ничего - наиболее вероятным кандидатом для вашей кодировки является Windows-1252. Вы можете конвертировать файл с

iconv -f WINDOWS-1252 -t utf8 < filein.txt > fileout.txt

но помните, что большинство кодировок (прочитайте связанную статью, если вы не уверены, что это значит) не могут быть надежно угаданы, поэтому вам необходимо знать точную кодировку, чтобы придать смысл вашим данным.

Из комментариев кажется, что вы, скорее всего, ищете какую-то арабскую кодировку --- в этом случае проверьте WINDOWS-1256,

Список доступных кодировок для iconv находится на GitHub, или вы можете найти его с помощью команды

iconv --list 

Обратите внимание, что в начале списка есть несколько кодировок, похожих на ANSI.

Если вы не хотите конвертировать его, как указано в ответе Rmano, вы можете использовать Geany или Kate для их чтения / редактирования, если они есть, по умолчанию арабская кодировка в Windows - CP-1256 (WINDOWS-1256). Просто имейте в виду, что переход на UTF-8 рекомендуется для всех. Он поддерживается Notepad++ и редактором заметок Windows по умолчанию.

Geany

sudo apt-get install geany

Geany кодирование

Кейт

sudo apt-get install kate

кодирование кейт

Gedit может работать с файлами, закодированными, например, с помощью Windows-1250. Выберите "Открыть", "Дополнительные документы", Кодировка символов: "Центральноевропейская (WINDOWS-1250"). Если его там нет, добавьте его с помощью этой опции.

Я пытался прочитать файл в режиме ANSI в Ubuntu и смог это сделать.

Я попробовал возвышенный текст, gedit и т. Д., Но у меня почему-то не получилось, наконец-то я попробовал терминал в Ubuntu, и команда cat помогла мне.

Я открыл терминал в расположении файла, затем использовал

cat filename.txt

И это сработало как талисман, если текстовый файл содержит синтаксис ANSI, он будет отображаться правильно.

Надеюсь, поможет.

Другие вопросы по тегам