Текстовые файлы.srt на греческом языке не отображаются должным образом

Я использую Ubuntu 16.04, и когда я загружаю субтитры для фильмов, извлекаю конец zip-файла и пытаюсь открыть .srt файл с gedit я вижу только бред этой формы:

1 00:04:17,052 --> 00:04:18,963 ÊáëÞ ãç.
2 00:04:19,452 --> 00:04:20,851 ¹ôáí êÜðïôå.

Я попытался открыть файл с помощью jedit и LibreOffice Writer, но это тоже не сработало. В gedit вместо того, чтобы просто дважды щелкнуть файл, чтобы открыть его, я попытался сначала открыть gedit, а затем перейти к своему файлу, установив кодировку символов на греческий и текстовый язык на греческий, но это, похоже, не помогло,

Я также следовал инструкциям, которые я нашел в другом вопросе по подобному вопросу, но это не имело никакого значения вообще.
Я действительно не знаю, где проблема, в gedit или файле ролика. Еще более странно, что когда я работал 14.04, я помню, как следовал процедуре, которую я описал в начале, и все работало отлично.

Я относительно новичок в Linux, и я могу выполнять только базовые вещи, используя терминал. Буду признателен, если кто-нибудь сможет мне помочь.

3 ответа

У меня была такая же проблема, и я просто решил ее с помощью других. Открыв его прямо с gedit, LibreOffice или другие редакторы, и попытка сохранить его в другой кодировке не помогла. Причина в том, что они обычно кодируются в наборе Windows-1253, в то время как многие программы Linux автоматически определяют этот набор кодов как "западный".

Один из простых способов сделать это - сообщить каждой используемой программе, что это не "западный" кодовый набор. Для Gedit, вы можете сделать это, открыв Gedit в одиночку, перейдите к "Open file", выберите свой файл и в нижней части окна правильный "Character Encoding", который должен написать "Автоматически обнаружен" в этот момент и должен быть изменен на греческий кодовый набор для получения читаемого текста. Затем Gedit открывает файл в правильном наборе кодов. Для VLC, так как мы обсуждаем субтитры, единственное, что нужно сделать, это изменить кодировку субтитров по умолчанию на "Windows-1253", вы можете найти ее в "Preferences"/"Subtitles", Греческие буквы появляются нормально, даже если вы не можете правильно прочитать.srt в другом редакторе.

Другой и самый безопасный способ открыть читаемые греческие символы в текстовых файлах, которые были написаны на компьютерах с Windows, - сначала преобразовать их в UTF-8, что даст вам постоянное решение для конкретного файла. Способ сделать это через консоль с iconv инструмент:

iconv -f Windows-1253 -t UTF-8 input.txt > output.txt

Очевидно, что вы либо выполняете его из папки, в которой находится файл.txt, либо из любого другого места, но в этом случае задаете полный путь для input.txt и output.txt. В редких случаях исходная кодировка файла могла бы быть ISO-8859-7, что является еще одной греческой кодировкой, если Windows-1253 не работает, вы можете попробовать это тоже, заменив ее кодировкой "from", т.е.

iconv -f ISO-8859-7 -t UTF-8 input.txt > output.txt

Gaupol Software

  • Скачать программу Gaupol
  • скачать субтитры (не открывать субтитры)
  • открытый гауполь
  • перейдите к редактированию настроек.. файла и выберите Unicode (UTF-8)
  • открыть сабтиль в гауполе

https://ask-ubuntu.ru/images/e13a09bcae80d56b9da7007e061eda3ae42b0010.pn g

Здесь вам нужно решение gaupol, gaupol это программа редактирования субтитров, которая также используется для исправления неправильного отображения символов.

Сначала вы набираете в терминале: file -bi my_subtitle_track.srt

так что вы можете получить кодировку файла (может работать не всегда так, как ожидалось). Вы получите такой результат, как этот

text/plain; charset=iso-8859-1

Затем, после того как вы установили gaupol, запустите его и попробуйте открыть файл, используя результат кодирования, который вы получили выше. Если вы видите, что символы отображаются правильно, это означает, что вы открыли его с правильной кодировкой, и теперь вам нужно сохранить его как универсальную кодировку для совместимости. с другими программами. Выбрать File->Save As-> My_subs_track.srt с UTF-8 кодирование.

Работал на меня, надеюсь, это помогает:)

Другие вопросы по тегам