Как я могу извлечь данные из поврежденного файла.docx?

Файл.docx моей подруги поврежден, и я пытаюсь восстановить текст из него. Я узнал, что.docx - это, по сути, zip-файл, содержащий папки и набор XML-файлов (и один из них содержит текст документа). Я следую команду на Ubuntu 10.10, чтобы распаковать архив:

unzip portfolio.docx -d file-dir

Результат, который я получил:

End-of-central-directory signature not found. Either this file is not a zipfile, or it constitutes one disk of multi-part archive. In the latter case the central directory and zipfile comment will be found on the last disk(s) of this archieve.
unzip: cannot find zipfile directory in one of portfolio.docx or portfolio.docx.zip, and cannot find portfolio.docx.ZIP, period.

На Windows 8.1 я пробовал WinZip, 7zip, WinRar и Zip2Fix, но безуспешно.

Файл весит почти 20 КБ, поэтому я знаю, что внутри есть какой-то контент. Есть ли способ разархивировать?

1 ответ

Запустите это:

cp portfolio.docx portfolio.zip

Или просто переименовать portfolio.docx в portfolio.zip, и вы должны быть в состоянии открыть результирующий portfolio.zip файл с диспетчером архивов, и распакуйте их.

Изменить: я только что провел быструю проверку, файлы, вероятно, будут в word/document.xml или же docProps/core.xml в извлеченной папке.

Другое редактирование: если полученный ZIP-файл поврежден, посмотрите здесь.

Другие вопросы по тегам