Как я могу извлечь данные из поврежденного файла.docx?
Файл.docx моей подруги поврежден, и я пытаюсь восстановить текст из него. Я узнал, что.docx - это, по сути, zip-файл, содержащий папки и набор XML-файлов (и один из них содержит текст документа). Я следую команду на Ubuntu 10.10, чтобы распаковать архив:
unzip portfolio.docx -d file-dir
Результат, который я получил:
End-of-central-directory signature not found. Either this file is not a zipfile, or it constitutes one disk of multi-part archive. In the latter case the central directory and zipfile comment will be found on the last disk(s) of this archieve.
unzip: cannot find zipfile directory in one of portfolio.docx or portfolio.docx.zip, and cannot find portfolio.docx.ZIP, period.
На Windows 8.1 я пробовал WinZip, 7zip, WinRar и Zip2Fix, но безуспешно.
Файл весит почти 20 КБ, поэтому я знаю, что внутри есть какой-то контент. Есть ли способ разархивировать?
1 ответ
Запустите это:
cp portfolio.docx portfolio.zip
Или просто переименовать portfolio.docx
в portfolio.zip
, и вы должны быть в состоянии открыть результирующий portfolio.zip
файл с диспетчером архивов, и распакуйте их.
Изменить: я только что провел быструю проверку, файлы, вероятно, будут в word/document.xml
или же docProps/core.xml
в извлеченной папке.
Другое редактирование: если полученный ZIP-файл поврежден, посмотрите здесь.