Как преобразовать документ из Документов Google в текстовый файл
Как мне собрать весь текст в документе из Документов Google и преобразовать его в текстовый файл, желательно способом, который можно использовать в сценарии? Было бы wget
Работа? такие как:
wget https://docs.google.com/document/d/documentcode > googledoc.txt
Если да, смогу ли я использовать сокращенный URL?
2 ответа
Нет необходимости передавать в другую программу для преобразования файла. Вы можете скачать из Google Docs в любом поддерживаемом формате, используя существующие параметры в URL-адресе.
https://docs.google.com/document/d/FILE_ID/export?format=FORMAT
где:
FILE_ID
идентификатор строки целевого файла и;FORMAT
является формат файла выбора, т.е.txt
Затем загрузить документ из Документов Google в виде текстового файла просто, используя wget
или веб-браузер. Оба метода загрузят документ в виде текстового файла, как и ожидалось.
Я попробовал себя, и результат выглядит примерно так:
$ wget https://docs.google.com/document/d/FILE_ID/export?format=txt
--####-##-## ##:##:##-- https://docs.google.com/document/d/FILE_ID/export?format=txt
Resolving docs.google.com (docs.google.com)...
Connecting to docs.google.com (docs.google.com)... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/plain]
Saving to: ‘export?format=txt’
[ <=> ] 649 --.-K/s in 0s
####-##-## ##:##:## (##.# MB/s) - ‘export?format=txt’ saved [649]
URL-адрес для других продуктов, таких как Google Sheets, Google Presentation или даже Google Drive, будет немного другим.
С точки зрения документации, единственное соответствующее руководство, которое я нашел, было этим датированным сообщением в блоге приблизительно 2014. Эта страница руководства разработчика для Google Диска есть, но она бесполезна. Это все.
Загрузите Google Doc как текстовый документ с расширением.docx. Убедитесь, что у вас уже установлен пакет docxtxt. Затем выполните команду docx2txt, а затем укажите имя вашего файла. Например...
docx2txt report.docx