Как преобразовать документ из Документов Google в текстовый файл

Как мне собрать весь текст в документе из Документов Google и преобразовать его в текстовый файл, желательно способом, который можно использовать в сценарии? Было бы wget Работа? такие как:

wget https://docs.google.com/document/d/documentcode > googledoc.txt

Если да, смогу ли я использовать сокращенный URL?

2 ответа

Нет необходимости передавать в другую программу для преобразования файла. Вы можете скачать из Google Docs в любом поддерживаемом формате, используя существующие параметры в URL-адресе.

https://docs.google.com/document/d/FILE_ID/export?format=FORMAT

где:

  • FILE_ID идентификатор строки целевого файла и;
  • FORMAT является формат файла выбора, т.е. txt

Затем загрузить документ из Документов Google в виде текстового файла просто, используя wget или веб-браузер. Оба метода загрузят документ в виде текстового файла, как и ожидалось.

Я попробовал себя, и результат выглядит примерно так:

$ wget https://docs.google.com/document/d/FILE_ID/export?format=txt
--####-##-## ##:##:##--  https://docs.google.com/document/d/FILE_ID/export?format=txt
Resolving docs.google.com (docs.google.com)...
Connecting to docs.google.com (docs.google.com)... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/plain]
Saving to: ‘export?format=txt’

    [ <=>                                    ] 649         --.-K/s   in 0s      

####-##-## ##:##:## (##.# MB/s) - ‘export?format=txt’ saved [649]

URL-адрес для других продуктов, таких как Google Sheets, Google Presentation или даже Google Drive, будет немного другим.

С точки зрения документации, единственное соответствующее руководство, которое я нашел, было этим датированным сообщением в блоге приблизительно 2014. Эта страница руководства разработчика для Google Диска есть, но она бесполезна. Это все.

Загрузите Google Doc как текстовый документ с расширением.docx. Убедитесь, что у вас уже установлен пакет docxtxt. Затем выполните команду docx2txt, а затем укажите имя вашего файла. Например...

docx2txt report.docx

Другие вопросы по тегам