google-api - 从 Google 文档中提取文本并获取特定页面
问题描述
截至目前,我通过从此链接获取内容来导出我的 Google 文档:
https://docs.google.com/feeds/download/documents/export/Exportid=DOCUMENT_ID&exportFormat=EXPORT_FORMAT
这很好用,事实上我将我的文档导出为 HTML 格式,然后我从中读取,但是没有办法知道页面何时开始或结束。
这是我知道的所有导出格式:
HTML、PDF、ODT、TXT、RTF 和 DOCX
PDF、ODT、RTF 和 DOCX在渲染器中打开时都表示单独的页面。然而,在为所有格式(python-docx、PyPDF4、PyRTF 等)搜索无数 API 之后,我一直无法找到一种工作方式来逐页阅读 Google 文档。
有什么建议么?
解决方案
您可以将Apps Script与它一起使用,您可以利用DocumentApp获得PageBreaks。
然后,您可以将定制的内容作为Web 应用程序提供。
推荐阅读
- amazon-web-services - 停止和启动该实例后,如何在 AWS 实例中重新启动我的 minikube kubernetes 集群?
- r - 重采样和合并数据集
- python - 如何正确地向 cnn 表示井字游戏?
- html - 引导链接不适用于按钮
- mysql - 关闭 MySQL 连接
- entity-framework - 我们怎样才能最小化下面的查询?
- java - Java邮件使用gmail作为主机但不是godaddy
- javascript - d3.v3 带有可折叠框的水平树结构
- git - 我需要澄清 git local 和 git remote
- solr - Solr 查询以根据查询维护术语的响应顺序