r - 从谷歌幻灯片中收集文本
问题描述
是否有人尝试使用 R 将一个文件夹内的谷歌幻灯片中的所有文本收集到一大块文本中?我们正在尝试理解过去几年我们所有演示文稿中使用的语言和信息。一旦我们收集了所有文本,我们想尝试使用它来产生未来的见解。
解决方案
解决此问题的最佳方法可能是将所有电源点下载为 pptx,然后遍历每个文件以读取每个 pptx。
您可以使用“officer”包阅读所有电源点并随时保存文本。
例子:
library(officer)
ppt_files = list.files(...\\ppt, pattern = ".ppt$", full.names = TRUE)
for (i in ppt_files){
ppt = pptx_summary(read_pptx(i))
### more code here
}
推荐阅读
- clickhouse - 如果右表已根据连接键排序,则部分合并连接行为
- javascript - 使用 socket.io 的 Javascript 聊天:我的代码不起作用,而老师的代码不起作用(看起来很相似)
- r - R / Tidyverse:面板数据在所有波中找到幸存的 ID
- python - 从 Confluence 获取 JSON 格式的表格
- python - Scipy 的 ivp 中的“无法解压不可迭代的浮点对象错误”
- bash - Bash if then 语句用于多个集群条件
- oracle - 如何在不使用 sqlplus 或 srvctl 的情况下在 oracle 中查找数据库名称?
- java - 供应商
通过透明代理请求 - rabbitmq - RabbitMQ 客户端 AMQP 操作被中断:AMQP close-reason
- html - 用户代理 StyleSheet 覆盖了我的文本颜色,扰乱了我的悬停效果